胰岛素输送系统训练与非线性动力系统线性化研究
1. 凸块奖励函数在胰岛素输送系统训练中的有效性
在胰岛素输送系统训练里,有一个表达式:
[
\lambda_{-} \cdot \left(\int \frac{1}{x - \hat{x}} \cdot f(x) dx - \tilde{r} {-}\right) + \lambda {+} \cdot \left(\int \frac{1}{ \check{x} - x} \cdot f(x) dx - \tilde{r} {+}\right)
]
将其导数设为 0 后,能得到:
[
\ln(f(x)) = -1 + \lambda_1 + \frac{\lambda {-}}{x - \hat{x}} + \frac{\lambda_{+}}{ \check{x} - x}
]
这里的 $\lambda_{-}$ 体现了期望区间左端点的重要性,$\lambda_{+}$ 体现了右端点的不确定性。由于两个端点都很关键,超出任意一个端点都可能危及生命,并且没有理由认为一个端点比另一个更重要,依据拉普拉斯不确定性原理,可假定 $\lambda_{-} = \lambda_{+}$。此时,上述公式变为:
[
\ln(f(x)) = const + \frac{const}{(x - \hat{x}) \cdot ( \check{x} - x)}
]
这样就得到了概率值 $f(x)$ 的凸块函数表达式,从而解释了凸块奖励函数的有效性,该函数是从第一性原理自然推导出来的。
超级会员免费看
订阅专栏 解锁全文
49

被折叠的 条评论
为什么被折叠?



