模糊动态规划与机器人研究中的内生构型空间方法
模糊动态规划相关内容
模糊动态规划在处理具有不精确和不确定信息的多阶段控制问题中发挥着重要作用。
静态策略与性质
假设 $w(h_t) \in W = {y_1, \ldots, y_q}$,其中 $W$ 是 $w(h_t)$ 不同取值的集合。若对于所有满足 $w(h_t) = w(h_{t’})$ 的 $h_t$ 和 $h_{t’}$,都有 $a_t(h_t) = a_{t’}(h_{t’})$,则策略 $A = (a_0, a_1, \ldots)$ 被称为静态策略,记为 $a_{\infty} = (a, a, \ldots)$。对于每个静态策略 $a_{\infty}$,若 $w(h_t) = w(h_{t’})$,则有 $v(h_t, a_{\infty}) = v(h_{t’}, a_{\infty})$ 且 $f (h_t) = f (h_{t’})$。
这意味着存在静态保守策略,并且通过(单步)改进可以得到越来越好的策略。最优静态策略可以从策略改进得到的等效策略中寻找,即从非改进策略中寻找。这一结果引出了一种用于解决所考虑问题的(次)最优策略迭代类型的算法,该算法能得到符合特定意义(如公式 (65))的非改进策略,最优策略就在其中。若非改进策略数量不多,可通过穷举搜索找到最优策略;否则,应采用一些启发式搜索方法。
模糊动态规划的应用
模糊动态规划在解决各种“软”问题方面有诸多实际应用,具体如下:
|应用领域|具体说明|
| ---- | ---- |
|社会经济区域发展|例如相关研究中对区域发展的规划和决策支持|
超级会员免费看
订阅专栏 解锁全文
1166

被折叠的 条评论
为什么被折叠?



