38、多阶段模糊控制:有限与无限终止时间下的策略求解

多阶段模糊控制:有限与无限终止时间下的策略求解

在控制理论的领域中,多阶段模糊控制是一个重要的研究方向,它涉及到在不同条件下寻找最优控制策略。本文将深入探讨随机系统和确定性系统在有限和无限终止时间下的多阶段模糊控制问题。

随机系统的控制

随机系统的控制问题通常基于马尔可夫链,其状态转移由条件概率 $p(x_{t + 1} | x_t, u_t)$ 决定,其中 $t = 0, 1, …$。在这种情况下,模糊决策 $\mu_D(u_0, …, u_{N - 1} | x_0)$ 是一个随机变量。目前已知有两种基本的控制问题表述方式:

  • Bellman 和 Zadeh 的表述 :寻找最优控制序列 $u_0^ , …, u_{N - 1}^ $,使得在满足模糊约束的条件下,达到模糊目标的概率最大化,即:
    [
    \mu_D(u_0^ , …, u_{N - 1}^ | x_0) = \max_{u_0, …, u_{N - 1}}[\mu_{C0}(u_0) \land … \land \mu_{C_{N - 1}}(u_{N - 1}) \land E\mu_{G_N}(x_N)]
    ]
    其中,$E\mu_{G_N}(x_N)$ 是给定 $x_{N - 1}$ 和 $u_{N - 1}$ 时,模糊目标事件的条件概率,计算公式为:
    [
    E\mu_{G_N}(x_N) = E\mu_{G_N}(x_N | x_{N - 1}, u_{N - 1}) = \sum_{x_N \in X} p(x_N | x_{N - 1}, u_{N -

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值