先进控制与图像处理技术:从平流层飞艇到低剂量 CT 图像
平流层飞艇的强化学习跟踪控制
在平流层飞艇的控制领域,为了应对外部干扰并实现精确的轨迹跟踪,研究人员设计了一种结合神经网络的强化学习(RL)自适应跟踪控制方法。
通过一系列的数学推导,结合不等式 $−\tilde{\eta}\hat{\eta} \leq \frac{1}{2}\eta^2 - \frac{1}{2} \tilde{\eta}^2$ 和 $0 < |\phi_S|/ (|\phi_S|+ \varepsilon_s) < 1$,得到:
$\dot{V} \leq -k_{x_Sx} |e_f| - \frac{1}{2}L_1 |\tilde{W} a|^2 - \frac{1}{2}L_1 |\tilde{W}_c|^2 - \frac{1}{2}L_3\tilde{\eta}^2 + \Phi$
其中 $\Phi = \frac{1}{2}L_1 |W_a|^2 + \frac{1}{2}L_2 |W_c|^2 + \frac{1}{2}L_3\eta^2 + k {x_Sx}m_{\tau_q}x + \eta\varepsilon_s$。
当满足条件 $|e_f| > \frac{\Phi}{k_{x_Sx}}$ 或 $|\tilde{W}_a| > \sqrt{\frac{2\Phi}{L_1}}$ 或 $|\tilde{W}_c| > \sqrt{\frac{2\Phi}{L_2}}$ 或 $\tilde{\eta} > \sqrt{\frac{2\Phi}{L_3}}$ 时,$\dot{V} < 0$。这表明跟
超级会员免费看
订阅专栏 解锁全文
668

被折叠的 条评论
为什么被折叠?



