水下仿生滑翔机器人路径规划与跟踪控制
1. 奖励机制与问题提出
在水下仿生滑翔机器人的研究中,奖励机制是引导机器人行为的重要因素。其中,奖励 $r_5$ 和 $r_6$ 的定义如下:
- $r_5 \sim \frac{C_{wall}}{\alpha}$,当机器人越过地图边界时,$C_{wall}$ 可设为正常数,否则为 0。
- $r_6 \sim \frac{C_{goal}}{\beta}$,当机器人进入目标点的阈值圆时,$C_{goal}$ 赋予一个大的正奖励,否则为 0。
2. 路径跟踪控制问题
2.1 问题建模与LOS定律
对于水平面上的水下滑翔机器人路径跟踪问题,其运动学方程可表示为:
$\begin{cases}
\dot{x} = u \cos\psi - v \sin\psi \
\dot{y} = u \sin\psi + v \cos\psi \
\dot{\psi} = r
\end{cases}$
其中,$(x, y, \psi)$ 分别表示相对于惯性系的实时位置和偏航角,$(u, v, r)$ 分别表示相对于机体坐标系的线速度和角速度。
动力学模型可推导为:
$\begin{cases}
\dot{u} = \frac{1}{m_{11}}(\tau_u - m_{22}vr - d_{11}\dot{u}) \
\dot{v} = \frac{1}{m_{22}}(\tau_v + m_{11}ur - d_{22}\dot{v}) \
\dot{r} = \frac{1}{m_{
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



