无人机路径规划与防晒新方案:应对不同挑战的创新探索
无人机基于深度强化学习的路径规划
在无人机应用日益广泛的今天,路径规划是其实现各种任务的关键技术。基于深度强化学习的无人机路径规划方法,为解决复杂环境下的路径规划问题提供了新的思路。
在室内环境测试中,通过记录无人机到达目标点的次数和碰撞次数来评估其路径规划能力。若无人机发生碰撞或停止,则开始下一次测试。以下是Gazebo动态避障测试结果:
| 测试组 | 目标点位置 | 到达目标点次数 | 碰撞次数 | 成功率 |
| — | — | — | — | — |
| 测试组1 | (2, 0, 0) | 76 | 24 | 0.76 |
| 测试组2 | (-2, -2, 2) | 64 | 36 | 0.64 |
为了更好地验证改进的DQN算法在无人机路径规划中的性能,在室内模拟环境中进行了改进DQN路径规划实验,并与传统DQN算法进行对比。实验设计了100轮测试,每轮测试以无人机初始化开始,以到达目标点结束。目标点放置在无人机50步可到达的范围内,且在一定范围内随机出现。选择损失变化和平均路径长度作为比较标准。
经典DQN算法的奖励函数为:
$R = R_a + R_d \cos \theta + R_c + R_s$
其中,$R_a$为目标奖励,$R_d$为方向奖励,$R_c$为碰撞惩罚,$R_s$为步数惩罚。
根据无人机到达目标点的情况计算路径规划成功率,结果如下:
| 算法 | 目标位置 | 到达目标点次数 | 碰撞频率 | 平均路径长度 | 超过最大轮数 | 成功率 |
| — | — | — | —
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



