14、深度强化学习：DQN改进与策略梯度方法探索

prometheus9mon

于 2025-08-04 14:10:56 发布

阅读量33

点赞数

CC 4.0 BY-SA版权

分类专栏：强化学习重塑工业智能文章标签：深度强化学习 DQN Rainbow

本文链接：https://blog.youkuaiyun.com/prometheus9mon/article/details/151054218

强化学习重塑工业智能专栏收录该内容

42 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深度强化学习：DQN改进与策略梯度方法探索

1. DQN与Rainbow在吃豆人游戏中的表现

在吃豆人游戏中，DQN和Rainbow智能体都能出色地完成躲避幽灵、收集豆子以及使用传送门的任务。从图中展示的完整游戏情节来看，Rainbow智能体总体表现优于DQN智能体。Rainbow智能体还学会了寻找能量豆来吃掉幽灵，并且几乎能完成第一关，若给予更多训练时间，它有很大可能完成。不过，两个智能体都还未学会吃水果获取额外分数，也未学会在吃掉能量豆后主动追捕幽灵。