深度强化学习:DQN改进与策略梯度方法探索
1. DQN与Rainbow在吃豆人游戏中的表现
在吃豆人游戏中,DQN和Rainbow智能体都能出色地完成躲避幽灵、收集豆子以及使用传送门的任务。从图中展示的完整游戏情节来看,Rainbow智能体总体表现优于DQN智能体。Rainbow智能体还学会了寻找能量豆来吃掉幽灵,并且几乎能完成第一关,若给予更多训练时间,它有很大可能完成。不过,两个智能体都还未学会吃水果获取额外分数,也未学会在吃掉能量豆后主动追捕幽灵。
| 智能体 | 躲避幽灵 | 收集豆子 | 利用传送门 | 寻找能量豆 | 完成关卡 | 吃水果 | 追捕幽灵 |
|---|---|---|---|---|---|---|---|
| DQN | 是 | 是 | 是 | 否 | 否 | 否 | 否 |
| Rainbow | 是 | 是 | 是 | 是 | 接近完成 | 否 | 否 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



