强化学习探索:热门贪吃蛇游戏的案例研究
1. 引言
1.1 目标与目的
为了深入了解适用于贪吃蛇游戏的高效强化学习技术,我们计划实施并比较多种著名算法在智能体行为方面的表现。具体通过以下目标达成理解:
1. 实现一个与原版贪吃蛇游戏类似,但经过调整以便人工智能智能体能够接管并进行游戏的版本。
2. 引入如 A* 寻路等人工智能技术,并评估该技术的有效性。
3. 分析 Q 学习算法,并评估其在不同奖励机制下的性能。
4. 实现强化算法 SARSA,并评估其在不同超参数和奖励机制下的性能。
5. 利用 ML - Agents 实现 PPO 算法,并分析该算法的不同应用方式。
6. 比较所产生的结果,从实施和评估的算法中找出最佳的强化学习技术。
1.2 贪吃蛇游戏
贪吃蛇游戏最初于 1976 年由 Gremlin Industries 开发,名为“Blockade”,因在诺基亚 3310 手机上发布而广为人知。游戏目标是尽可能多地吃食物,同时避免与边界或自身发生碰撞。每吃一个食物,蛇的长度就会增加。游戏的变体包括蛇越长速度越快,或者蛇能够穿过边界并从游戏屏幕的另一侧出现。
1.3 游戏机制
与原版类似,这是一个单人游戏。玩家需要尽可能多地吃食物,同时避免撞到边界或自己的身体。碰撞会导致游戏结束。游戏会记录吃掉的食物数量作为得分。游戏没有终止条件,只有在发生碰撞时才会结束。
- 移动 :游戏开始时,蛇在屏幕中央初始化并向下移动。玩家可以使用键盘的箭头键或 WASD 键向四个方向移动。蛇的移动是通过将头部移动到新
超级会员免费看
订阅专栏 解锁全文
995

被折叠的 条评论
为什么被折叠?



