37. BI - 强化学习案例:自动完成游戏 Flappy Bird

本文为 「茶桁的 AI 秘籍 - BI 篇 第 37 篇」


茶桁的AI秘籍_核心BI_37

Hi, 你好。我是茶桁。

几天不见,大家还记得咱们上一节课的内容吗?我们上一节课讲了强化学习的一些概念也原理,并且完成了一个简单的案例:迷宫问题。

那我们这一节课就来完成一个稍微复杂一点的案例,一起来看一看 Flappy Bird 该如何去学习。

截屏 2024-02-28 17.30.11

现在来一起思考一下,这个状态比咱们上一个案例多还是少?我们现在用的 Flappy Bird 是一个游戏,所以游戏就需要一个模拟的环境。我所使用的是 PyGame-Learning-Environment 库,缩写为 PLE。

如何安装 PLE 环境

之所以用这个环境是因为环境可以告诉我们这个小鸟所在的位置,水管出现的位置。就没有必要自己去搭建这个环境了,只需要在环境中得到更高的分数。PLE 的存在就是让我们不需要考虑仿真环境,因为它专门搭建的是一个 armage。你的决策就是如何去训练这个 AI。在 PLE 里面也有很多的游戏,除了Flappy Bird以外其他游戏也可以去做一些训练。包括:Catecher、Monster Kong、Pixelcopter、Pong、PuckWorld、RaycastM

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

茶桁

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值