8、强化学习模拟与自动驾驶汽车环境搭建

强化学习模拟与自动驾驶汽车环境搭建

在强化学习模拟中,我们可以通过设置负奖励来激励智能体优化行动。负奖励能促使智能体节约移动步数,尽可能少地移动以最大化奖励并达成目标。在继续之前,务必保存好代码。

环境设置

在Unity编辑器中,我们需要进行一些环境搭建的管理工作。
1. 创建墙壁容器
- 右键点击Hierarchy视图,选择Create Empty,将空的GameObject重命名为“Walls”。
- 选中所有四面墙(可按住Shift键逐个点击,或点击第一个后按住Shift再点击最后一个),将它们拖到新的墙壁对象下。
2. 创建环境容器
- 右键点击Hierarchy视图,选择Create Empty,将空的GameObject重命名为“Environment”。
- 在Hierarchy视图中,将刚创建的墙壁对象、智能体、地板、方块和目标拖到新的环境对象中。
3. 配置智能体
- 在Hierarchy视图中选择智能体,在Inspector视图中向下滚动到添加的脚本,将Hierarchy视图中的地板对象拖到Inspector的Floor插槽中。
- 对整体环境GameObject、目标和方块执行相同操作,并在编辑器中将Max Steps设置为5000,防止智能体花费过长时间将方块推到目标位置。
- 使用Inspector中智能体的Add Component按钮,添加DecisionRequester脚本,并将其Decision Period设置为5。
- 添加两个Ray Pe

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值