强化学习模拟与自动驾驶汽车环境搭建
在强化学习模拟中,我们可以通过设置负奖励来激励智能体优化行动。负奖励能促使智能体节约移动步数,尽可能少地移动以最大化奖励并达成目标。在继续之前,务必保存好代码。
环境设置
在Unity编辑器中,我们需要进行一些环境搭建的管理工作。
1. 创建墙壁容器
- 右键点击Hierarchy视图,选择Create Empty,将空的GameObject重命名为“Walls”。
- 选中所有四面墙(可按住Shift键逐个点击,或点击第一个后按住Shift再点击最后一个),将它们拖到新的墙壁对象下。
2. 创建环境容器
- 右键点击Hierarchy视图,选择Create Empty,将空的GameObject重命名为“Environment”。
- 在Hierarchy视图中,将刚创建的墙壁对象、智能体、地板、方块和目标拖到新的环境对象中。
3. 配置智能体
- 在Hierarchy视图中选择智能体,在Inspector视图中向下滚动到添加的脚本,将Hierarchy视图中的地板对象拖到Inspector的Floor插槽中。
- 对整体环境GameObject、目标和方块执行相同操作,并在编辑器中将Max Steps设置为5000,防止智能体花费过长时间将方块推到目标位置。
- 使用Inspector中智能体的Add Component按钮,添加DecisionRequester脚本,并将其Decision Period设置为5。
- 添加两个Ray Pe
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



