22、神经进化与深度强化学习:从迷宫求解到雅达利游戏

神经进化在深度强化学习中的应用

神经进化与深度强化学习:从迷宫求解到雅达利游戏

1. 迷宫求解实验

在迷宫求解实验中,成功的求解路径对于给定的迷宫配置近乎最优。该实验也凸显了初始条件在寻找成功解决方案中的重要性,初始条件由运行实验前选择的随机种子值决定。

你可以尝试解决一个难解的迷宫配置,相关配置已包含在以下实验源代码中: https://github.com/PacktPublishing/Hands-on-Neuroevolution-with-Python/blob/master/Chapter9/hard_maze.txt 。使用以下命令来尝试解决这个难解的迷宫:

python maze_experiment_safe.py -g 120 -t 5 -m hard --width 200 --height 200

已发现使用随机种子值 1571021768 可得到成功的解决方案。你可以尝试寻找另一个能产生成功解决方案的随机种子值,并记录找到它所需的代数。

2. 深度神经进化概述

传统上,深度神经网络(DNN)使用基于误差梯度下降的反向传播方法进行训练。虽然基于梯度的学习是强大的技术,开启了当前的深度机器学习时代,但它存在训练时间长和计算能力要求高的缺点。

深度神经进化方法可用于强化学习,并且在训练 DNN

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值