- 博客(4)
- 收藏
- 关注
原创 学习笔记:强化学习之Actor-Critic
写在前面:我是根据莫烦的视频学习的Reinforce learning,具体代码实现包括Q-learning,SARSA,DQN,Policy-Gradient,Actor-Critic以及A3C。(莫凡老师的网站:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/)今天发表其中的Acto...
2018-11-20 14:27:20
1901
1
原创 学习笔记:强化学习之A3C代码详解
写在前面:我是根据莫烦的视频学习的Reinforce learning,具体代码实现包括Q-learning,SARSA,DQN,Policy-Gradient,Actor-Critic以及A3C。(莫凡老师的网站:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/)今天先发表最后一个也是...
2018-11-18 15:34:21
9338
11
原创 机器人找金币------一个经典的强化学习实验
代码之前:这是在电子科大面试(实习)时老师布置的任务,过去学习的基本上是统计学习方法,从来没有接触过强化学习的相关内容,因此走了不少弯路。先简要描述一下问题:在一个十乘十的方格中有一个机器人寻找金币。有一个金矿和水坑分布在该方格处,机器人需要寻找到金币并尽力避开水坑。开始时机器人位于左下角处随机搜索,遇到金币或者水坑后停止搜索,利用强化学习不断迭代逐渐使得机器人找到最优路径。(截图显示的是两个金币...
2018-08-28 00:14:05
4795
6
原创 写在代码之前
本科学习智能科学与技术专业,写代码小学生一个,准备分享一些写过的实验程序,都是与机器学习人工智能相关的算法实现,均利用python语言。自认为代码能力不强,也没有人指点一二,也恳请各路大神指点一二,学生在此谢过。...
2018-08-25 12:56:33
383
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人