
Reinforcement Learning 强化学习
文章平均质量分 96
Kin-Zhang
这里是张聪明
展开
-
【排行榜】Carla leaderboard 排行榜 运行与参与手把手教学
此分支主要供参与leaderboard排名使用,介绍如何构建队伍,提交自己代码,此部分较为简单,主要是基本教学与演示;后续可以参考更多的开源代码进行学习等。基本参与此榜单的大多都是学校和实验室,还是很少看到有公司比如waymo uber 等参与的,可能是… 他们已经有自己的数据集了合作会议Carla leaderboard 排行榜每年都会和相关会议/期刊进行合作 作为某个workshop的一部分进行结果总结和方法分享,例如:The CARLA Autonomous Driving Challenge 20原创 2022-06-21 09:29:40 · 5338 阅读 · 4 评论 -
【CS285 深度强化学习 】作业三之详解 [Deep Reinforcement Learning]
完整:第一部分使用Q-Learning + 卷积网络去实现和评估 训练出的Atari agent;第二部分是修改上次作业内的policy gradient使用actor-critic的形式去表示,虽然这一部分可能少于20行的代码修改,但是运行和对比结果需要很多时间 因为我们需要训练较多数据为value function原创 2021-06-08 23:11:10 · 1308 阅读 · 3 评论 -
【CS285 深度强化学习 】作业二之详解 [Deep Reinforcement Learning]
前情提要与引用参考:b站看课地址:https://www.bilibili.com/video/BV1dJ411W78A官方课程地址:http://rail.eecs.berkeley.edu/deeprlcourse/本人代码地址:https://gitee.com/kin_zhang/drl-hwprogramm/tree/kin/hw1/hw1请先看原文件里的readme.md和installation.md等,课程是2019fall,但是作业我直接做的最新的2020fall的一些参考引用原创 2021-05-20 10:02:36 · 2048 阅读 · 2 评论 -
【CS285 深度强化学习 】作业一之详解 [Deep Reinforcement Learning]
前情提要:https://gitee.com/kin_zhang/drl-hwprogramm/tree/kin/hw1/hw1请先看原文件里的readme.md和installation.md等,安装Mujoco Window介绍Mujoco: Mujoco is owned by Roboti LLC, initially used by Movement and Control Laboratory at the University of Washington. MuJoCo stands原创 2021-05-17 00:29:34 · 4101 阅读 · 6 评论 -
【书籍阅读 Ch5】Reinforcement Learning An Introduction, 2nd Edition
Chapter 5: Monte Carlo Methods回顾与进入前言:第1、2章点此进入;第3章点此进入注:每一个目录对应的是在pdf的页数(如果LPage就是书左上角的页码 - 因为我发现后面我要在两页之间加空白页 做练习lol 例如:LPage28 就是左上角书页28页,RPage29就是右上角书页29页);【】这个括号之间有时候是我留的疑问,与一些关于方向上连接的想法 主要集中于无人驾驶的控制层,带问号结束的就是…我的疑问更新时间:2021/01/18推荐观看:1.英文 - PDF链原创 2021-03-07 23:38:04 · 569 阅读 · 0 评论 -
【书籍阅读 Ch4】Reinforcement Learning An Introduction, 2nd Edition
Chapter 4: Dynamic Programming回顾与进入前言:第1、2章点此进入;第3章点此进入注:每一个目录对应的是在pdf的页数(如果LPage就是书左上角的页码 - 因为我发现后面我要在两页之间加空白页 做练习lol 例如:LPage28 就是左上角书页28页,RPage29就是右上角书页29页);【】这个框架之间有时候是我留的疑问,与一些关于方向上连接的想法 主要集中于无人驾驶的控制层,带问号结束的就是…我的疑问更新时间:2021/01/07推荐观看:1.英文 - PDF链原创 2021-01-19 17:17:54 · 656 阅读 · 0 评论 -
【书籍阅读 Ch3】Reinforcement Learning An Introduction, 2nd Edition
强化学习第二版阅读笔记及练习题记录Chapter 3: Finite Markov Decision Processes原创 2021-01-07 11:21:04 · 626 阅读 · 3 评论 -
【书籍阅读 Ch1&2】Reinforcement Learning An Introduction, 2nd Edition
强化学习 书籍阅读书籍下载链接:优快云资源下载;BDYP下载链接每一个目录对应的是在pdf的页数 [Elements] Page:27/548 Date:12/3[Elements] Page:27/548 Date:12/3一个强化学习系统应该具备四个元素:1. policy (mapping from perceived states of the environment to actions )也就是environment -> states -> actionpolic原创 2020-12-16 14:48:49 · 726 阅读 · 0 评论