
强化学习
文章平均质量分 50
源氏失去了我的激素
这个作者很懒,什么都没留下…
展开
-
对强化学习的思考与总结-PPO-advantage
根据我自己的项目对advantage做思考笔记原创 2022-10-01 16:02:24 · 1435 阅读 · 0 评论 -
李宏毅强化学习视频学习笔记(三)——PPO与PPO2
讲解PPO与PPO2原创 2022-08-11 18:48:47 · 1384 阅读 · 0 评论 -
李宏毅强化学习视频学习笔记(二)——off-policy与重要度采样
重要性采样用于PG算法的大致流程原创 2022-08-11 17:51:02 · 647 阅读 · 0 评论 -
李宏毅强化学习课程教学笔记--Policy gradient
强化学习:policy gradient (PG)算法的原理简讲与弊端原创 2022-08-11 12:21:08 · 447 阅读 · 0 评论 -
4.13-4.15(Ubuntu18.04)--anaconda3、Isaac gym、Isaac sim
一、安装anaconda31.下载anaconda3:Anaconda | Anaconda Distribution2.在终端进入下载:cd Download 或 cd 下载3.运行.sh文件:bash Anaconda3-5.2.0-Linux-x86_64.sh4.选项一个选no,其余的yes:“Do you wish to proceed with the installation of Microsoft VSCode? [yes|no]...原创 2022-04-15 16:19:40 · 2438 阅读 · 1 评论 -
深入浅出强化学习--原理入门(郭宪博士版本)--第二章作业(包含render画图函数参数学习)
gym render画图函数参数讲解以及深入浅出强化学习--原理入门第二章作业原创 2022-03-05 11:10:19 · 844 阅读 · 0 评论