
deep reinforcement learning
weihe233
这个作者很懒,什么都没留下…
展开
-
流下没技术的眼泪之gazebo actor collision解决过程
近期在搞深度强化学习,是让机器人在人群中导航的.众所周知,强化学习非常依赖仿真环境,由于是机器人,所以用的是ROS,顺带着就是用gazebo来搭建训练环境了.实际上,用gazebo仿真坑特别多...,但没办法,自己找到的行人仿真模拟器就那么几个,本来是想用无人驾驶的那些模拟器来做的,但发现和ROS的机器人模型兼容不是很好,有几个是能和ROS通讯,但就是不能直接把机器人模型加载进去,而且...原创 2019-10-18 21:08:01 · 4068 阅读 · 24 评论 -
个人认为写得最好的TRPO讲解
自己在Medium上看到的一个教授讲解的关于TRPO的博客,觉得写得很清晰易懂,后来发现搜狐有机构号将博客翻译了,翻译的质量不错.故转发分享给大家,欢迎讨论. 强化学习-TRPO和PPO背后的数学 ...转载 2019-08-19 10:57:03 · 16652 阅读 · 0 评论