
强化学习
文章平均质量分 67
看那片云
对AI,NLP,RL,ML等感兴趣,相互交流,相互学习,知识的分享是人类最大的进步
展开
-
003:core.discount_cumsum(),RL求优势函数时用到的函数——介绍
记录discount_cumsum函数:这个是官方的定义,其中调用了scipy.signal.lfilter函数,这个是一个滤波器,其参数为:def discount_cumsum(x, discount): return scipy.signal.lfilter([1], [1, float(-discount)], x[::-1], axis=0)[::-1]代码最后的[::-1]的意思是逆转的意思...原创 2021-11-30 17:58:25 · 376 阅读 · 1 评论 -
强化学习 开篇2, Nvidia显卡驱动安装报错, cuda, cudnn,pycharm安装等,依旧是环境搭建
今天依旧是配置环境的一天昨天的工作量在配置后mujoco之后,开始配置Nvidia 的GPU和cuda 和cudnn,当前环境为ubuntu20.04,显卡为RTX 3060,就下在了cuda 11.1,不要下载那么高级的版本,能用即可,然后cudnn也是下载了和11.1对应的版本,这里需要注意,如果下载下来的安装包名字里不含11.1一定不要安装,否则会乱的。安装cuda之前,一定要先看自己的当前显卡驱动,我的电脑是双线卡,intel的和NVIDIA的,今天装得过程也时十分曲折,经历了ubuntu纯图原创 2021-11-25 23:26:05 · 584 阅读 · 0 评论 -
强化学习 mujoco mujoco_py gym开篇1,环境配置,2021年11月24开始学习,特开帖记录
**首先就是配置环境,**不建议在windows下使用强化学习,也不建议使用虚拟机跑上述这些包,因为虚拟机很难调用GPU。会影响后期使用,在windows挣扎很久后决定还Linux。最好使用linux系统进行处理当前环境为windows10+ubuntu20.04双系统使用的mujoco为210版本,好在openai刚收购了mujoco,可以免费使用,暂时没有使用mujoco150版本。博主所用笔记本有Intel的RST驱动,和ubuntu20.04冲突,但是该方法可以解决,网上天花乱坠的方法原创 2021-11-24 20:46:28 · 2796 阅读 · 0 评论