
强化学习
文章平均质量分 78
AIGCnn
B站:Maker_AI,UID:398441969,专注AI创新和落地,关注AIGC资讯,并分享和记录实践过程。
展开
-
强化学习术语与超参数整理(PPO)
强化学习术语与PPO各个框架超参数整理原创 2024-07-24 15:15:53 · 5306 阅读 · 1 评论 -
stable baseline3中对于是否是图像空间判断的踩坑
在使用混合输入(图像 + 向量)的时候,发现似乎一直没有给用卷积网络训练,这部分核心是。等等,所以使用上需要多注意,否则训练半天模型都不对.......的源码,发现这检测条件有点严格,如数据类型得是。发现图像要用卷积,必须得过。原创 2024-06-28 09:50:47 · 334 阅读 · 0 评论 -
Isaac Lab 使用 Stable Baselines3 实现 Multi Input Policy
目前Isaac Lab支持的强化学习框架Isaac Lab支持的强化学习框架介绍调研下来,能够实现字典状态量,也就是多输入状态量的有rsl_rl、sb3、(skrl不确定),rl_games是显然不支持的,自己改了一版,花了很长时间,目前训练还不收敛,个人觉得rl_games定制网络和策略不那么友好。rsl_rl关节类的研究对象用这个多一些,但是目前master分支只支持PPO算法,algorithms分支支持算法很多,但是没有合并到master,使用不方便;sb3比较通用一点;原创 2024-06-24 13:46:58 · 1925 阅读 · 1 评论