没活就给你整个活-优快云博客

原创 manipulator control DDPG与HER回放项目学习（2）

Keras 模型 = 带参数的“函数壳子”

2025-12-02 15:37:40 933

原创 manipulator control DDPG与HER回放项目学习

他先从observation里面拆出三块，state = np.concatenate然后马上拼成DDPG的state，再使用训练好的DDPG选择策略，然后把action传给env，得到new_observation, reward, done, truncated, _ ，然后保存图像，处理episode结束。还是老规矩，我一般会先看training和main的东西，感觉应该会比较简单，这个项目的话是用DDPG和TD3这两种算法，加上HER这种经验回放的方式进行训练的，值的一提的就是这个HER。

2025-11-28 12:49:08 588

原创从0开始的强化学习自学笔记——SAC倒立摆

小菜急学SAC

2025-11-24 13:19:58 463

空空如也

PCL库进行滤波时报错，已在 plc_enviroment.exe 中执行断点指令(__debugbreak()语句或类似调用)。

2025-03-17

TA创建的收藏夹 TA关注的收藏夹