

一个是action-state RND,一个是 replay buffer RND
效果似乎都不错,都有提升啊
经验回放的直接到了 8000
文章讨论了action-stateRND和replaybufferRND两种技术在游戏AI中的应用,表明它们都能有效提升性能,特别指出经验回放技术达到了8000的显著效果。


一个是action-state RND,一个是 replay buffer RND
效果似乎都不错,都有提升啊
经验回放的直接到了 8000
2693

被折叠的 条评论
为什么被折叠?