深度强化学习中稀疏奖励问题Sparse Reward
Sparse Reward推荐资料《深度强化学习中稀疏奖励问题研究综述》1李宏毅深度强化学习Sparse Reward4 强化学习算法在被引入深度神经网络后,对大量样本的需求更加明显。如果智能体在与环境的交互过程中没有获得奖励,那么该样本在基于值函数和基于策略梯度的损失中的贡献会很小。 针对解决稀疏奖励问题的研究主要包括:1Reward Shaping:奖励设计与学习经验回放机制探索与利用多目标学习和辅助任务Reward Shaping人为设计的 “
原创
2021-08-03 21:49:20 ·
2553 阅读 ·
0 评论