1、逆强化学习概述



2、基于最大边际的逆强化学习

学徒学习方法



最大边际规划方法MMP




基于结构化分类的方法



3、基于概率模型的形式化


基于最大信息熵的逆强化学习


基于相对熵的逆强化学习


深度逆向强化学习




本文主要介绍了逆强化学习的不同方法和技术,包括基于最大边际的逆强化学习、学徒学习、最大边际规划方法MMP等,并探讨了基于概率模型的形式化方法如基于最大信息熵和相对熵的逆强化学习。





学徒学习方法



最大边际规划方法MMP




基于结构化分类的方法





基于最大信息熵的逆强化学习


基于相对熵的逆强化学习


深度逆向强化学习




179

被折叠的 条评论
为什么被折叠?