33、机器人学习与供应链管理：强化学习的应用探索

最新推荐文章于 2025-10-07 21:11:06 发布

xray4

最新推荐文章于 2025-10-07 21:11:06 发布

阅读量39

点赞数

CC 4.0 BY-SA版权

分类专栏：精通Python强化学习文章标签：机器人学习课程学习 ALP-GMM

本文链接：https://blog.youkuaiyun.com/xray4/article/details/151042402

精通Python强化学习专栏收录该内容

39 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器人学习与供应链管理：强化学习的应用探索

一、机器人学习中的课程学习

1.1 ALP - GMM方法原理

ALP - GMM方法聚焦于参数空间中性能变化最大（绝对学习进度）的位置，并在该差距周围生成参数。这样做的好处是，学习预算不会浪费在已经学习过的状态空间部分，或者当前智能体难以学习的部分。

1.2 实现步骤

1.2.1 创建自定义环境

首先，我们创建一个自定义环境 ALPKukaEnv ，其中关键部分如下：

class ALPKukaEnv(CustomKukaEnv):
    def __init__(self, env_config={}):
        ...
        self.mins = [...]
        self.maxs =  [...]
        self.alp = ALPGMM(mins=self.mins, 
                     maxs=self.maxs, 
                           params={"fit_rate": 20})
        self.task = None
        self.last_episode_reward = None
        self.episode_reward = 0
        super(ALPKukaEnv, self).__init__(env_config)

这里， task