83、基于解释的规划学习:原理、应用与挑战

基于解释的规划学习:原理、应用与挑战

1. 基于解释的学习(EBL)概述

基于解释的学习(Explanation-Based Learning,EBL)是一种利用先验知识解释训练示例标签,并以此指导学习的方法。它通过解释来精准定位示例中支持标签的特征,从而减少对训练示例数量的依赖。然而,与普通分类学习器不同,EBL除了需要带标签的训练示例外,还需要先验知识(即“领域理论/模型”),这在某些场景下较难满足。

由于许多规划和问题解决代理通常从声明性领域理论(至少包含动作描述及其前提条件和效果)开始,因此EBL在规划领域成为了一种流行的学习技术。

1.1 EBL的发展历程

EBL的根源和动机至少可以追溯到STRIPS的MACROPs。早期关于EBL的重要研究包括Mitchell等人(1986)和DeJong与Mooney(1986)的工作。如今的教科书对早期方法进行了一定的改进。相关的重要概念还包括确定性、组块化和知识编译等。

随着现代统计学习成为该领域的主导范式,对分析方法的兴趣有所下降。但目前,将EBL置于现代统计复杂框架中,同时仍能利用一阶表达能力的研究,重新激发了人们对EBL的兴趣。

1.2 EBL在规划中的应用维度

EBL在规划中的应用在多个维度上存在差异,具体如下表所示:
| 维度 | 具体情况 |
| — | — |
| 学习目的 | 提高底层规划器的速度和质量,或获取领域模型 |
| 学习来源 | 成功案例或失败案例 |
| 解释依据 | 完整/正确的领域理论或部分领域理论 |
| 学习示例数量 | 单个示例或多个示例(后者

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值