21、学习作为获取领域特定知识的方法

学习作为获取领域特定知识的方法

1. 学习控制规则

在规划研究中,控制规则学习是一个重要的研究方向。控制规则可以显著提高计划构建的效率和计划的质量。通过解释性学习或泛化方法,可以从搜索树中提取有用的控制规则,进而指导规划搜索。控制规则通常表示为产生式规则,即条件-动作规则。对于规划过程中遇到的当前状态,这些规则提供了应该采取哪些动作的指导信息。

1.1 解释性学习

解释性学习(EBL)是一种常用的方法,通过解释在搜索解决方案时做出某些分支决策的原因,从搜索树的分析中提取控制规则。例如,Minton(1988)提出的方法,通过解释在搜索过程中选择特定路径的原因,提取出可以提高未来搜索效率的控制规则。这种方法的核心在于,通过分析成功路径和失败路径的区别,总结出有助于提高搜索效率的经验规则。

1.2 泛化方法

另一种方法是通过泛化从多个示例中提取控制规则。例如,Mitchell等人(1986)提出的方法,通过泛化多个成功路径的共同特征,生成更具普遍性的控制规则。这些规则不仅提高了当前问题的求解效率,还能应用于类似问题的求解。

2. 学习控制程序

学习控制程序是另一种提高规划效率的方法。与控制规则不同,控制程序生成的是一个可能是循环或递归的动作序列,用于指导问题求解过程。控制程序不仅可以提高搜索效率,还能提供更高层次的抽象知识,帮助理解和解决复杂问题。

2.1 迭代宏与线性宏

Shell和Carbonell(1989)将迭代宏与线性宏进行了对比,展示了使用迭代宏可以预期的效率提升。迭代宏可以被视为程序,因为它们提供了一个控制结构,用于反复执行一系列动作,

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值