学习作为获取领域特定知识的方法
1. 学习控制规则
在规划研究中,控制规则学习是一个重要的研究方向。控制规则可以显著提高计划构建的效率和计划的质量。通过解释性学习或泛化方法,可以从搜索树中提取有用的控制规则,进而指导规划搜索。控制规则通常表示为产生式规则,即条件-动作规则。对于规划过程中遇到的当前状态,这些规则提供了应该采取哪些动作的指导信息。
1.1 解释性学习
解释性学习(EBL)是一种常用的方法,通过解释在搜索解决方案时做出某些分支决策的原因,从搜索树的分析中提取控制规则。例如,Minton(1988)提出的方法,通过解释在搜索过程中选择特定路径的原因,提取出可以提高未来搜索效率的控制规则。这种方法的核心在于,通过分析成功路径和失败路径的区别,总结出有助于提高搜索效率的经验规则。
1.2 泛化方法
另一种方法是通过泛化从多个示例中提取控制规则。例如,Mitchell等人(1986)提出的方法,通过泛化多个成功路径的共同特征,生成更具普遍性的控制规则。这些规则不仅提高了当前问题的求解效率,还能应用于类似问题的求解。
2. 学习控制程序
学习控制程序是另一种提高规划效率的方法。与控制规则不同,控制程序生成的是一个可能是循环或递归的动作序列,用于指导问题求解过程。控制程序不仅可以提高搜索效率,还能提供更高层次的抽象知识,帮助理解和解决复杂问题。
2.1 迭代宏与线性宏
Shell和Carbonell(1989)将迭代宏与线性宏进行了对比,展示了使用迭代宏可以预期的效率提升。迭代宏可以被视为程序,因为它们提供了一个控制结构,用于反复执行一系列动作,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



