人工智能中的规划:经典规划与不确定性规划综述
1 引言
在人工智能领域,规划旨在生成一系列行动以达成特定目标。早期,GPS 系统期望让计算机模拟人类推理,但随着发展,经典规划领域虽降低了预期,却在表达能力和计划生成效率上取得显著进步。
经典规划基于两个简化假设:一是对系统当前状态和行动效果有完美认知;二是系统状态仅因行动而确定性改变。这使得规划器能解决远超人类能力的大型问题。
近年来,不确定性规划领域兴起,它能在决策理论规划中整合行动的随机效果和目标效用。马尔可夫决策过程(MDP)框架成为解决不确定性规划问题的常用方法。不过,为 MDP 引入简洁表示语言会导致传统求解算法因“维度灾难”而效率低下,这也促使了众多相关方法的发展。
接下来,我们将介绍基于 STRIPS 及其扩展的经典规划方法,以及 MDP 框架在不确定性规划中的应用。
2 经典规划
经典规划的发展历经三个主要阶段,对应三种规划问题表示框架和语言:STRIPS、PDDL 和 GRAPHPLAN。
2.1 命题 STRIPS 规划框架
STRIPS 系统为经典规划研究奠定了基础。在命题 STRIPS 规划框架中,行动由有限的原子命题符号集定义。一个命题 STRIPS 规划问题可通过实例化如 PDDL 等更丰富语言描述的行动方案得到。
系统状态是有限原子集 A 的子集,代表世界的所有可能事实。行动是一个三元组 (a = \langle prec(a), add(a), del(a) \rangle),其中 (prec(a)) 是行动的前提条件,(add(a)) 是添加效果,(del(a)) 是删除
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



