33、人工智能中的规划:经典规划与不确定性规划综述

人工智能中的规划:经典规划与不确定性规划综述

1 引言

在人工智能领域,规划旨在生成一系列行动以达成特定目标。早期,GPS 系统期望让计算机模拟人类推理,但随着发展,经典规划领域虽降低了预期,却在表达能力和计划生成效率上取得显著进步。

经典规划基于两个简化假设:一是对系统当前状态和行动效果有完美认知;二是系统状态仅因行动而确定性改变。这使得规划器能解决远超人类能力的大型问题。

近年来,不确定性规划领域兴起,它能在决策理论规划中整合行动的随机效果和目标效用。马尔可夫决策过程(MDP)框架成为解决不确定性规划问题的常用方法。不过,为 MDP 引入简洁表示语言会导致传统求解算法因“维度灾难”而效率低下,这也促使了众多相关方法的发展。

接下来,我们将介绍基于 STRIPS 及其扩展的经典规划方法,以及 MDP 框架在不确定性规划中的应用。

2 经典规划

经典规划的发展历经三个主要阶段,对应三种规划问题表示框架和语言:STRIPS、PDDL 和 GRAPHPLAN。

2.1 命题 STRIPS 规划框架

STRIPS 系统为经典规划研究奠定了基础。在命题 STRIPS 规划框架中,行动由有限的原子命题符号集定义。一个命题 STRIPS 规划问题可通过实例化如 PDDL 等更丰富语言描述的行动方案得到。

系统状态是有限原子集 A 的子集,代表世界的所有可能事实。行动是一个三元组 (a = \langle prec(a), add(a), del(a) \rangle),其中 (prec(a)) 是行动的前提条件,(add(a)) 是添加效果,(del(a)) 是删除

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值