人工智能原理课程复习——(6)复杂环境搜索

复杂环境搜索

不确定性的环境

此处的不确定性指的是动作结果的不确定性,此处假设环境是完全可观察的

即Agent做一个动作,可能会导致多个结果出现

因此对应于转移模型就会有多个状态,如下图中执行suck这个动作,可能会得到5这个状态也可能得到7这个状态

因此现在的解不再是动作序列,而是一个条件规划

因为我此刻不知道我现在是属于什么状态,所以我必须加上条件,来确定我在哪个状态,从而执行相应的动作,这就意味着解是以”树“的形式出现

下面介绍一下与或树的概念

与或树:即将所有可能的预测和更新进行组合,其中方块代表或结点,圆块代表与结点

我们在或结点上选择动作,我们每选择一个动作都会得到对应的状态,这样的状态可能有多个,我们需要为这里所有可能得到的状态继续找到它们所对应的规划

综上

在或结点上确定一个动作,只要有一个动作导致成功,就有解,解的形式就是一棵子树

在与结点上为所有状态找到规划,只要有一个状态失败,整体就失败

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值