15、复杂环境中的搜索与在线搜索代理

复杂环境中的搜索与在线搜索代理

1. 机器人定位与传感器故障问题

在复杂环境中,机器人的定位是一个重要问题。当传感器无噪声且转移模型准确时,根据一系列观测结果可以确定机器人的位置。例如,在经过一次观测 (E1 = 1011) 后,以及移动一格并进行第二次观测 (E2 = 1010) 后,若满足上述条件,就只有一个可能的位置与这两次观测序列相符。

对于地理环境有合理变化的情况,即使行动是不确定的,定位通常也能迅速收敛到一个点。然而,如果传感器出现故障,情况就变得复杂了。若仅使用布尔逻辑进行推理,我们只能将每个传感器位视为正确或错误,这等同于没有任何感知信息。但概率推理可以在传感器错误率低于一半的情况下,从有故障的传感器中提取有用信息。

2. 在线搜索与离线搜索的区别

之前我们主要关注使用离线搜索算法的代理。离线搜索代理会在采取第一个行动之前计算出完整的解决方案。与之相反,在线搜索代理会将计算和行动交织进行:先采取一个行动,然后观察环境并计算下一个行动。

在线搜索在动态或半动态环境中是个不错的选择,因为在这些环境中,长时间坐着计算会有代价。同时,它在不确定领域也很有帮助,能让代理将计算精力集中在实际出现的情况上,而非可能发生但概率较小的情况。

当然,这存在一个权衡:代理提前规划得越多,陷入困境的可能性就越小。在未知环境中,代理不知道存在哪些状态以及其行动会产生什么结果,因此必须将行动作为实验来了解环境。

3. 在线搜索问题

在线搜索问题通过交织计算、感知和行动来解决。我们先假设一个确定性且完全可观测的环境(后续会放宽这些假设),并且规定代理仅知道以下信息:
-

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值