复杂环境中的搜索与在线搜索代理
1. 机器人定位与传感器故障问题
在复杂环境中,机器人的定位是一个重要问题。当传感器无噪声且转移模型准确时,根据一系列观测结果可以确定机器人的位置。例如,在经过一次观测 (E1 = 1011) 后,以及移动一格并进行第二次观测 (E2 = 1010) 后,若满足上述条件,就只有一个可能的位置与这两次观测序列相符。
对于地理环境有合理变化的情况,即使行动是不确定的,定位通常也能迅速收敛到一个点。然而,如果传感器出现故障,情况就变得复杂了。若仅使用布尔逻辑进行推理,我们只能将每个传感器位视为正确或错误,这等同于没有任何感知信息。但概率推理可以在传感器错误率低于一半的情况下,从有故障的传感器中提取有用信息。
2. 在线搜索与离线搜索的区别
之前我们主要关注使用离线搜索算法的代理。离线搜索代理会在采取第一个行动之前计算出完整的解决方案。与之相反,在线搜索代理会将计算和行动交织进行:先采取一个行动,然后观察环境并计算下一个行动。
在线搜索在动态或半动态环境中是个不错的选择,因为在这些环境中,长时间坐着计算会有代价。同时,它在不确定领域也很有帮助,能让代理将计算精力集中在实际出现的情况上,而非可能发生但概率较小的情况。
当然,这存在一个权衡:代理提前规划得越多,陷入困境的可能性就越小。在未知环境中,代理不知道存在哪些状态以及其行动会产生什么结果,因此必须将行动作为实验来了解环境。
3. 在线搜索问题
在线搜索问题通过交织计算、感知和行动来解决。我们先假设一个确定性且完全可观测的环境(后续会放宽这些假设),并且规定代理仅知道以下信息:
-
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



