15、复杂环境中的搜索与在线搜索代理

rust6ferris

于 2025-06-28 15:26:33 发布

阅读量11

点赞数

CC 4.0 BY-SA版权

分类专栏：人工智能：现代方法精解文章标签：在线搜索离线搜索机器人定位

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/rust6ferris/article/details/151887172

人工智能：现代方法精解专栏收录该内容

99 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

复杂环境中的搜索与在线搜索代理

1. 机器人定位与传感器故障问题

在复杂环境中，机器人的定位是一个重要问题。当传感器无噪声且转移模型准确时，根据一系列观测结果可以确定机器人的位置。例如，在经过一次观测 (E1 = 1011) 后，以及移动一格并进行第二次观测 (E2 = 1010) 后，若满足上述条件，就只有一个可能的位置与这两次观测序列相符。

对于地理环境有合理变化的情况，即使行动是不确定的，定位通常也能迅速收敛到一个点。然而，如果传感器出现故障，情况就变得复杂了。若仅使用布尔逻辑进行推理，我们只能将每个传感器位视为正确或错误，这等同于没有任何感知信息。但概率推理可以在传感器错误率低于一半的情况下，从有故障的传感器中提取有用信息。

2. 在线搜索与离线搜索的区别

之前我们主要关注使用离线搜索算法的代理。离线搜索代理会在采取第一个行动之前计算出完整的解决方案。与之相反，在线搜索代理会将计算和行动交织进行：先采取一个行动，然后观察环境并计算下一个行动。

在线搜索在动态或半动态环境中是个不错的选择，因为在这些环境中，长时间坐着计算会有代价。同时，它在不确定领域也很有帮助，能让代理将计算精力集中在实际出现的情况上，而非可能发生但概率较小的情况。

当然，这存在一个权衡：代理提前规划得越多，陷入困境的可能性就越小。在未知环境中，代理不知道存在哪些状态以及其行动会产生什么结果，因此必须将行动作为实验来了解环境。

3. 在线搜索问题

在线搜索问题通过交织计算、感知和行动来解决。我们先假设一个确定性且完全可观测的环境（后续会放宽这些假设），并且规定代理仅知道以下信息：
-

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。