复杂环境中的部分可观测搜索问题探索
1. 部分可观测环境搜索概述
在许多实际场景中,智能体的感知信息往往不足以精确确定当前的状态,这就引出了部分可观测环境下的搜索问题。在这类问题中,智能体的部分行动旨在降低对当前状态的不确定性。
2. 无观测搜索(传感器缺失问题)
当智能体的感知信息完全无法提供有用信息时,就会面临传感器缺失问题(也称为一致问题)。乍一看,没有传感器的智能体似乎无法解决问题,因为它不知道自己的初始状态。但实际上,传感器缺失的解决方案在很多情况下既常见又实用,因为它们不依赖于传感器的正常工作。
例如,在制造系统中,人们开发了许多巧妙的方法,通过一系列无感知的动作,将零件从未知的初始位置正确定向。在医疗领域,医生有时会直接开广谱抗生素,而不是先进行血液测试,等待结果出来后再开更有针对性的抗生素。这种无传感器的方案节省了时间和金钱,还避免了在测试结果出来之前感染恶化的风险。
以确定性真空世界的无传感器版本为例,假设智能体知道世界的地理布局,但不知道自己的位置和灰尘分布。其初始信念状态为 {1,2,3,4,5,6,7,8}。当智能体向右移动时,它会处于 {2,4,6,8} 中的某个状态,这意味着智能体在没有感知的情况下获得了信息。经过 [Right,Suck] 操作后,智能体总是会处于 {4,8} 中的某个状态。最后,经过 [Right,Suck,Left,Suck] 操作,无论初始状态如何,智能体都能保证到达目标状态 7,我们称智能体可以将世界强制转换到状态 7。
传感器缺失问题的解决方案是一系列动作,而不是条件计划(因为没有感知)。我们在信念状态空间而不是物理状态空间中进行搜索。在信念状态空间中,问题是完
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



