14、复杂环境中的部分可观测搜索问题探索

复杂环境中的部分可观测搜索问题探索

1. 部分可观测环境搜索概述

在许多实际场景中,智能体的感知信息往往不足以精确确定当前的状态,这就引出了部分可观测环境下的搜索问题。在这类问题中,智能体的部分行动旨在降低对当前状态的不确定性。

2. 无观测搜索(传感器缺失问题)

当智能体的感知信息完全无法提供有用信息时,就会面临传感器缺失问题(也称为一致问题)。乍一看,没有传感器的智能体似乎无法解决问题,因为它不知道自己的初始状态。但实际上,传感器缺失的解决方案在很多情况下既常见又实用,因为它们不依赖于传感器的正常工作。

例如,在制造系统中,人们开发了许多巧妙的方法,通过一系列无感知的动作,将零件从未知的初始位置正确定向。在医疗领域,医生有时会直接开广谱抗生素,而不是先进行血液测试,等待结果出来后再开更有针对性的抗生素。这种无传感器的方案节省了时间和金钱,还避免了在测试结果出来之前感染恶化的风险。

以确定性真空世界的无传感器版本为例,假设智能体知道世界的地理布局,但不知道自己的位置和灰尘分布。其初始信念状态为 {1,2,3,4,5,6,7,8}。当智能体向右移动时,它会处于 {2,4,6,8} 中的某个状态,这意味着智能体在没有感知的情况下获得了信息。经过 [Right,Suck] 操作后,智能体总是会处于 {4,8} 中的某个状态。最后,经过 [Right,Suck,Left,Suck] 操作,无论初始状态如何,智能体都能保证到达目标状态 7,我们称智能体可以将世界强制转换到状态 7。

传感器缺失问题的解决方案是一系列动作,而不是条件计划(因为没有感知)。我们在信念状态空间而不是物理状态空间中进行搜索。在信念状态空间中,问题是完

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值