预防性状态预测框架:从理论到实践
在现实生活中,我们常常会根据对未来的预期来调整自己的行为,以避免不理想的情况发生。例如,当我们看到天空布满乌云,就会预测可能会下雨,为了避免被淋湿感冒,我们会带上雨伞再出门。在人工智能领域,也有类似的概念,即预防性状态预测,让智能体能够根据对未来不利情况的预期来调整自身行为。
1. 预测系统基础
预测系统是一种包含自身和/或环境预测模型的系统,它可以根据模型对未来时刻的预测来改变当前状态。理想的预测系统的下一个状态是过去和未来状态的函数,而因果系统仅依赖过去的状态。但在现实世界中,智能体通常无法获得关于未来状态的真实知识,因此只能通过对未来状态的预测来近似实现预测系统。
Rosen提出了一种简单的预测系统类,它包含一个普通的因果动态系统S和一个与之关联的动态系统M,M是S的模型,且M的状态序列由一个比实时更快的时间变量参数化。通过观察M在时间t的状态,我们可以估计S在稍后时间的状态。此外,M配备了一组效应器E,可用于改变S的动态特性。
当M的轨迹进入“不理想”区域时,效应器系统会被激活,以改变S的动态,使S的轨迹远离“不理想”区域。
2. 预防性状态预测智能体
将这种预测系统转换到智能体框架中,需要进行一些必要的补充和更改。首先,需要一个元级组件来运行和监控模型,评估预测结果,并决定如何改变S或其输入,我们将这个组件称为预测器(Anticipator)。其次,为了预测S的未来环境输入,需要将模型M扩展到包含环境。
2.1 预防性状态预测智能体架构
在建议的框架中,一个预测智能体主要由三个实体组成:
- 对象系统(
超级会员免费看
订阅专栏 解锁全文
1454

被折叠的 条评论
为什么被折叠?



