13、自适应学习系统中的内部模型与预期

最新推荐文章于 2025-11-08 19:46:50 发布

浮生若梦622

最新推荐文章于 2025-11-08 19:46:50 发布

阅读量16

点赞数

CC 4.0 BY-SA版权

分类专栏：预期行为：智能的未来文章标签：预期机制自适应学习系统部分可观察马尔可夫决策过程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/opencv7vision/article/details/153465554

预期行为：智能的未来专栏收录该内容

36 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

自适应学习系统中的内部模型与预期

1. 引言

在过去几十年里，预期对行为的影响和引导作用越来越受到重视，它在适应性行为的协调和实现中起着重要作用。不同学科都明确认识到了预期的存在，如哲学长期以来一直在探讨推理、泛化和联想等方面。实验心理学也证实了动物和人类中存在预期行为过程。

虽然从理论上讲，在所有可构建的学习问题中，任何学习机制的表现可能相同，但心理学研究表明，在自然环境和自然问题中，以预期方式进行学习和行动能增加生存机会。因此，在设计智能人造动物（animats）时，纳入预期机制似乎是必要的。

这涉及到两个重要问题：一是如何将预期机制融入 animats，即预期行为需要哪些结构和过程；二是什么时候预期机制对 animats 真正有帮助，即哪些环境前提条件有利于预期行为。为了探讨这些问题，需要区分不同的预期机制。主要有以下四种：
1. 隐式预期机制 ：不进行实际预测，但行为结构以预期方式构建。
2. 收益预期机制 ：未来预测对行为的影响仅限于收益预测。
3. 感官预期机制 ：未来预测影响感官（预）处理。
4. 状态预期机制 ：对未来状态的预测直接影响当前行为决策。

这些区分将在部分可观察马尔可夫决策过程（POMDP）和基于 POMDP 结构的通用 animat 框架内进行介绍和讨论。

2. 心理学研究背景

为了说明在适应性行为研究中使用预期的合理性，下面从认知心理学的角度提供背景信息，展示心理学研究如何认识预期及其对行为的影响

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。