15、有限理性对CHREST智能体的影响研究

有限理性对CHREST智能体的影响研究

1. 引言

在复杂环境中,智能体的决策和学习能力受到多种因素的影响。有限理性概念由Simon提出,在处理复杂问题时,智能体往往无法进行完全理性的决策。本文围绕Tileworld环境,研究有限理性对CHREST智能体学习和性能的影响。

2. Tileworld环境

Tileworld是一个复杂的二维网格环境(35×35),具有“环绕”特性(网格边缘不是严格边界),包含多个智能体、瓷砖和孔洞。与其他研究相比,该环境复杂度大幅提升。一个智能体可能遇到4种类型的实体(不包括自身):其他智能体、瓷砖、孔洞和空方块,这导致可能的状态多达$35^2\times4^{35^2}$ 或 $4\times10^{740}$ 种。

此外,在这个版本的Tileworld中,一个智能体一次只能推动一块瓷砖。例如,如果一个智能体东边连续两个方块都有瓷砖,它无法推动离自己最近的瓷砖向东移动,因为被东边第二个方块的瓷砖挡住了。

3. CHREST认知架构

CHREST是一种符号认知架构,强调感知和学习。它主要由短期记忆(STM)和长期记忆(LTM)组成。

记忆类型 数量 容量 存储内容
STM 3个(动作、视觉、语言,本研究未使用语言STM/LTM) 约4个离散块 不同模
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值