有限理性对CHREST智能体的影响研究
1. 引言
在复杂环境中,智能体的决策和学习能力受到多种因素的影响。有限理性概念由Simon提出,在处理复杂问题时,智能体往往无法进行完全理性的决策。本文围绕Tileworld环境,研究有限理性对CHREST智能体学习和性能的影响。
2. Tileworld环境
Tileworld是一个复杂的二维网格环境(35×35),具有“环绕”特性(网格边缘不是严格边界),包含多个智能体、瓷砖和孔洞。与其他研究相比,该环境复杂度大幅提升。一个智能体可能遇到4种类型的实体(不包括自身):其他智能体、瓷砖、孔洞和空方块,这导致可能的状态多达$35^2\times4^{35^2}$ 或 $4\times10^{740}$ 种。
此外,在这个版本的Tileworld中,一个智能体一次只能推动一块瓷砖。例如,如果一个智能体东边连续两个方块都有瓷砖,它无法推动离自己最近的瓷砖向东移动,因为被东边第二个方块的瓷砖挡住了。
3. CHREST认知架构
CHREST是一种符号认知架构,强调感知和学习。它主要由短期记忆(STM)和长期记忆(LTM)组成。
记忆类型 | 数量 | 容量 | 存储内容 |
---|---|---|---|
STM | 3个(动作、视觉、语言,本研究未使用语言STM/LTM) | 约4个离散块 | 不同模 |