预期驱动的人工个性:情感、动机与行为的探索
1. 情感空间与行为轨迹
在探索智能体的行为时,情感空间是一个关键概念。智能体可以通过情感空间来搜索行为轨迹。情感值的表示方式多种多样,比如使用数值,但在可能的情况下,面部表情的风格化表示更为可取。状态之间的转换即为行为,这里的“行为”既涵盖简单动作,也包括可能的复杂动作网络。有时候,智能体的行为库可能无法触及某些状态。情感值可以通过遗传机制赋予状态,也可以在智能体访问该状态后通过学习获得。一个状态可能原本是中性的,但在被访问后其情感值可能会发生改变。
智能体在环境中的学习方式有多种。它可以学习整个图,就像认知地图一样;也可以只学习策略,即与那些状态相关联的状态和行为集合。在策略学习的情况下,实际的地图(状态之间的互连网络)由环境提供,而不存储在智能体内部。
动机是在实际执行行为之前对行为的预期评估。动机由其(预期的)后果状态的值计算得出。有一种理论强调只学习和记住动机(行为评估),而不是状态评估,因为状态值可以从(当前的)行为值计算得出。
在智能体与环境的交互方面,并行编程隐喻被用于思考这种交互。自引入CAA以来,并行编程被用于进行极点平衡学习实验,CAA控制器在一个VAX/VMS终端上运行,而环境(极点平衡动力学)则作为一个单独的进程在另一个终端上运行。
2. 主要成果:情感势、动机场与预期行为
2.1 预期系统的基本方程
从力场隐喻扩展而来,我们使用动机象形文字来描述预期系统中的情感、动机和行为等概念。每个系统状态j都被赋予一个情感势☺(j),情感势空间定义了一个向量场,即动机场!”。在这种设置下,由情感势☺诱导的动机场!”驱动的行为B”遵循一
超级会员免费看
订阅专栏 解锁全文
1001

被折叠的 条评论
为什么被折叠?



