多智能体系统中的 stigmergic 线索及其协调应用模拟
在自然界中,杂食动物通常具有食物新物恐惧症,即对食用新食物会有所犹豫。这种行为策略能有效避免摄入有毒物质的风险。不过,社会环境会影响对新食物的接受程度,缓解这种本能的犹豫。接下来,我们将通过模拟实验,探讨一种可能的策略,即个体对“安全”或“有毒”自然物的分类能力,可能依赖于其他智能体留下的 stigmergic 线索,且这些线索有助于个体进行分类。
1. 基本模型
我们模拟了一个由 100 个智能体组成的群体,它们生活在一个由 5 个“岛屿”构成的环境中。每个岛屿有 2 棵“树”,每棵树有 20 个“果实”。其中一棵树的果实可食用,另一棵树的果实有毒。食用可食用果实会使智能体的适应度(即繁殖概率)增加 1 个单位,而食用有毒果实会使适应度降低 2 个单位。有毒和可食用的果实(以及树)在感知上是相同的,因此智能体无法依靠直接的感知线索来决定从哪棵树获取食物。每个智能体访问所有 5 个岛屿,在每个岛屿上最多停留 4 个时间步。在每个时间步,智能体可以决定是从两棵树中的一棵吃果实,还是离开该岛屿。
智能体的行为由一个人工神经网络控制,该网络有 4 组输入单元,连接到一组 5 个隐藏单元,隐藏单元再连接到一组 3 个动作单元。三个可能的动作是:
- 从第一棵树吃一个果实;
- 从第二棵树吃一个果实;
- 离开该岛屿。
动作根据“胜者全得”机制决定:在每个时间步,智能体执行对应激活值最大的动作单元的动作。当智能体决定从某棵树吃一个果实时,该树上的一个随机果实消失,智能体的适应度根据所吃果实的质量进行更新(可食用果实 +1,有毒果实 -2)。
输入单元的情况如下
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



