增量粒子群引导的局部搜索算法解析
1. 增量社会学习
增量社会学习是一种多智能体学习框架,它结合了社会学习和个体学习的元素,旨在加速学习过程并实现可扩展性。社会学习指的是个体之间在不使用遗传物质的情况下进行知识传递的机制,而个体学习则是个体通过直接与环境交互来获取知识,不受社会影响。
将社会学习的理念应用于多智能体学习问题具有吸引力,因为向他人学习能为智能体提供获取适应性信息的捷径,否则获取这些信息可能成本高昂。该框架之所以被称为“增量”,是因为它基于不断增长的智能体群体,这些智能体逐步适应最终的多智能体环境。当新智能体加入群体时,它会向更有经验的智能体进行社会学习,成为群体一员后再进行个体学习。
以下是增量社会学习算法的伪代码:
/* Initialization */
t ←0
Initialize environment Et
Initialize primogenial population of agents Xt
/* Main loop */
while Stopping criteria not met do
if Agent addition schedule or criterion is not met then
Xt+1 ←ilearn(Xt, Et) /* Individual learning */
else
Create new agent anew
slearn(anew, Xt) /* Social learning */
Xt+1 ←Xt ∪{anew}
end if
超级会员免费看
订阅专栏 解锁全文
551

被折叠的 条评论
为什么被折叠?



