28、多智能体强化学习中的混合合作竞争游戏实践

落叶知秋263

于 2025-08-27 10:07:38 发布

阅读量29

点赞数

CC 4.0 BY-SA版权

分类专栏：深度强化学习实战指南文章标签：多智能体强化学习混合合作竞争游戏 Gridworld

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ansible6ops/article/details/151169615

深度强化学习实战指南专栏收录该内容

36 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

多智能体强化学习中的混合合作竞争游戏实践

在多智能体强化学习领域，游戏场景是测试和验证算法的重要途径。不同类型的游戏具有不同的特性，如合作型、竞争型以及混合合作竞争型。下面我们将详细探讨如何利用一个基于Gridworld的开源游戏来实现混合合作竞争场景的多智能体强化学习。

1. 游戏类型概述

纯合作游戏 ：以Ising模型为例，所有智能体具有相同的目标，当它们共同朝着同一方向行动时，奖励达到最大化，这是一种纯合作的多人游戏。
纯竞争游戏 ：像国际象棋，一方获胜则另一方失败，是零和游戏，属于纯竞争类型。
混合合作竞争游戏 ：如篮球、足球等团队游戏，同一团队的智能体需要合作以最大化奖励，但团队之间是竞争关系，一方团队获胜则另一方失败。

2. 环境搭建

我们使用基于Gridworld的开源游戏，专门用于测试多智能体强化学习算法在合作、竞争或混合合作竞争场景中的性能。在这个场景中，设置了两个团队的Gridworld智能体，它们可以在网格中移动并攻击对方团队的智能体。每个智能体初始有1点生命值（HP），受到攻击后HP逐渐减少，降至0时死亡并从网格中移除，攻击并杀死对方团队智能体可获得奖励。

以下是搭建环境的具体步骤和代码：

import magent 
import math
from scipy.spatial.distance import cityblock

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。