星际争霸2 AI 开发探索与展望

      

     《星际争霸》的国服重置版正在预售中,将在暑假期间登陆战网。今年是星际争霸发行20周年,这20年间RTS即时战略游戏从兴起到没落,在游戏届的地位已经大不如前。这其中的一个原因是它的高度复杂性,从宏观的战略,到微观的操作,需要考虑并迅速做出反应的点太多太多。这样的特点使得星际看的人多玩的人少,但却恰恰适合征服围棋后的AI来一展身手。当2016年AlphaGo击败李世石后DeepMind宣布进军星际2,众多媒体纷纷发文:既围棋之后,电子竞技也要被AI征服了。而到了2017年,DeepMind联合暴雪发布了星际2的机器学习环境SC2LE和PySC2,使得广大研究者都可以参与到这项挑战中来,但另一方面也说明了AI征服星际绝非易事。

      SC2LE,即StarCraft II Learning Environment(地址附于文末),星际争霸2学习环境,它提供了完整的API接口来从外部对一局星际2游戏进行控制。并且还包含录像分析工具,可以把一局比赛中玩家的指令集依次提取出来。在windows、mac、linux上,SC2LE都有相应客户端。而PySC2,则是DeepMind基于SC2LE开发出的python组件,使得研究者可以更方便的使用python编写星际2的强化学习程序。并且PySC2中还额外包含7个小游戏(地图),分别是坐标寻路、寻找收集矿物、寻找消灭跳虫、枪兵vs蟑螂、枪兵vs毒爆跳虫、采集矿物和瓦斯、建造枪兵以降低学习的难度。PySC2的安装很简单,安好星际2游戏后使用pip工具运行pip install pysc2就行了,详见文末链接。

      AlphaGo在围棋上之所以能表现的如此完美,根本原因自然是近年来卷积神经网络的进步和计算机性能的不断提升。但另一方面,围棋本身的简洁也很重要。虽然所需计算量很大,可围棋的规则和输入输出却非常简单。而星际2的输入输出呢?让我们来看看PySC2中是怎么定义的。输入共12种,可分为4类:

1. 游戏信息。

      游戏画面信息。这类似围棋的棋盘输入,是最主要的输入信息。画面大小默认为84*84,分为13个子项。分别为:地形高度,地图可见性,是否有虫族菌毯,是否在己方神族水晶塔范围内,单位所属玩家ID,单位所属玩家与己方关系,单位类型,单位是否被选中&

评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值