继围棋之后,人工智能又瞄准了德州扑克

卡耐基梅隆大学的Libratus及加拿大的DeepStack两大AI系统,在无限制德州扑克中挑战人类顶级选手。DeepStack近期在一对一比赛中胜出,而Libratus正发起新的挑战,目标实现超人水平。
部署运行你感兴趣的模型镜像

(点击上方蓝字,可快速关注我们)

来源:腾讯科技,

tech.qq.com/a/20170112/000095.htm

上周由卡耐基梅隆大学(CMU)开发的“Libratus”人工智能(AI)系统将开始一场新的挑战:试图在一对一、无限制投注的“无限注德州扑克”(No-Limit Texas Hold'em)比赛中挑战人类顶级职业玩家,获胜者将获得20万美元的奖金。

卡耐基梅隆大学研究人员表示,希望Libratus最终能够赢得比赛,这样他们就可以首次向全世界宣布:人工智能又攻克了德州扑克,首次战胜人类冠军。但同时,卡耐基梅隆大学的竞争对手又表示不服。

0?wx_fmt=jpeg

加拿大阿尔伯塔大学、捷克布拉格查理大学和捷克理工大学的研究者近日联合发表论文称,其所研发的人工智能系统已经在德州扑克比赛中达到了专家级水平。因此,他们的人工智能系统才是第一个战胜人类的。

需要指出的是,该论文尚未经过“同行评议”,因此目前尚不可尽信。但基于这支团队的历史成就,他们声称的结果绝非空穴来风。

2008年,几乎由同一批研究人员组成的一个团队开发了出了一套系统,首次在有投注限制的“有限注德州扑克”(Limit Texas Hold'em)比赛中战胜人类高手。2015年,该团队又完成了对该系统的升级,并称已接近完美。

阿尔伯塔大学研究人员在论文中称,他们开发的这套系统使用了一种名为“DeepStack”的通用算法,近期在“一对一无限注德州扑克”(Heads-up No-Limit Texas Hold'em)比赛中战胜了人类。

2016年11月7日至12月12日,DeepStack共与33位人类选手在互联网上进行了44852手较量。比赛结果显示,DeepStack的平均赢率为492mbb/g。DeepStack团队称,一般人类玩家到50mbb/g就被认为拥有较大优势,而750mbb/g就是对手每局都弃牌的赢率。

但是,帮助卡耐基梅隆大学设计Libratus人工智能系统的托马斯·桑德霍姆(Tuomas Sandholm)教授称:“DeepStack并未战胜顶尖高手,因此还不能说它已经战胜了人类。”

桑德霍姆还称:“我们两年前已经达到他们的水平了,但那不是我们的目标。我们的目标从来就不是‘专家级’,而是‘超人水平’,就像‘深蓝’和‘沃森’那样。”

到目前为止,无论是在“有限注德州扑克”,还是“无限注德州扑克”比赛中,人工智能系统只能应对“一对一”的比赛。而在多人(五人或更多)同时比赛中,其复杂性仍是人工智能目前所难以应付的。但不管怎样,这些比赛结果表明,至少有两套人工智能系统又要创造新的里程碑。

DeepStack研究人员称,德州扑克是一种典型的非完整信息游戏,因为你不知道竞争对手的牌,也不知道下一手牌是什么。因此,对于人工智能而言,其复杂性要超过象棋。而DeepStack是一种可用于一个很大类别的序列非完整信息博弈的通用算法,它所取得的成绩表明,人工智能系统已经精通非完整信息游戏。

与谷歌的AlphaGo一样,Libratus和DeepStack并不试图解决整个比赛的所有问题,因为这需要考虑到太多的可能性。相反,这两套人工智能系统利用深度学习来培养一种直觉。DeepStack研究人员称:“在比赛之前,DeepStack不会计算和存储完整的战略,而是使用一种快速的‘近似估算’法,我们称之为‘直觉’。”

如果人工智能这一次能在德州扑克比赛中能战胜人类高手,则意味着研究人员可以利用这套技术来解决日常生活中的一些实际问题,尤其是涉及到非完整信息的一些问题,如商务谈判。在谈判中,双方都会隐藏一些信息。

参与Libratus研发的卡耐基梅隆大学博士生诺姆·布朗(Noam Brown)称:“在现实世界中,信息不可能像棋盘上的棋子那样整洁有序,总有一些重要信息被丢失或隐藏,而人工智能需要有能力来处理这个问题。”(编译/谭燃)

觉得这条资讯有帮助?请转发给更多人

关注 技术最前线 看 IT 要闻

640?wx_fmt=png

您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

Stable-Diffusion-3.5

图片生成
Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型,相比 3.0 版本,它提升了图像质量、运行速度和硬件效率

【无人机】基于改进粒子群算法的无人机路径规划研究[和遗传算法、粒子群算法进行比较](Matlab代码实现)内容概要:本文围绕基于改进粒子群算法的无人机路径规划展开研究,重点探讨了在复杂环境中利用改进粒子群算法(PSO)实现无人机三维路径规划的方法,并将其遗传算法(GA)、标准粒子群算法等传统优化算法进行对比分析。研究内容涵盖路径规划的多目标优化、避障策略、航路点约束以及算法收敛性和寻优能力的评估,所有实验均通过Matlab代码实现,提供了完整的仿真验证流程。文章还提到了多种智能优化算法在无人机路径规划中的应用比较,突出了改进PSO在收敛速度和全局寻优方面的优势。; 适合人群:具备一定Matlab编程基础和优化算法知识的研究生、科研人员及从事无人机路径规划、智能优化算法研究的相关技术人员。; 使用场景及目标:①用于无人机在复杂地形或动态环境下的三维路径规划仿真研究;②比较不同智能优化算法(如PSO、GA、蚁群算法、RRT等)在路径规划中的性能差异;③为多目标优化问题提供算法选型和改进思路。; 阅读建议:建议读者结合文中提供的Matlab代码进行实践操作,重点关注算法的参数设置、适应度函数设计及路径约束处理方式,同时可参考文中提到的多种算法对比思路,拓展到其他智能优化算法的研究改进中。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值