首页 / 资讯中心 / 趋势研究/一座新的里程碑——人工智能在6人德州扑克中获胜

一座新的里程碑——人工智能在6人德州扑克中获胜

发布时间:2019-07-17 分类:趋势研究 来源:科技日报

据美国《新闻周刊》网站近日报道,美国科学家开发出一种新的人工智能(AI)程序“合众为一”(Pluribus),其在6人无限制德州扑克比赛中击败了6名全球顶尖选手。研究人员认为,这是人工智能发展史上的一座里程碑,未来有望应用于生物医学、安全等领域。研究发表于12日出版的《科学》杂志。

Pluribus由Facebook人工智能实验室和卡耐基梅隆大学的研究人员携手完成。在游戏中,Pluribus和职业选手共进行了10000手扑克牌比赛。在一种情况下,人工智能面对5名人类选手;在另一种场景中,5个版本的人工智能与一名人类选手对决(AI没有相互配合)。研究人员发现,Pluribus的表现明显优于人类。他们认为,这是“决定性的胜利”。

研究报告共同作者、卡内基梅隆大学计算机科学教授托马斯·桑德霍尔姆博士素有“德州扑克AI之父”的美誉,他表示:“在AI领域(至少自1970年以来)和博弈论领域(至少从1950年开始),扑克是测试非完美信息游戏解决能力的主要基准。”

桑德霍尔姆解释说,人工智能已经在国际象棋、跳棋、围棋、双人限制和双人无限制扑克等双人零和游戏中击败了人类。在双人零和游戏中,只能有一方可以获胜,用博弈论的术语来讲,这些人工智能所做的都是在找到一个接近纳什均衡的策略。所谓纳什均衡策略就是指一系列能够使自己预期收益最大化的策略。但由于六人游戏规模大,人数多,上述办法很难扩展到六人游戏。

因此,研究人员需要找到一种方法来摆脱纳什均衡,桑德霍尔姆解释道:“这种策略计算起来要困难得多,但最新算法‘强大且可扩展’,最新胜利‘是AI在多玩家游戏领域的第一个里程碑’。”

桑德霍尔姆表示,这一研究所涉及的战略推理技术未来有望在多个领域“大显身手”,从扑克、视频游戏到投资银行的战略优化、政治运动等,不一而足,其还可以引导进化和生物学适应——例如医疗计划和合成生物学等。此外,该技术还可用于电子战、安全领域等。

结语

谷歌的“阿尔法狗”在围棋对弈中大败李世石后,有人指出:别着急,人工智能还没打赢多人德州扑克呢。能在一对一的博弈中获胜,确实是人工智能的重要成就。不过,现实生活中很多竞争场景并非双人对决,而是多人参与,股票投资、职位竞选、招投标活动等等就是如此。因此人工智能在6人德州扑克中获胜,是一座新的里程碑。在此基础上,人工智能有可望为多人竞争的更为复杂的现实场景,提供最优解决方案,从而胜任更多任务。