侵权投诉
焊接机器人 喷涂机器人 搬运机器人 装配机器人 切割机器人 其它机器人
订阅
纠错
加入自媒体

两大AI团队为德扑暗中较劲十年为哪般:争夺通用AI入场券

2017-03-04 08:57
FlappyBird
关注

当1997年国际象棋棋坛神话卡斯帕罗夫败给IBM的“深蓝”时,还没有多少人把该事件与人工智能这个概念联系起来。此后,历史见证了人类在各种游戏上的节节溃败。2017年新年伊始,先后有两个研究团队推出的人工智能成功击败了职业德州扑克选手。这在普通人眼里可能不如阿尔法狗击败世界围棋冠军厉害,毕竟比起围棋的“阳春白雪”,德州扑克是很多人能下场玩两把的游戏。但许多学者却把掌握德扑视为人工智能的里程碑事件。

《自然》杂志3月2日发表的一篇文章,就详解了这两个研究团队实现德州扑克算法的不同路径,并回答了几个大家关心的问题:以后人类是不是没得玩德扑了?玩坏了德扑,AI下一歩还要玩什么?两家德扑AI什么时候来比一场?

这两个研究团队,一个由美国卡内基梅隆大学(CMU)的计算机系教授托马斯桑德霍姆(TuomasSandholm)领衔,一个由加拿大阿尔伯塔大学、捷克的查尔斯大学和布拉格捷克理工大学合作。在过去十年间,两个团队一直在暗暗较劲着搞“军备竞赛”,都想研发出世界上第一个击败职业玩家的德扑AI。2015年,阿尔伯塔大学率先攻克了一对一限注德扑,先下一城,接下去双方的角逐点是一对一无限注德扑。

桑德霍姆为自家的Libratus早早安排好了一场德扑界的人机“华山论剑”,预先选出了他们团队心目中的人类高手Top4,邀请他们在1月11日到1月30日之间与Libratus进行共计12万手的一对一无限注德扑比赛。

不料就在匹兹堡大河赌场的这场巅峰对决开幕前夕,加拿大和捷克的联合团队抢先在预印本网站arXiv上载了一篇题为《DeepStack:无限注德扑的专业级人工智能玩家》的论文,介绍了他们团队的DeepStack,在与来自17个国家的33名职业选手的4万多手比赛中拔得头筹。

因此,Libratus虽然最终碾压了四名顶尖高手,“历史第一”的桂冠却惨遭截胡。桑德霍姆认为,Libratus的对手水平更好,交战回合数也更多,因而它的战绩更具含金量。

为什么AI研究者关心扑克?

扑克和AI之前攻克的国际象棋、围棋等棋类有本质上的不同,是一种更加复杂的“非完美信息”游戏。选手需要考虑对方可能持有的手牌,和对方猜测自己持有怎样的手牌。这种“非完美信息”游戏更好地模拟了现实生活中的谈判、金融交易等情景,正如计算机之父冯·诺依曼所说,“现实世界与此不同,现实世界包含有很多冒险、欺骗的战术,还涉及你会思考别人会认为你将做什么。”

现在人工智能已经在围棋、扑克等特定任务上媲美甚至超过人类,但我们最终追求的是能像人类一样适应现实生活中各种不确定性和完成各种任务的通用人工智能(GAI)。而德扑AI就是走向GAI的关键一步。

德扑算法的数学原理是什么?

博弈论是德扑算法的核心,即AI的目标是找到一个无论对方走哪一步,自己都不会产生损失的策略。在博弈论中,像一对一扑克这种零和游戏永远存在这样的最优解,就像在经典的博弈论模型“囚徒困境”中,招认罪行就是一个无论对方招认不招认都最优的策略。人类高手可能会利用对手的犯错来获得更大的利益,但对AI就毫无办法。因为AI只会按计算所得的最优策略决策,不受对手的干扰。

之前的扑克算法一般都是在庞大的“决策树”上提前推算出最优解。但一盘德扑涉及的可能性有10的160次方种,穷举法是不现实的。因此,研究者们往往会采用近似模拟的方法,把临场的局面与此前设定过的情况进行匹配,找到最近似的一种比以此决策。不过,在这种近似模拟的过程中,信息流失是不可避免的,因此此前开发出的德扑AI都不太理想。

而DeepStack和Libratus现在都找到了能和国际象棋和围棋AI一样进行临场计算的方法。

1  2  下一页>  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号