侵权投诉
焊接机器人 喷涂机器人 搬运机器人 装配机器人 切割机器人 其它机器人
订阅
纠错
加入自媒体

德扑人机大战收官 世界顶尖扑克选手被击败

2017-02-06 14:21
Radow
关注

当地时间 1 月 30 日,在宾夕法尼亚州匹兹堡的 Rivers 赌场,卡耐基梅隆大学(CMU)开发的 Libratus 人工智能系统击败人类顶级职业玩家。这次比赛共持续 20 天,4位德州扑克 1 对 1 顶尖高手一起同电脑进行 了12万局无限制德州扑克对决。

比赛过程中,人类选手整体上从未领先过。进入比赛最后一天时,Libratus 赢得156 万筹码。人类选手要挽回劣势,只有不到 5,000 手的机会。


与 Libratus对抗中的德扑专业选手 Jason Les

Jason Les 说,最后的感觉就是,自己所能做的就是输,这太打击士气了。

另一个选手Jimmy Chou 回顾比赛时说到,他和其他牌手此前完全低估了 Libratus 的能力。

“这个人工智能程序每天都在进步,在牌桌上,我们就像在面对加强版的自己。”

Libratus 是一个玩无限德州扑克的人工智能程序,它的策略并非基于专业玩家的经验,所以它的玩牌方式有明显的不同。基于在匹兹堡超级计算机中心大约 1500 万核心小时(core hours)的计算,它使用算法分析德扑规则,建立自己的策略。创造 Libratus 使用的算法并非为扑克专门设计的。在面临不完全或误导信息时,该人工智能进行推论的能力有着广泛的潜在应用,包括业务谈判、医疗、网络安全、竞拍等等。

为什么是扑克呢?

围棋被视为棋盘游戏的珠峰,其复杂程度远甚过其他游戏。不过,论挑战性,仍然稍逊扑克。

在真实世界中,扑克是一种有关不确定性的游戏 ——即不完整信息博弈。玩家并不知道其他对手手里的牌。也不清楚以后会有什么牌。在类似围棋或国际象棋的游戏中,所有玩家都可以看到棋盘。每个玩家的信息都是完整的。这使得围棋和国际象棋要比扑克容易玩得多。

比赛中的 Daniel McAulay

“在完整信息博弈中,计算机可以在决策树中进行分析,”CMU 教授 Tuomas Sandholm 解释道,他与自己的博士生 Noam Brown 共同开发了 Libratus 系统。在国际象棋和围棋中,人工智能可以通过预测所有未来步骤的胜率来思考自己的下一步。“然而在不完整信息博弈中,事情就变得复杂起来了,你不知道对面手握什么底牌,”Sandholm 解释道。“这意味着你不能在决策树的架构下选择下一步了。而且,你也不知道发牌员在 flop、turn 和 river 上发出的下一张牌是什么。”

1  2  下一页>  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号