人工智能攻占扑克领域

观察者网
摘要:历经20多天的鏖战,4名顶尖德州扑克选手有些落寞:终于还是输了。
新华社2月2日报道,这一次,击败他们的“赌神”是美国卡内基·梅隆大学开发的人工智能“Libratus”。这标志着人工智能以及计算机学习领域的又一重大里程碑。

顶尖扑克玩家输给了人工智能Libratus
每天近11小时的比赛后,人类选手仍不顾疲惫讨论第二天的策略,但人工智能似乎能猜透他们的心思。每当他们欣喜若狂地发现人工智能的策略漏洞,这一漏洞在下一天就会被填补。
美国匹兹堡的一家赌场这次成为“人机大战”的最新战场,“Libratus”在那里与4名人类选手共玩了12万手一对一不限注的德州扑克。比赛从1月11日持续到30日,结束时,人工智能领先人类选手共约177万美元(约合1216万人民币)的筹码。
今年早些时候,加拿大艾伯塔大学和捷克两所高校的研究人员开发的人工智能“DeepStack”已首次在一对一无限注德州扑克中击败人类职业玩家。
过去20多年,国际象棋、中国象棋、拼字游戏、围棋……人们心情复杂地见证了人工智能步步攻陷人类智慧的堡垒。不过,又是下棋又是打牌,难道人工智能就只会玩耍吗?
其实,正如益智游戏有利于儿童成长,棋牌类游戏是帮助人工智能“开发智力”的手段而不是目标。不同的游戏对人工智能提出了不同的技术挑战。
两度出手皆获胜的“阿尔法围棋”,是要培养人工智能基于复杂信息的决策能力。一盘围棋游戏约有10的170次方个决策点,是所有棋类游戏中最多的,需要具有极大计算能力的人工智能,通过预测所有未来步骤的胜率来决策。

围棋是一种“完美信息”博弈,信息完全公开,玩家可以看到棋盘上的棋子,并预测落子可能性。而德州扑克玩家手中的底牌是其他玩家看不到的,因此是“不完美信息”博弈,要求更复杂的推理能力,对人工智能更具挑战。
据华盛顿邮报报道,此次人工智能的获胜的重要意义正在于扑克的这一复杂性。扑克超越了数字以及模式方面的挑战。人工智能需要从“诈唬”,“慢打”和其他手法中的“不完整信息”中,获取有用信息。
据新华社消息,要想玩好德州扑克,人工智能得懂点心理学。德州扑克中有一经典策略——诈唬,即在手握弱牌时依然虚张声势地加注,以吓退对手。对手是不是在诈唬?自己要何时诈唬还不被识破?这些都为编写人工智能程序提供了挑战。
德州扑克“人机大战”中也有人工智能不堪回首的历史。据雷锋网报道,2015年,卡内基·梅隆大学曾组织了首场“大脑对抗人工智能”赛事,同样也有4名职业扑克玩家参加了比赛。该大学开发的一个较早版本的人工智能“Claudico”在2015年的比赛中输给人类选手。
不过卡内基·梅隆大学认为,当时扑克职业玩家与“Claudico”仅进行了8万手牌的比赛,就统计学角度来讲并无法证明人类职业扑克玩家或人工智能具有优势。这也是本轮巡回赛中比赛的牌局数量增加50%的原因。不过,除此之外,此次卷土重来的“Libratus”还靠什么成功“复仇”?
其实,“Libratus”的名字隐含了它胜利的秘诀,这个拉丁文词语的含义是“均衡”,代表着程序所用到的均衡博弈。奥斯卡获奖影片《美丽心灵》的主人公原型约翰·纳什在20世纪50年代提出“纳什均衡”理论,又称为非合作博弈均衡,保证使得同一时间内每个参与者的策略是对其他参与人策略的最优反应。
德州扑克是“不完美信息”博弈,无法像下围棋一般计算所有下一步的可能性来决策,研究人员便改进人工智能的算法,让其应用均衡博弈,通过平衡风险与收益来决定下一步,以达到纳什均衡定义中的完美状态。此外,研究人员还升级了人工智能的计算能力。
据华盛顿邮报报道,机器学习技术依然是人工智能在近年来进步神速的关键。报道称,“Libratus”中有一个子集,为微计算机提供学习能力,而无需特定的编程。
开发者说,他们并未教“Libratus”如何打扑克,只是告诉它扑克的规则,让它通过几万亿次的自我对战寻找到获胜策略。在比赛日的每个晚上,开发者还会将其与匹兹堡的超级计算机联网改进算法,这也是它总能在人类对手制衡自己之前抢先一步的原因。
与之对战的4位扑克顶尖玩家则亲眼见证了这一惊人的学习能力,人工智能一天天变得更聪明,更少出错,和他的对弈就像是和一位每天都变得更强、更壮的拳击手展开决斗。
“它从我们这学到(技巧),并且在第二天它的弱点就会消失”,一位参加对战的扑克选手表示。
除了在牌桌上赢得风生水起,掌握博弈论的人工智能在现实生活中也大有用武之地,如金融交易、拍卖、政治和商业谈判、军事或网络安全策略以及规划医疗方案等。以后,凡是需要基于“不完美信息”作出战略决策时,人工智能都可能给出最优解。
本文著作权归观察者网所有,如有侵权,请联系新浪新闻客户端。
网友热议——
@李开复 (企业高管):
又一个人工智能里程碑。。。虽然这只是一对一,但是估计一年内可在任何场景战胜人类(如果比赛时间够长)。
@王小山 (作家):
前天人工智能打败了四个人类德州扑克高手,但这也只是个开始,因为这次是人工智能跟四高手分别headsup,也就是单挑。要想在多人桌(比如九人桌或者六人桌)德扑竞技中打败人类,人工智能还有很长的路要走,我想至少得两到三年,这事比围棋复杂太多了。但是,人工智能击败德扑高手,这是早晚的事。BUT,人工智能可能一辈子也打不过北京工体附近几家俱乐部里的玩家……因为人工智能想赢,总是需要套路的,而我们,哼哼,根本没有套路,整天瞎抡,胡鸡巴打,看你咋整?yeah!
@燃烧冷焱(微博网友):
说白了,德州扑克是一个数学概率论再加心理学的学科,概率上人算不过计算机,心理上人家完全没有波动,你能赢是出鬼了。
@烟雨江南(微博网友):
我坚信中国麻将是任何机器无法战胜的,它是中华五千年的智慧结晶,你要赢牌?我放炮总可以吧!
@void(微博网友):
扑克跟棋类游戏不一样。下棋AI是知道整个棋盘的,但是打扑克AI是不知道对手的牌的。AI下棋的机理在于通过搜索算法,穷举各种情况,在所有情况中找到最优落子点;但对于扑克,这一套就行不通。
@江苏货架(微博网友):
阿尔法狗的最终目标应该是在战场上的,通过密密麻麻的外部信息加上敌人信息可以找到对面最薄弱的点,最佳的防守地点,最好的进攻方式。
延伸阅读
这一年,人工智能领域的思考
“2016年对人工智能来说是意义非凡的一年,或许在技术领域的感知并不明显,在商业层面的‘成功’却是前所未有的。”