昨天雷锋网报道了一篇名为《DeepStack:无限下注扑克里的专家级人工智能》(DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker)的论文,这篇论文提出了一种名为DeepStack的新型算法,并称“DeepStack 成为了世界上第一个在一对一无限注德州扑克上击败了职业扑克玩家的计算机程序”。
在之前的文章中,雷锋网提到这种“一对一无限注德州扑克”就是两个人玩的赌博游戏,因为事先会给每位玩家分发2张底牌,所以对方“底牌信息”你是不知道的,对于计算机来说,就是在处理一种“非完整信息博弈”。我们知道AlphaGo玩围棋,对弈双方的信息是完整的、对称的,并没有隐藏的信息。所以在德州扑克上AI取得了进步,是具有重要意义的。
然而,这个世界上,有很多顶级实验室都在试图攻克德州扑克这种“非完整信息博弈”难题,卡耐基梅隆大学(CMU)的Tuomas Sandholm教授所在的实验室就是代表,几年之前,CMU和Alberta两只团队都一直在这个问题上你追我赶。
巧的是,CMU几天前就放出预告,将要在美国当地时间1月11日进行一场“人机大战”:CMU的Libratus人工智能系统,将在宾夕法尼亚州匹兹堡的 Rivers 赌场,与四个顶级职业玩家玩12万手的HUNL,并角逐20万美元的奖金。
显然,来自加拿大Alberta等大学的这篇DeepStack论文,抢在了CMU的前面。但这篇论文并没有被媒体广泛报道,有人评论道:媒体对于CMU“可能”做的事情大肆报道,而对于Alberta等大学“已经”做到的事情都不理睬。
被集体点名批评的外媒赶紧在第二天对本篇论文做了报道,不过《The Verge》做的更多,他们联系到了CMU的Tuomas Sandholm教授,显然对于被抢先一步,Sandholm教授是不服气的。
(Tuomas Sandholm教授本人)
他在邮件采访中回复道:“他们的系统并没有跟顶级的人类玩家对抗,所以不能说是打败了人类”,在一个德扑论坛上也有人发出同样质疑。Sandholm教授接着说:“我们本可以在2年前就像这样干,当时我们有一个系统可以跟最好的人类选手达成平局。但这并不是我们的目标。我们的目标,从来都不是专家级的AI,而是像深蓝和Watson一样的超人级AI”。
不知道DeepStack论文作者们听到这样的“怼”话会作何感想,雷锋网并没有在Twitter上搜到这些论文作者的账号信息,也无从得知他们的观点。总之,明天我们就能看到CMU的AI系统的“人机对战”盛况,我们一起坐等观战吧。
对于DeepStack论文感兴趣的读者,可以猛戳:CMU风头被抢,新型DeepStack算法抢先攻克德州扑克图灵测试