快訊

【端傳媒】和機器人打撲克，4名人類頂尖選手20天輸了176萬美元

2017-02-02

16:48

職業撲克玩家 Jason Les 有份參與人機對決撲克錦標賽▲（圖／Carnegie Mellon University）

最新動態：

經過長達20天的角逐，人機對決撲克錦標賽（Brains vs AI poker tournament）日前在美國匹茲堡 Rivers 賭場落下帷幕，卡內基梅隆大學（CMU）人工智能（AI）程式 Libratus 一路高歌猛進，從4位人類頂尖撲克玩家處總共贏取約176萬美元籌碼。這代表在「不完全資訊」博弈中， AI 同樣技高一籌。

「以『不完全資訊』進行戰略推理方面，最好的人工智能已經超越了最好的人類。」－美國卡內基梅隆大學（CMU）計算機科學學院教授 Tuomas Sandholm

雖然迄今為止，被命名為 Libratus 的人工智能程式還只適用於撲克，但開發團隊希望在更多領域嘗試其能力，CMU 計算機科學學院的 Frank Pfenning 聲稱：「開發能夠玩好撲克的 AI 是科學的巨大進步，它的原理可以被用於許多方面。想像一下，未來您的智能手機將在您購買新車時幫你砍價……現在只是個開始。」

Libratus 基於匹茲堡超級計算機中心（PSC）的超級電腦 Bridges 運行。據 CMU 透露，Bridges 的每秒浮點運算次數達1.35千萬億次（1.35 Petaflops），約等於高端筆記本電腦的7250倍；其內存達274 TB（Terabyte，萬億字節，1TB = 1024GB），約等於1萬7500台普通筆記本電腦的總和。

在比賽過程中，由於 Libratus 能夠將其前一天所犯戰略錯誤在之後一天修正，所以有職業撲克玩家推測，CMU 研究人員會在比賽間隙的晚上手動修正程式。但 CMU 團隊的賽後新聞稿澄清了相關猜測：「每天比賽結束後，一個元算法會分析人類玩家在 Libratus 的戰略中發現與利用了什麼戰略漏洞，然後 AI 算法自主優先考慮修補位列前三的可被利用漏洞。」

不過目前大多數在線撲克玩家並不用擔憂 Libratus，因為該程式僅適用於「一對一無限注德州撲克」（Heads-up No-limit Texas Hold'em Poker）玩法，具有三位或更多玩家的玩法顯然會更為複雜，需要採用完全不同的策略與算法。

雖然經過20天的掙扎後，參與賽事的人類玩家輸給了 Libratus，但他們還是可以根據各自表現瓜分20萬美元的「獎金」。參與玩家之一 Jason Les 表示：「通常，為了獲取類似經驗你可能會損失掉很多錢，但在這裏，我至少沒有真正輸掉任何錢。」

1月12日報導：人機對決撲克錦標賽美國開幕，「不完全資訊」博弈人類能否技高一籌

2017年初，Google 人工智能系統 AlphaGo 橫掃人類頂級圍棋高手後，在喧囂中宣布「結束網絡測試」飄然而去。但人工智能與人類大腦的對決顯然不會就此結束，美國當地時間1月11日，人機對決撲克錦標賽（Brains vs AI poker tournament）在匹茲堡的 Rivers 賭場正式拉開帷幕，四位全球頂級職業撲克玩家與人工智能程式 Libratus 在為期20天的賽程裏，將以「一對一無限注德州撲克」（Heads-up No-limit Texas Hold'em Poker）玩法一決雌雄，並已在線上平台 Twitch 直播比賽進程。

但無論勝負結果如何，參與錦標賽的 Dong Kim、Jason Les、Jimmy Chou 和 Daniel McAulay 這四位人類職業玩家，將根據各自表現瓜分20萬美元的「獎金」；而被命名為 Liberatus 的人工智能程式如果能夠獲勝，則將像「深藍」（Deep Blue）與 AlphaGo 一樣青史留名。

「自人工智能開始研發以來，能否擊敗頂級人類玩家一直是驗證該領域進步程度的有效方式……但與其他遊戲相比，撲克是一種更困難的挑戰，因為它需要機器基於不完全資訊（Imperfect Information）做出極其複雜的決定。」－美國卡內基梅隆大學（CMU）計算機科學學院教授 Tuomas Sandholm

「在擁有完全資訊的遊戲裏，人工智能可以在諸多可能性中選定一組進行推演，」卡內基梅隆大學教授 Tuomas Sandholm 說，他與其博士生 Noam Brown 共同開發了 Libratus 系統，「然而用不完全的資訊進行遊戲博弈時，形勢要更加困難，因為人工智能不知道其他玩家擁有什麼牌，這意味着程式無法在決策樹（Decision tree）的架構下選擇確定的下一步。此外，人工智能也不知道接下來會是那些牌出現在桌面上。」所以人工智能無法像在玩國際象棋或圍棋時那樣，通過計算所有步驟的勝率做出最優選擇。

這是卡內基梅隆大學推出的第二場類似比賽，2015年時該校開發的人工智能程式 Claudico 在與 Dong Kim 等4位職業玩家的8萬手較量中最終告負。曾參與2015年賽事的 Dong Kim 表示，他在與人工智能的對戰中獲益良多，他確信這些經驗令他在面對其他人類玩家時擁有優勢。

而在此次比賽開幕之前的1月6日，由加拿大和捷克研究人員組成的一個團隊，搶先向學術論文預印本（Preprint）線上展示平台 arXiv 提交未定稿論文，稱在一項涉及到數十位參與者和4.4萬手撲克的研究中，他們開發的 DeepStack 成為世界上首個在「一對一無限注德州撲克」玩法中擊敗職業撲克玩家的電腦程式。但該論文尚未經過同行評審及正式發表，而 Tuomas Sandholm 教授認為他的這些同行們的人工智能系統「並沒有跟頂級的人類玩家對抗，所以不能說已經擊敗了人類」。