麻將才是人類智慧最后尊嚴(yán)? 阿法狗你敢比運(yùn)氣嗎
數(shù)月前,圍棋項(xiàng)目作為變數(shù)最大、可能最多的棋類項(xiàng)目被當(dāng)作人類的最后一道智能防線,被推上和人工只能前沿與阿爾法狗(AlphaGo)進(jìn)行對(duì)決時(shí),全世界都沒(méi)能料到,被視作人類智慧驕傲的李世石竟會(huì)一敗涂地,慘敗而歸。
越來(lái)越多的項(xiàng)目被人類找尋出來(lái),他們?cè)噲D找到人工智能無(wú)法攻克的堡壘,德州撲克、電子競(jìng)技、乒乓球……終于,連麻將也被提及了:在麻將世界里,人類現(xiàn)在尚可與機(jī)器一戰(zhàn)嗎?面對(duì)這個(gè)問(wèn)題,
涂少博和和俞玉奎兩位高手也感到無(wú)從回答起,因?yàn)樗麄兊牡谝环磻?yīng)是:在麻將世界里人機(jī)對(duì)戰(zhàn),和圍棋的一對(duì)一PK根本是兩回事。
阿爾法狗,你敢和人類比運(yùn)氣嗎?
涂少博,2015年方莊聯(lián)賽年度冠軍、2015年騰訊麻將錦標(biāo)賽亞軍;俞玉奎,2012年世界麻將錦標(biāo)賽團(tuán)體賽冠軍、2015年方莊聯(lián)賽年度第3。他們都是公認(rèn)的麻將高手,可在他們的評(píng)價(jià)體系里,這和圍棋對(duì)弈簡(jiǎn)直有著天差地別:相對(duì)于圍棋的雙人博弈,當(dāng)面鑼對(duì)面鼓,麻將不僅是四人對(duì)陣,更重要的是相對(duì)于圍棋,麻將的定位是非完全信息動(dòng)態(tài)博弈,對(duì)手的手牌未知以及墻牌的隨機(jī)性都是無(wú)法預(yù)料的,這就造成了麻將三分運(yùn)七分技的棋牌類運(yùn)動(dòng)中獨(dú)樹(shù)一幟的特點(diǎn)。
運(yùn)氣是麻將的浪漫,是無(wú)法剝離的,和其他運(yùn)動(dòng)有著本質(zhì)區(qū)別的地方,這樣的浪漫時(shí)而殘酷,時(shí)而美艷,麻將無(wú)法脫離運(yùn)氣因素獨(dú)立存在。這種運(yùn)氣“浪漫”到什么程度?目前公認(rèn)國(guó)內(nèi)水平最高的,由天津市體育總會(huì)麻將運(yùn)動(dòng)分會(huì)舉辦的中國(guó)競(jìng)技麻將牌王賽,已經(jīng)歷時(shí)17屆,但從未產(chǎn)生過(guò)相同的冠軍,更別提衛(wèi)冕了,甚至有一屆比賽的冠軍竟是上屆比賽的最后一名。競(jìng)技麻將高手段昊在他的知乎回答中給出了他心目中一流高手的勝率預(yù)期:“假如一個(gè)牌手參加一個(gè)類似賽程的杯賽,他能有90%概率獲得前50%成績(jī),2%左右概率獲得前1%的成績(jī)(奪冠),那他已經(jīng)是一個(gè)超一流的牌手了?!币簿驼f(shuō)杯賽制冠軍并不完全說(shuō)明水平,運(yùn)氣異常重要,參加的比賽越多,奪冠的機(jī)會(huì)越高。
回到人機(jī)對(duì)戰(zhàn)的問(wèn)題,兩人幾乎異口同聲地回答:“你無(wú)法確認(rèn)一個(gè)合適的比賽樣本量去衡量勝負(fù)和水平高低。”,在一場(chǎng)類似阿法狗大戰(zhàn)李世石的5局3勝的比賽中,你派一個(gè)頂級(jí)競(jìng)技麻將高手很有可能輸給人工智能,而一個(gè)平時(shí)偶爾打打麻將的大媽完勝阿爾法麻將狗也不足為奇。一般來(lái)說(shuō),麻將需要2000手牌才能達(dá)到一個(gè)合適的推斷水平高低樣本量(2000手牌這一數(shù)據(jù)也選自段昊的知乎問(wèn)答),而打完2000手牌大概需要100小時(shí),這樣的人機(jī)大戰(zhàn)就實(shí)在太過(guò)冗長(zhǎng)枯燥了,并且,即使打完2000手牌的比分,就一定令人信服嗎?也未必。勝負(fù)的判定問(wèn)題是麻將人機(jī)對(duì)戰(zhàn)的最大難點(diǎn)。
真實(shí)世界里的人工麻將智能
另外麻將的AI難做嗎?做出來(lái)能像阿爾法狗那樣所向披靡嗎??jī)扇说幕卮鹗恰安缓谜f(shuō)”,因?yàn)椤袄碚撋喜浑y,但具體操作上還是比較麻煩?!?,目前對(duì)麻將AI的投入非常有限,而麻將復(fù)雜程度要遠(yuǎn)小于圍棋(麻將136張牌的數(shù)量變化為326520504500種,而圍棋的數(shù)量變化為2.08×10^170,基本不在一個(gè)數(shù)量級(jí)上),因此理論上制造麻將AI并不難。
目前比較強(qiáng)的麻將AI是日本麻將中的“暴打”(和阿爾法狗類似,具備自我對(duì)局和分析學(xué)習(xí)人類牌譜的能力),暴打自2015年在日本最大的麻將平臺(tái)天鳳麻雀上開(kāi)始運(yùn)行至今已經(jīng)打了1.3萬(wàn)多場(chǎng),完全復(fù)合對(duì)局樣本容量,而它的水平可以穩(wěn)定在天鳳六段(六段以上的用戶大約有5793人),比90%的麻將玩家要好,但也并未達(dá)到最頂級(jí)的水準(zhǔn)。但暴打只是一個(gè)課題組的力量,與阿爾法狗的投入天差地別。
具體到實(shí)際操作,制造麻將AI與制造圍棋AI有著很大的區(qū)別,麻將判定勝負(fù)規(guī)則的多樣,對(duì)手手牌的未知和牌墻的不確定性都比較復(fù)雜,這些都給AI制造了巨大的困難。比如“中、發(fā)、白”這三張牌在功能本質(zhì)上并無(wú)區(qū)別,AI或玩家隨便打出哪一張牌都不能算是失誤,但假設(shè)即將抓到的下一張是“中、發(fā)、白”里面的一個(gè)的話,你打出哪一張就會(huì)有區(qū)別,但無(wú)論是AI和人類玩家都無(wú)法準(zhǔn)確地做出預(yù)判,但圍棋就不存在類似的問(wèn)題,這就是上文中提到的不完全信息動(dòng)態(tài)博弈。
對(duì)于此前有人提到人機(jī)對(duì)戰(zhàn)時(shí)人類的一個(gè)眼神交流就可以讓阿爾法麻將狗輕松狗帶的問(wèn)題(或者三個(gè)阿爾法狗到底貴不貴的問(wèn)題),兩人也給出了自己的看法,俞玉奎表示:“這并不是需要參考的問(wèn)題,因?yàn)槿魏蔚娜藱C(jī)大戰(zhàn)或者智能AI,都不能以作弊為基礎(chǔ)的,否則如果AI可以透視麻將,這樣的對(duì)決將索然無(wú)味?!?/p>
人工智能不攻陷麻將只因沒(méi)有意義
事實(shí)上,在競(jìng)技麻將的比賽中,這種“保鏢型”打法的確存在,不過(guò)只有在利益共贏時(shí)才能實(shí)現(xiàn),并不多見(jiàn),涂少博回憶自己曾經(jīng)打過(guò)那么一次,但他絞盡腦汁也沒(méi)想起來(lái)還有沒(méi)有第二次,因?yàn)檫@樣的機(jī)會(huì)非常罕見(jiàn):比如四個(gè)人排位恰好是第1、2、3、4湊成一桌,第1和第2之間存在競(jìng)爭(zhēng)可能,第3與第4距離第1相差較大,沒(méi)有競(jìng)爭(zhēng)可能,此時(shí)第1可能會(huì)出現(xiàn)刻意給第3或第4“點(diǎn)炮”的現(xiàn)象,以謀求保住自己對(duì)于第2的領(lǐng)先優(yōu)勢(shì),這是競(jìng)技麻將中的策略選擇。
不過(guò)這也是極少發(fā)生的現(xiàn)象,因?yàn)楦?jìng)技麻將的牌局配對(duì)與順位安排比較合理,隊(duì)友出現(xiàn)在同一牌局的概率非常低(除了隨機(jī)抽,后面的幾局還會(huì)按照成績(jī)高低進(jìn)行排位和對(duì)局安排),另外這種犧牲小我,在最后的總成績(jī)積分統(tǒng)計(jì)中也很難成就大我,因?yàn)榫謹(jǐn)?shù)多,對(duì)局排位變化大,很難把一個(gè)人一路“?!钡焦谲?。
最后,兩位競(jìng)技麻將選手道出了自己內(nèi)心的真實(shí)想法,多少有些凄涼:“在麻將桌上的人機(jī)對(duì)決并沒(méi)有太大意義。如果說(shuō)圍棋代表人類智能的巔峰的話,麻將并沒(méi)有與之相當(dāng)?shù)牡匚??!钡拇_在社會(huì)評(píng)價(jià)體系中,它更像是一種老少咸宜的娛樂(lè),或者說(shuō)在賭博犯罪和棋牌競(jìng)技間游走的一個(gè)“高危玩物”,它沒(méi)有資格成為人類面對(duì)人工智能的最后堡壘,或者說(shuō)人工智能戰(zhàn)勝麻將并不說(shuō)明任何問(wèn)題,甚至毫無(wú)優(yōu)越感可以秀。如果說(shuō)阿爾法狗戰(zhàn)勝李世石(或者即便是輸給李世石),都可以得得廣泛的社會(huì)關(guān)注,贏得巨大的商業(yè)價(jià)值的話,那么如果谷歌以同樣的人力物力財(cái)力投入到阿爾法麻將狗的研發(fā),然后再進(jìn)行人機(jī)大戰(zhàn)的話,幾乎可以斷定會(huì)虧得找不到北。
人類對(duì)于智能AI的追求,核心就在于復(fù)制人類現(xiàn)有的能力,并不斷自我學(xué)習(xí),最終擊敗人類。一旦人類被智能AI擊敗,恐慌和迷茫會(huì)因此蔓延,但讓人類真正驕傲的是:當(dāng)一個(gè)傳奇人物的出現(xiàn),打出“反人類”的表現(xiàn),讓智能AI無(wú)所適從,將非??帷1热绠?dāng)下在籃球領(lǐng)域的庫(kù)里,他在運(yùn)動(dòng)戰(zhàn)攻防轉(zhuǎn)換中的干拔三分的命中率可以達(dá)到43%,這讓2K設(shè)計(jì)者們無(wú)所適從:這太變態(tài)了,臣妾做不到啊;如果非要強(qiáng)行做到的話,AI設(shè)計(jì)者們將親手毀了這款游戲。在這一點(diǎn)上,麻將選手相比其他棋牌運(yùn)動(dòng)員,更容易讓電腦AI無(wú)所適從。