繼象棋之后 人機大戰(zhàn)為何選中圍棋?
問凝
關(guān)于人機大戰(zhàn),早在1997年,一臺叫做“深藍”的超級計算機在國際象棋上下贏了國際象棋冠軍卡斯帕羅夫。“深藍”是一臺超級計算機,雖然跟人工智能程序Alpha Go好像不是同一回事,但是其實人工智能程序也需要以計算機作為載體才能工作,就像大腦也需要有身體才行。因此,把它們放在一起比較并不奇怪。而隨著超級計算機技術(shù)的不斷發(fā)展,即使是今天最普通的集成顯卡的性能也超過了700GFLOPS。“深藍”已經(jīng)從逐漸跟不上腳步到被甩開了一大截。值得一提的是,世界上最快的超級計算機是我們國家的天河2號,其性能達到了33.86PFLOPS,是“深藍”計算機的30萬倍。
那么,跟“深藍”計算機相比,谷歌Alpha Go的性能又怎么樣呢?此前谷歌曾經(jīng)在《自然》雜志上發(fā)表過關(guān)于這個人工智能系統(tǒng)的文章,其中稱,Alpha Go人工智能的計算機裝有48個CPU和8個GPU。我們似乎無法將兩者放在一起直接比較,因為Alpha Go是在云計算平臺上運行的,我們可以通過競爭對手的計算機數(shù)據(jù)來進行大概的比較,比如阿里云。
2015年12月,阿里云對外開放高性能計算服務(wù)。這些計算機的單機浮點運算能力是11TFLOPS。如果谷歌的計算機性能與阿里云接近的話,那么Alpha Go所驅(qū)動的硬件的性能至少是深藍的1000倍。
說起圍棋和人工智能,我們可能多少都了解一些,不過二者是怎么聯(lián)系到一塊的呢?
那是因為機器戰(zhàn)勝人類,一個關(guān)鍵就是圍棋。擁有悠久歷史的圍棋高度反映了人類的智慧,圍棋棋盤縱橫19道,361個交叉點,涉及到的可能出現(xiàn)的局面數(shù)量最大可達3^361,大致的體量是10^170,而已經(jīng)觀測到的宇宙中,原子的數(shù)量才10^80,國際象棋最大只有2^155種局面,這是什么概念?看似簡單的縱橫19道,361個交叉點,形成了浩瀚的宇宙。所以有人說,圍棋是體現(xiàn)人類智慧的最好游戲,之前還有人預(yù)測,人工智能(AI)需要再花十幾年才能戰(zhàn)勝人類,所以若拋去商業(yè)元素,這場比賽的意義可能在于見證歷史,足以說明當(dāng)前人工智能的技術(shù)研究已經(jīng)達到新高度。
AI下圍棋,究竟有多難?
難點1:圍棋對弈的基礎(chǔ)是死活的確認(rèn),確定棋盤上一塊棋的死活是最基本的,但要搞清楚一塊棋是死是活是非常困難的,而且,這種似死似活的狀態(tài)又是在不斷變化的。研究局部死活搜索是AI圍棋發(fā)展的一個難點。
難點2:棋形體現(xiàn)著人類形象思維獨有的特性,棋手對棋形的感覺完全依賴于自身的經(jīng)驗,而這種感覺恰恰是勝負(fù)的關(guān)鍵,也是棋手水平高低的標(biāo)志。人類棋手不愿意浪費自己的棋子去無謂地攻擊對方活的棋形或無謂地試圖挽救自己死的棋形,要賦AI這種對棋形的感覺,則是人工智能面臨的重要課題。
難點3:此外,還需要研究特殊的算法來解決快速識別問題,著名的電腦圍棋程序設(shè)計者布恩說過: “有了快速的模式識別方法,就不難教程序利用手筋來吃棋。”所以說,模式識別算法是圍棋博弈程序的重要組成部分,高效的模式識別算法反映著博弈程序的水平,當(dāng)電腦的模式識別技術(shù)發(fā)展到能與人腦匹敵時,電腦圍棋的棋力離專業(yè)九段就不遠了。
簡單來說,一方面,圍棋規(guī)則非常復(fù)雜,每一步的調(diào)整,都會產(chǎn)生更多的可能,這對機器的計算能力要求很高。另一方面,即使機器中存儲了足夠多的已有圍棋大戰(zhàn)數(shù)據(jù),由于圍棋規(guī)則的復(fù)雜程度和棋手的無法預(yù)測的落子,對機器的應(yīng)變能力或深度學(xué)習(xí)能力有更高的要求。
4.下圍棋這么復(fù)雜,AI靠什么取勝?
上面說的那么難,難道AI就沒機會取勝了?NO NO NO~
為了擊敗人類,研究者們拿出了大殺器——這就是人工智能領(lǐng)域新一代的機器學(xué)習(xí)(machine learning)形式——深度學(xué)習(xí)(deep learning)和強化學(xué)習(xí)(reinforcement learning)。
深度學(xué)習(xí)的概念換句話說,就是讓計算機像人腦一樣去學(xué)習(xí)和思考。和傳統(tǒng)的機器學(xué)習(xí)不同,深度學(xué)習(xí)是把計算機科學(xué)和人類的神經(jīng)學(xué)結(jié)合起來,讓計算機自主學(xué)習(xí)。比如,不是由人告訴計算機這是一只貓,然后讓它來進行識別和印證。而是給計算機提供大量的圖片數(shù)據(jù),讓它自己學(xué)習(xí)和分析,然后自主形成“貓”的概念,就像人類大腦的視覺皮層那樣反應(yīng)。有了具備深度學(xué)習(xí)能力的人工智能系統(tǒng),以后駕車出行時,汽車就能主動提醒你周圍的路況,還能應(yīng)用于語音和臉部識別、醫(yī)療診斷等領(lǐng)域。
強化學(xué)習(xí)一詞來自于行為心理學(xué),這一理論把行為學(xué)習(xí)看成是反復(fù)試驗的過程,從而把動態(tài)環(huán)境狀態(tài)映射成相應(yīng)的動作。它類似于傳統(tǒng)經(jīng)驗中的“吃一塹長一智”,強化學(xué)習(xí)可以做出策略選擇,廣泛應(yīng)用于下棋、走迷宮這一類別中。這種依賴于大數(shù)據(jù)和強大計算能力的被稱為“深度學(xué)習(xí)”的無監(jiān)督或半監(jiān)督機器學(xué)習(xí),使計算機可以在無需人力參與的情況下,完成原本只有經(jīng)過高度專業(yè)化訓(xùn)練的專業(yè)人士才能完成的任務(wù),甚至超過專家。
另外,為了達到更高的運算能力,谷歌還把Alpha Go接入到了一個有1202個CPU組成的網(wǎng)絡(luò)中。這使得這個人工智能系統(tǒng)的計算能力在原來的基礎(chǔ)上增加了24倍。經(jīng)過推算,Alpha Go的性能大約是深藍計算機的2.5萬倍左右。按這個節(jié)奏計算,假如人類一年能玩1000局,AI一天就可能玩100萬局。所以Alpha Go只要經(jīng)過了足夠的訓(xùn)練,還是有可能擊敗人類選手。畢竟,人類在長時間的下棋比賽后,由于生理和心理限制可能會疲累,進而犯錯,但機器不會。
不過谷歌董事長施密特表示,即使機器真的贏了,人類仍是贏家。即使AlphaGo機器最終贏了李世石,對于人工智能是否會“碾壓”人類,依然存疑,我們不必過于焦慮,人工智能可能還有很長的路要走。
歷史上的人機大戰(zhàn)
①深藍戰(zhàn)勝卡斯帕羅夫
1997年,美國IBM公司的“深藍”超級計算機深藍以二勝一負(fù)三平的戰(zhàn)績戰(zhàn)勝了當(dāng)時世界排名第一的國際象棋大師卡斯帕羅夫,成為贏家。
②浪潮天梭挑戰(zhàn)人類象棋大師
2006年的浪潮天梭超級計算機,挑戰(zhàn)人類象棋大師一役,在最終的巔峰對決中,許銀川與浪潮天梭兩戰(zhàn)皆和。浪潮天梭向世人證明了自己超強的運算能力。
③全才學(xué)霸沃森挑戰(zhàn)人類
2011年,“深藍”的同門師弟“watson”(沃森)在美國老牌智力問答節(jié)目《危險邊緣》中挑戰(zhàn)兩位人類冠軍,并獲得成功。
④Alpha Go以5:0完勝歐洲冠軍樊麾
2016年1月,美國谷歌公司旗下的人工智能(AI)開發(fā)商“DeepMind”(位于英國)研發(fā)的圍棋電腦軟件“AlphaGo”(阿爾法圍棋)打敗了職業(yè)棋手樊麾,開創(chuàng)全球先河。
進入21世紀(jì)后,科學(xué)研究從大數(shù)據(jù)、人工智能到虛擬現(xiàn)實,從發(fā)現(xiàn)了類地球行星、引力波到無人駕駛、量子計算,這是一個創(chuàng)新不斷、驚喜不斷的時代,而我們有幸參與其中,這也許比單純討論比賽輸贏更有趣。