
李世石(右)與AlphaGo對(duì)弈,代替AlphaGo落子的是該人工智能程序研發(fā)團(tuán)隊(duì)成員。供圖/視覺中國(guó)
昨天全世界的目光都集中在韓國(guó)首爾四季酒店。世界圍棋冠軍李世石與谷歌人工智能程序AlphaGo的首場(chǎng)圍棋比賽,經(jīng)過近4小時(shí)的鏖戰(zhàn),李世石投子認(rèn)負(fù),人工智能獲得首輪勝利。雙方第二局比賽于今日打響。
【意外】
李世石沒想到會(huì)輸
經(jīng)過3小時(shí)40分鐘的鏖戰(zhàn),這場(chǎng)舉世矚目的“人機(jī)大戰(zhàn)”分出了勝負(fù)。手握18座世界圍棋冠軍獎(jiǎng)杯的李世石冷峻的臉上露出一絲苦澀的笑容,當(dāng)比賽行至第186手后,看到形勢(shì)已無法逆轉(zhuǎn)的他投子認(rèn)負(fù)。
“我沒想到會(huì)輸,但我從一開始就犯了錯(cuò),失誤也一直伴隨到最后,最終無力扭轉(zhuǎn)局面。我真的沒想到AlphaGo會(huì)以如此完美的方式贏得比賽?!被貞浧饎倓偨Y(jié)束的比賽,李世石遺憾地說。
時(shí)間回到3個(gè)多小時(shí)前,李世石為了本次比賽特意剪了一個(gè)清爽的“蓋兒頭”,但新發(fā)型并未給他帶來好運(yùn)氣,比賽從序盤階段就充滿了緊張的氣氛。經(jīng)過猜先,李世石執(zhí)黑先行。有備而來的他選擇了并不常見的開局,以此給AlphaGo的計(jì)算和判斷制造麻煩。布局階段過后,黑棋形勢(shì)稍占優(yōu),尤其左下部幾乎都在李世石的掌控之下。
不過,近期不斷通過“深度學(xué)習(xí)”提升實(shí)力的AlphaGo毫不示弱,在處于下風(fēng)時(shí)屢屢祭出狠招,給予李世石強(qiáng)力回?fù)?。行?0多手,李世石的行棋沒有了序盤時(shí)的犀利和流暢,頻頻陷入長(zhǎng)考。
隨著戰(zhàn)局深入,一開始還靠在沙發(fā)上比賽的李世石,基本上只坐在沙發(fā)的前半部分,身體微微前傾,雙臂交叉,似乎想更靠近棋盤,看清復(fù)雜的變化形勢(shì)。由于黑棋在棋盤右側(cè)實(shí)地的爭(zhēng)奪中接連出現(xiàn)失誤,原本的優(yōu)勢(shì)瞬間被白棋吞噬殆盡。
盡管AlphaGo的白棋也有細(xì)微漏招,但還是確保了中盤之后的優(yōu)勢(shì)地位。此后,李世石的表情變得相當(dāng)尷尬,不斷用撓頭的方式來給自己減壓。AlphaGo在優(yōu)勢(shì)局面下沒給李世石留下任何逆轉(zhuǎn)的機(jī)會(huì),后者中盤認(rèn)輸。
對(duì)于AlphaGo展現(xiàn)出的實(shí)力,李世石有些吃驚。
他在賽后說:“首先是打開局面的能力,我預(yù)想布局對(duì)AlphaGo是個(gè)難點(diǎn),但結(jié)果出乎我的意料,變成了對(duì)雙方來說都很困難的局面。此外,有些需要很強(qiáng)計(jì)算力才敢下的棋,AlphaGo都能下出來,令人驚訝?!?/p>
展望下盤比賽,李世石并未失去信心,“第一盤輸了并不會(huì)動(dòng)搖我的信心。比賽才剛剛開始,我會(huì)繼續(xù)了解對(duì)手。雖然輸?shù)羰妆P,但我還是很享受這盤棋,也很期待后面的比賽。我覺得我的勝算還是比較大的,至少有五成把握。”
【熱議】
圍棋界對(duì)AlphaGo刮目相看
和賽前中、韓兩國(guó)職業(yè)圍棋界一邊倒地看好李世石不同,AlphaGo昨天取勝后已被職業(yè)棋手當(dāng)成“怪獸”級(jí)別的對(duì)手來看待。
在現(xiàn)場(chǎng)解說比賽的韓國(guó)棋手金成龍九段直言,這場(chǎng)失利讓包括李世石在內(nèi)的大部分職業(yè)棋手倍感壓力?!捌迨衷诒荣愔杏凶约猴L(fēng)格和情緒上的變化,但電腦程序沒有。我在盤中曾判斷AlphaGo的形勢(shì)不利,但它竟然能成功逆轉(zhuǎn)。AlphaGo下出了超越人類風(fēng)格的棋,太令人驚訝了?!?/p>
中國(guó)圍棋隊(duì)主教練俞斌則認(rèn)為,李世石的失利讓人腦5比0戰(zhàn)勝電腦的可能性不復(fù)存在,而且還存在被電腦橫掃的可能。他直言,“比賽中,電腦沒有明顯薄弱的地方,而李世石的錯(cuò)誤卻是職業(yè)棋手經(jīng)常會(huì)犯的?!?/p>
近來多次在世界大賽中擊敗李世石的中國(guó)天才棋手、19歲的柯潔九段認(rèn)為,李世石的強(qiáng)項(xiàng)是后半盤的翻盤能力,布局則是他最差的地方,判斷力也不是太好,這對(duì)AlphaGo來說是個(gè)重大利好,因?yàn)殡娔X一般強(qiáng)在后半盤。比賽結(jié)果也印證了柯潔的判斷。
柯潔還不忘給李世石支招兒,“AlphaGo確實(shí)下得很好,處理風(fēng)格很簡(jiǎn)單,目的明顯,跟我的下棋風(fēng)格很像。每一步都想得很清楚,處于不利局面時(shí)會(huì)去拼,這點(diǎn)特別像人類的思維模式。而且它計(jì)算精準(zhǔn),后半盤對(duì)局面和目數(shù)的把控能力很強(qiáng)。”
柯潔認(rèn)為,如果自己和AlphaGo對(duì)弈,必須在前面積攢下足夠的優(yōu)勢(shì),才不會(huì)因后半盤的失誤導(dǎo)致失敗。“李世石應(yīng)該盡快忘掉失利,不要受首盤的影響。畢竟電腦在比賽中還是有失誤,完全可以被擊敗?!?/p>
中國(guó)圍棋隊(duì)領(lǐng)隊(duì)華學(xué)明則從另外一個(gè)層面看待“人機(jī)大戰(zhàn)”,她說:“大家不要覺得電腦戰(zhàn)勝了頂尖棋手,圍棋的神秘感就會(huì)消失。電腦因擁有深度學(xué)習(xí)、搜索和價(jià)值評(píng)估三大利器,具備了強(qiáng)大的實(shí)力。可這并不代表圍棋的全部,也無法體現(xiàn)出圍棋的思維和深邃的內(nèi)在,在這方面,電腦需要‘學(xué)習(xí)’的還很多。”
【探秘】
神經(jīng)網(wǎng)絡(luò)算法造最強(qiáng)“大腦”
全球圍觀的“人腦榮譽(yù)保衛(wèi)戰(zhàn)”,讓人工智能AlphaGo一戰(zhàn)封神。但在人們心底積聚下來的好奇與疑惑卻如雪球般越滾越大:AlphaGo作為一款圍棋人工智能程序,如何練就最強(qiáng)“大腦”?
據(jù)介紹,AlphaGo的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò)。“策略網(wǎng)絡(luò)”和 “價(jià)值網(wǎng)絡(luò)”,它們的任務(wù)在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計(jì)算量控制在計(jì)算機(jī)可以完成的范圍里——本質(zhì)上,這和人類棋手所做的一樣。
其中,“價(jià)值網(wǎng)絡(luò)”負(fù)責(zé)減少搜索的深度——AI會(huì)一邊推算一邊判斷局面,局面明顯劣勢(shì)的時(shí)候,就直接拋棄某些路線,不用一條道算到黑;而“策略網(wǎng)絡(luò)”負(fù)責(zé)減少搜索的寬度——面對(duì)眼前的一盤棋,有些棋步是明顯不該走的,比如不該隨便送子給別人吃。
AlphaGo利用這兩個(gè)工具來分析局面,判斷每種下子策略的優(yōu)劣,就像人類棋手會(huì)判斷當(dāng)前局面以及推斷未來的局面一樣,這樣AlphaGo在分析了比如未來20步的情況下,就能判斷在哪里下子贏的概率會(huì)高。
AlphaGo的強(qiáng)大,一方面體現(xiàn)在它能迅速汲取10萬圍棋高手的棋局,充分利用人類棋手的即有經(jīng)驗(yàn);另一方面體現(xiàn)在可以每天上萬盤的自我“左右互搏”。
今年1月,負(fù)責(zé)研發(fā)該項(xiàng)目的Deep Mind團(tuán)隊(duì)就曾透露,AlphaGo在四周的時(shí)間里完成了100萬局的自我對(duì)局,也就是說,它一天可以自我對(duì)局3萬局,在不斷的試錯(cuò)中自我完善、自我進(jìn)化。而這樣“左右互搏”的練習(xí)體量,對(duì)人類來說是不可想象的。
據(jù)介紹,AlphaGo背后是一群杰出的谷歌工程師們夜以繼日的進(jìn)行程序編程,工程師們利用神經(jīng)網(wǎng)絡(luò)算法,將棋類專家的比賽記錄輸入給計(jì)算機(jī),并讓計(jì)算機(jī)自己與自己進(jìn)行比賽,在這個(gè)過程中不斷學(xué)習(xí)訓(xùn)練。某種程度上講,AlphaGo的棋藝不是開發(fā)者教給他的,而是自學(xué)成才。
【效應(yīng)】
百萬獎(jiǎng)金噱頭的全球營(yíng)銷
不管最終的勝負(fù)幾何,這場(chǎng)百萬獎(jiǎng)金噱頭炮制的商業(yè)營(yíng)銷可謂賺了個(gè)盆滿缽滿。
這場(chǎng)比賽讓谷歌和圍棋得到了一次全球的關(guān)注。在國(guó)內(nèi),騰訊視頻、圍棋TV、樂視體育等15家網(wǎng)站邀請(qǐng)專業(yè)棋手和嘉賓對(duì)比賽進(jìn)行直播。在東亞地區(qū),圍棋熱也再一次掀起。在韓國(guó),進(jìn)入3月,從農(nóng)心杯到人機(jī)大戰(zhàn),圍棋的熱度幾乎覆蓋了各個(gè)媒體。
“這稱得上近年來,中國(guó)圍棋界乃至世界圍棋界關(guān)注度最高的賽事了。”中國(guó)圍棋協(xié)會(huì)主席王汝南感慨,與眾多圍棋界人士一樣,王汝南認(rèn)為拋開輸贏這都是圍棋的勝利,“全世界都關(guān)注圍棋,這在圍棋運(yùn)動(dòng)歷史上,也是里程碑式的?!?/p>
同時(shí),以谷歌為代表的AI研究公司也將隨即迎來新一輪的發(fā)展高潮。
今年3月7日,來自中國(guó)團(tuán)隊(duì)異構(gòu)智能也宣布將研發(fā)圍棋人工智能“異構(gòu)神機(jī)”,挑戰(zhàn)另一位世界圍棋冠軍柯潔。值得玩味的是,就在3月6日農(nóng)心杯上,柯潔剛剛戰(zhàn)勝了李世石。此前Facebook也宣布開發(fā)了圍棋人工智能黑色森林。扎克伯格更是興奮地在Facebook上寫道:“20年來,科學(xué)家們一直在努力教電腦如何贏得圍棋比賽,我們已經(jīng)快要成功了!”
而對(duì)于此次對(duì)壘的雙方——李世石和AlphaGo也將成為人工智能發(fā)展史上無法抹去的一部分。據(jù)了解,李世石與AlphaGo展開的5盤對(duì)局,勝者獎(jiǎng)金為100萬美元。而李世石每盤對(duì)局費(fèi)為3萬美元,每贏一盤還將獲得2萬美元的獎(jiǎng)金,也就是說,如果李世石5盤全勝,將獲得125萬美元獎(jiǎng)金,即使沒有贏,李世石也會(huì)因參與到這樣一場(chǎng)舉世矚目的人機(jī)大戰(zhàn)而留名史冊(cè)。
對(duì)此場(chǎng)人機(jī)大戰(zhàn),柯潔直言不諱地表示,“這是一次完美的營(yíng)銷。宣傳完美,谷歌花了百萬美元,如今是股價(jià)大漲,多少個(gè)100萬都掙回了。同時(shí)對(duì)圍棋而言也是一次極完美的推廣,全世界很多人,不管會(huì)不會(huì)下圍棋,都會(huì)盯著這場(chǎng)舉世矚目的大戰(zhàn)?!?/p>
關(guān)于人工智能的討論也在迅速擴(kuò)大著邊界。著名創(chuàng)業(yè)者、創(chuàng)新工場(chǎng)首席執(zhí)行官李開復(fù)就表示,深度學(xué)習(xí)的技術(shù)還有非常大的數(shù)據(jù)量和計(jì)算量可以擴(kuò)張的使用,超過了想象,比如股市中,人工智能可以輸入一些判斷的知識(shí),買股票方面機(jī)器人會(huì)超過人。
但正如谷歌董事長(zhǎng)施密特所言,無論誰在比賽中獲勝,人類都將是最大的贏家。(記者 王洋 范曉)
(責(zé)任編輯:梁艷)