那個(gè)唯一贏(yíng)過(guò)AlphaGo的棋手,今天退役了

伶軒 6年前 (2019-11-20)

在技術(shù)的不斷突破極限的同時(shí),研發(fā)者們的工作重心也開(kāi)始向商用轉移。

李世石宣布退役了,就此結束了在韓國棋院共計24年零7個(gè)月的職業(yè)圍棋生涯,而他也是迄今為止唯一戰勝過(guò)AlphaGo的棋手。

那個(gè)唯一贏(yíng)過(guò)AlphaGo的棋手,今天退役了

“神之一手”,5番大戰的一次勝利,是人類(lèi)棋手的“唯一”

2016年3月的那場(chǎng)“人機大戰”,各中精彩至今仍歷歷在目,而這場(chǎng)比賽也成就了李世石職業(yè)生涯最輝煌一戰——5番大戰,李世石在第4局下出“神之一手”,取得人類(lèi)棋手對陣AlphaGo正式比賽中的唯一一局勝利。

如果要用一個(gè)詞形容這場(chǎng)比賽,“盛況空前”再合適不過(guò)了,因為這場(chǎng)比賽在正式開(kāi)始之前,就已獲得了全球范圍內的關(guān)注。而當時(shí)有關(guān)這場(chǎng)比賽最終勝負爭論的爭論,遠勝于曾經(jīng)的“深藍”。

那個(gè)唯一贏(yíng)過(guò)AlphaGo的棋手,今天退役了

實(shí)際上早在1997年,IBM就曾憑借“深藍”擊敗了等級分排名世界第一的棋手加里·卡斯帕羅夫,讓很多業(yè)內人士認識到了機器的強大。

可能正是因為有了這支“預防針”,面對AlphaGo大多數人不再自信和篤定認為“人腦無(wú)敵”,反而更加期待機器的表現。而當時(shí)已是世界冠軍、圍棋九段的李世石能夠接受邀約,不僅令人詫異也更加讓人期待,這場(chǎng)比賽也因此獲得了全球范圍內極高的關(guān)注,更將人工智能和深度學(xué)習徹底地推到了大眾面前。

作為谷歌全力打造的人工智能程序,AlphaGo所依賴(lài)的是兩個(gè)不同神經(jīng)網(wǎng)絡(luò )“大腦”——監督學(xué)習的策略網(wǎng)絡(luò )和價(jià)值網(wǎng)絡(luò )合作進(jìn)行下棋的,它們均由多層神經(jīng)網(wǎng)絡(luò )構成,通過(guò)多層啟發(fā)式二維過(guò)濾器處理圍棋棋盤(pán)的定位,并通過(guò)十幾個(gè)完全連接的神經(jīng)網(wǎng)絡(luò )層進(jìn)行信息分類(lèi)和邏輯推理,產(chǎn)生局面判斷。

而相較于“深藍”觸及的國際象棋領(lǐng)域,圍棋的復雜程度遠超想象。在共計361格的圍棋棋盤(pán)中,黑白棋子隨著(zhù)戰局的不斷推進(jìn)越來(lái)越多,這也就意味著(zhù)每多一顆棋子未知的可能就會(huì )有指數倍的增加,變化是無(wú)止盡的。甚至有人夸張的認為,圍棋的復雜度數量遠超于宇宙原子數量。

實(shí)際上在李世石之前,AlphaGo也曾與人類(lèi)棋手對弈過(guò)。2015年10月,AlphaGo和當時(shí)連任2013-2015年歐洲圍棋冠軍的樊麾進(jìn)行了5局無(wú)讓子比賽,獲得了“滿(mǎn)堂紅”。

在此之后,谷歌邀請樊麾加入了AlphaGo的研發(fā)工作中,這也是為什么在A(yíng)lphaGO和李世石的比賽中,樊麾是總裁判長(cháng)的主要原因。也正是因為有了專(zhuān)業(yè)棋手的加入,才讓AlphaGo有了后面的“快速進(jìn)化”。

AlphaGo持續進(jìn)化,Master、Zero相繼登場(chǎng)

作為“教練”,在A(yíng)lphaGO和李世石比賽之后,樊麾幾乎每個(gè)月都會(huì )分出一半的時(shí)間飛往DeepMind總部與AlphaGo對弈,檢驗它的最新學(xué)習成果。到2016年7 月,AlphaGo出現在了世界圍棋排名網(wǎng)站Go Ratings排名首位,總積分超越柯潔,成為了第一個(gè)登上圍棋領(lǐng)域世界榜首的AI。

而就在很多人認為AlphaGo熱度正在慢慢減退之時(shí),2016年12月29日到2017年1月4日,短短5天時(shí)間,棋手“Master”在網(wǎng)絡(luò )圍棋平臺橫掃眾多圍棋名將,在快棋對決中多次擊敗了包括聶衛平、柯潔、樸廷桓、井山裕太在內的數十位中日韓圍棋高手,創(chuàng )下了60局全勝的戰績(jì)。

就在大家對“Master”身份一籌莫展的時(shí)候,對戰最后一天它的“馬甲”終于掉了,谷歌自爆神秘賬號“Master”就是AlphaGo的最新版本。當時(shí)聶衛平給它的評價(jià)是,“Master技術(shù)全面,從來(lái)不犯錯,這一點(diǎn)是它最大的優(yōu)勢。”

2017年5月,在“萬(wàn)眾期待”下人類(lèi)排名第一的棋手柯潔與AlphaGo正式展開(kāi)了對決。只是面對進(jìn)化了的AlphaGo,柯潔三局皆敗,然而這一切都并未結束。

那個(gè)唯一贏(yíng)過(guò)AlphaGo的棋手,今天退役了

僅僅5個(gè)月后,Deepmind就重磅發(fā)布了“0基礎學(xué)習”的AlphaGo Zero,即“在沒(méi)有任何人類(lèi)圍棋對弈數據的情況下,直接通過(guò)自我純強化學(xué)習”。更值得一提的是,AlphaGo Zero只自我訓練了3天,就以100:0的戰績(jì)擊敗曾經(jīng)的AlphaGo。

面對這樣的強者,柯潔能表達的就只有這個(gè)了:

那個(gè)唯一贏(yíng)過(guò)AlphaGo的棋手,今天退役了

但實(shí)際上,圍棋已經(jīng)“圍不住”AI和深度學(xué)習技術(shù)的發(fā)展了。

人機大戰領(lǐng)域擴散,商用落地正在進(jìn)行時(shí)

可以看到,在A(yíng)lphaGo于圍棋領(lǐng)域一戰成名后,德?lián)?、游戲甚至?ldquo;國粹”麻將,都被AI攻克了,如DeepStack成為首個(gè)在一對一無(wú)限注德?lián)渲袘饎偃祟?lèi)玩家的人工智能、AlphaStar稱(chēng)霸星際爭霸2、Suphx成為國際知名的專(zhuān)業(yè)麻將平臺“天鳳”第一個(gè)榮升十段的AI系統等,這也讓越來(lái)越多的人認識到深度學(xué)習前景的可觀(guān)性。

IDC今年下半年發(fā)布的《中國深度學(xué)習平臺市場(chǎng)份額調研》的報告顯示,在A(yíng)I技術(shù)使用方面,接受調研的企業(yè)和開(kāi)發(fā)者中,86.2%選擇使用開(kāi)源深度學(xué)習框架,在A(yíng)I不斷走向產(chǎn)業(yè)化的過(guò)程中,深度學(xué)習平臺已經(jīng)成為企業(yè)和開(kāi)發(fā)者應用AI技術(shù)必備的助攻武器。而在技術(shù)的不斷突破極限的同時(shí),研發(fā)者們的工作重心也開(kāi)始向商用轉移。

以AlphaGo為例,DeepMind CEO哈薩比斯就曾在被問(wèn)及未來(lái)發(fā)展方向時(shí)表示,“AlphaGo是人工智能,會(huì )自己學(xué)習,是可以‘移植’的,所以我們已經(jīng)開(kāi)始將它和醫療、機器人等進(jìn)行結合了。”

當前,除谷歌Facebook、百度、亞馬遜、阿里、騰訊等頭部廠(chǎng)商之外,包括科大訊飛、商湯、曠視、思必馳、地平線(xiàn)等創(chuàng )企均有深度學(xué)習相關(guān)產(chǎn)品推出,并在醫療、芯片、自動(dòng)駕駛、機器人、計算機視覺(jué)、語(yǔ)音識別等領(lǐng)域落地商用??梢灶A見(jiàn),未來(lái)有關(guān)深度學(xué)習的市場(chǎng)規模將快速擴展。

關(guān)于李世石

李世石,1983年生,韓國著(zhù)名圍棋棋手,世界頂級圍棋棋手。

1995年入段,1998年二段,1999年三段,2003年因獲LG杯冠軍直接升為六段,2003年4月獲得韓國最大棋戰KT杯亞軍,升為七段,2003年7月獲第16屆富士通杯冠軍后直接升為九段,2006、2007、2008獲韓國圍棋大獎最優(yōu)秀棋手大獎(MVP)。

李世石屬于典型的力戰型棋風(fēng),善于敏銳地抓住對手的弱處主動(dòng)出擊,以強大的力量擊垮對手,他的攻擊可以用“穩,準,狠”來(lái)形容,經(jīng)常能在劣勢下完成逆轉。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到