4月10日,谷歌在中國棋院召開發(fā)布會,宣布5月23日-27日在烏鎮(zhèn)主辦“中國烏鎮(zhèn)o圍棋峰會”,屆時AlphaGo將再度與柯潔等為代表的中國頂尖棋手進行為期對弈。
AlphaGo是一款圍棋人工智能程序,由谷歌旗下DeepMind公司的戴密斯o哈薩比斯、大衛(wèi)o席爾瓦、黃士杰與他們的團隊開發(fā)?聺嵤侵袊鴩迓殬I(yè)九段棋手,他也是圍棋等級分排名世界第一。
此次人機終極大戰(zhàn)中,代表人類出戰(zhàn)的是目前排名世界第一的職業(yè)圍棋九段選手柯潔,而代表機器一方的則是AlphaGo的2.0版本。區(qū)別于和李世石對戰(zhàn)的AlphaGo1.0,這次對戰(zhàn)柯潔的AlphaGo2.0采用了新的算法模型。此前,該版本曾化名Master,以在線對弈的形式擊敗了包括柯潔在內(nèi)的所有選手,60戰(zhàn)而無一敗。
據(jù)Deep Mind介紹,1.0版本的AlphaGo是“深度學習”人類棋譜得出圍棋手數(shù)的估值,AlphaGo1.0所走招法其實并沒有脫離人類的理解,而且也是人類棋手曾下過的棋。如果AlphaGo1.0完善到極致,就意味著得出了接近完美的圍棋手數(shù)估值函數(shù)。2.0版本AlphaGo利用這個估值函數(shù)自我對局和“深度學習”,不再受人類棋譜的局限,下出真正屬于“人工智能”的圍棋。
人機對戰(zhàn)歷史
2016年1月,AlphaGo在沒有任何讓子的情況下,以5:0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾,計算機程序能在不讓子的情況下,在完整的圍棋競技中擊敗專業(yè)選手,這是第一次。
2016年3月,AlphaGo與圍棋世界冠軍、職業(yè)九段選手李世石進行人機大戰(zhàn),并以4:1的總比分獲勝。谷歌董事長施密特在該比賽的開幕儀式上稱:“無論比賽結(jié)果如何,勝者都是人類!
2016年末2017年初,AlphaGo在中國棋類網(wǎng)站上以Master為注冊帳號與中日韓數(shù)十位圍棋高手進行快棋對決,連續(xù)60局無一敗績。
不少職業(yè)圍棋手認為,AlphaGo的棋力已經(jīng)達到甚至超過圍棋職業(yè)九段水平,2016年7月18日,世界職業(yè)圍棋排名網(wǎng)站GoRatings公布最新世界排名,谷歌旗下DeepMind的人工智能系統(tǒng)AlphaGo以3612分,超越3608分的柯潔成為新的世界第一。
2017年1月,谷歌Deep Mind公司CEO哈薩比斯在德國慕尼黑DLD(數(shù)字、生活、設(shè)計)創(chuàng)新大會上宣布推出真正2.0版本的AlphaGo。其特點是擯棄了人類棋譜,只靠深度學習的方式成長起來挑戰(zhàn)圍棋的極限。
AlphaGo主要由以下部分組成:走棋網(wǎng)絡(luò)(Policy Network),給定當前局面,預(yù)測/采樣下一步的走棋;快速走子(Fast rollout),目標和走棋網(wǎng)絡(luò)一樣,但在適當犧牲走棋質(zhì)量的條件下,速度要比走棋網(wǎng)絡(luò)快1000倍;估值網(wǎng)絡(luò)(Value Network),給定當前局面,估計是白勝還是黑勝;蒙特卡洛樹搜索(Monte Carlo Tree Search),把以上這三個部分連起來,形成一個完整的系統(tǒng)。
值得注意的是,AlphaGo并不是DeepMind唯一項目,也不是最大的項目。DeepMind的最終目標是智能助手、醫(yī)療和機器人。另外,盡管AlphaGo只是針對圍棋開發(fā)的系統(tǒng),但其原理可以被應(yīng)用到現(xiàn)實問題中。(騰訊科技 劉亞瀾 管慕飛)