Google 人工智慧打臉 Facebook!AlphaGo 已能打敗專業圍棋選手

作者 | 發布日期 2016 年 01 月 29 日 | 分類 Google , 網路
go-game

在 Facebook 創辦人兼 CEO Mark Zuckerberg 發文對外宣稱將讓其發展的人工智慧能在圍棋比賽中打敗人腦之際,Google 卻已經先一步達成目標,而且對外發表的時間還差沒多久,看來在人工智慧這環,Google 已完全搶在前頭。



訓練人工智慧系統最佳的利器就是玩遊戲,如此一來,系統就能發展出更聰明且彈性化的演算法,讓它更貼近人類的思惟模式。然而,自人工智慧發展幾十年以來,科學家所研發的人工智慧系統已能打敗許多由人類操作的遊戲,卻沒有辦法突破起源於中國的古老遊戲─圍棋。Google 為了打破這樣的迷思,研發出一套人工智慧系統 AlphaGo,期望能跨越圍棋對人工智慧發展所樹立的障礙。

圍棋創立至今已超過 2,500 年,規則雖簡單卻能有超過 10 的 700 次方種的局面的變化,每一步棋都可能讓盤面翻轉,下棋的人需要縝密的思慮才有可能贏過敵方,連孔子都曾稱讚過下棋的美學。但也因這變換多端的局面,圍棋成為了科學家最頭痛的桌上遊戲,該怎麼研發出夠細心的人工智慧系統,打敗人類操控的棋局,更是研發中的難處之一。

目前為止,現有的人工智慧系統只能達到與圍棋業餘等級差不多的程度,專家更認為,至少要花上將近 10 年的時間,才能讓人工智慧追趕上並打敗專業的圍棋選手。Google 更在 27 日在部落格上對外表示,他們將打敗圍棋專業選手視為一個不可抗拒的挑戰,目前正著手研發了一套人工智慧系統 AlphaGo。

這套系統的關鍵,就在減少原先在搜尋時所佔用的龐大空間,轉而變成較能掌握的事情。而為了要能達成這樣的效果,AlphaGo 結合最新的樹狀搜尋技術與兩種深度學習網路,其中,每一種網路都有非常多層涵蓋了百萬種像神經一般的連結。其一深度學習網路稱為「策略網路(policy network)」,能夠預測下一步並縮小搜尋範圍,讓接下來的每一步都能朝致勝更邁進。另一個則是「評估網路(value network)」,能減少在樹狀搜尋時的深度,評估贏家在每一個情況下最好的下法。

AlphaGo 突破了以往的人工智慧系統,演算法又更貼近人類的思惟,Google 不使用 Facebook 研發人工智慧時所運用的蒙地卡羅樹狀搜尋(MCTS),反而用了機器學習來引領 AlphaGo 的搜尋。透過上述的兩種機器學習網絡,AlphaGo 比其他系統更能抉擇出更好的下一步,引領自己在圍棋比賽中勝出。

Google 在訓練 AlphaGo 時,先以人類專家下圍棋的 3,000 萬種步驟訓練「策略網絡」,直到此人工智慧系統能準確預測 57% 人類下棋的步驟。但 Google 也不以此滿足,不達贏過人類玩家的目的永不罷休。為了達到目的,Google 讓 AlphaGo 的「策略網絡」玩好幾千把的圍棋,並在這過程中習得自己發現新下棋策略的能力,再搭配強化學習的方式逐漸改進下棋的方式。最後,Google 更驕傲的表示,AlphaGo 目前已能打敗所有用樹狀搜尋所建立的人工智慧系統。

更厲害的是,這個接受過訓練的「策略網絡」,還能反過來訓練 AlphaGo 中的「評估網絡」,讓它能評估所有圍棋中可能出現的局面,進而評估最後的贏家會是誰,顛覆了原本被認為不可能發生的事情。

然而,要想達到這樣的結果必須要有非常強大的運算能力,所以 Google 團隊更運用了 Google 雲端平台,讓這些研究人工智慧與機器學習的學者能隨時彈性的運算、儲存以及取得網路容量。除此之外,有了運用數據曲線圖的數字運算新開放原始碼資料庫,就能允許研究學者在不同的 CPU 和 GPU 上,更有效的支配其學習演算法的運算方式。

而為了證明 AlphaGo 能贏過市面上其他的人工智慧系統,Google 更用它來與其他系統玩遊戲,結果證明,即使 AlphaGo 讓他們四步還是能贏過所有的系統。除此之外,AlphaGo 還推出了高性能版本,其成效更可以說是無人能敵。

alphago1

▲ Google 製作 AlphaGo 程度圖表。(Source:Google Research Blog

 

Google 並不以此滿足,他們要的是能擊敗真人的人工智慧系統。於是,他們邀請了曾經贏得 3 屆歐洲圍棋盃冠軍的樊麾與 AlphaGo 競賽。樊麾自 12 歲起就開始接觸圍棋,生涯中贏得的獎盃已不可數,更是圍棋界中的佼佼者。在 2015 年 10 月 5-9 日進行的比賽中,樊麾卻以 0:5 的比數慘敗給 AlphaGo,這也成為電腦程式率先贏過專業圍棋選手的第一例。


▲ AlphaGo 與樊麾競賽的影片。(Source:Google

 

而 AlphaGo 下一個挑戰就是要與在過去 10 年間最頂尖的圍棋選手李世乭比賽,這場比賽將於今年 3 月在南韓首爾舉行。李世乭也很興奮的接受挑戰並表示:「我很高興我成為能與他對決的選手,但我也很有信心我能贏得這場比賽。」而這絕對將會是一場史無前例的比賽。

Google 也在最後表示,他們很開心能打造出 AlphaGo 這套系統,但他們並不想讓它被定位成一個手工打造的專家系統,而是一種藉由純粹的觀賞與玩遊戲的方式,運用機器學習讓它能改進自己的下棋技巧的人工智慧系統。他們最終想完成的並不只是玩遊戲而已,而是要能將人工智慧運用在解決真實世界的問題中,幫助人類解決煩惱。

 

(首圖來源:Flickr/Chad Miller CC BY-SA 2.0)

延伸閱讀

如果你喜歡我們的分享和文章,請幫我們按個讚

發表迴響