Google 人工智慧打臉 Facebook！AlphaGo 已能打敗專業圍棋選手

在 Facebook 創辦人兼 CEO Mark Zuckerberg 發文對外宣稱將讓其發展的人工智慧能在圍棋比賽中打敗人腦之際，Google 卻已經先一步達成目標，而且對外發表的時間還差沒多久，看來在人工智慧這環，Google 已完全搶在前頭。

訓練人工智慧系統最佳的利器就是玩遊戲，如此一來，系統就能發展出更聰明且彈性化的演算法，讓它更貼近人類的思惟模式。然而，自人工智慧發展幾十年以來，科學家所研發的人工智慧系統已能打敗許多由人類操作的遊戲，卻沒有辦法突破起源於中國的古老遊戲─圍棋。Google 為了打破這樣的迷思，研發出一套人工智慧系統 AlphaGo，期望能跨越圍棋對人工智慧發展所樹立的障礙。

圍棋創立至今已超過 2,500 年，規則雖簡單卻能有超過 10 的 700 次方種的局面的變化，每一步棋都可能讓盤面翻轉，下棋的人需要縝密的思慮才有可能贏過敵方，連孔子都曾稱讚過下棋的美學。但也因這變換多端的局面，圍棋成為了科學家最頭痛的桌上遊戲，該怎麼研發出夠細心的人工智慧系統，打敗人類操控的棋局，更是研發中的難處之一。

目前為止，現有的人工智慧系統只能達到與圍棋業餘等級差不多的程度，專家更認為，至少要花上將近 10 年的時間，才能讓人工智慧追趕上並打敗專業的圍棋選手。Google 更在 27 日在部落格上對外表示，他們將打敗圍棋專業選手視為一個不可抗拒的挑戰，目前正著手研發了一套人工智慧系統 AlphaGo。

這套系統的關鍵，就在減少原先在搜尋時所佔用的龐大空間，轉而變成較能掌握的事情。而為了要能達成這樣的效果，AlphaGo 結合最新的樹狀搜尋技術與兩種深度學習網路，其中，每一種網路都有非常多層涵蓋了百萬種像神經一般的連結。其一深度學習網路稱為「策略網路（policy network）」，能夠預測下一步並縮小搜尋範圍，讓接下來的每一步都能朝致勝更邁進。另一個則是「評估網路（value network）」，能減少在樹狀搜尋時的深度，評估贏家在每一個情況下最好的下法。

AlphaGo 突破了以往的人工智慧系統，演算法又更貼近人類的思惟，Google 不使用 Facebook 研發人工智慧時所運用的蒙地卡羅樹狀搜尋（MCTS），反而用了機器學習來引領 AlphaGo 的搜尋。透過上述的兩種機器學習網絡，AlphaGo 比其他系統更能抉擇出更好的下一步，引領自己在圍棋比賽中勝出。

Google 在訓練 AlphaGo 時，先以人類專家下圍棋的 3,000 萬種步驟訓練「策略網絡」，直到此人工智慧系統能準確預測 57% 人類下棋的步驟。但 Google 也不以此滿足，不達贏過人類玩家的目的永不罷休。為了達到目的，Google 讓 AlphaGo 的「策略網絡」玩好幾千把的圍棋，並在這過程中習得自己發現新下棋策略的能力，再搭配強化學習的方式逐漸改進下棋的方式。最後，Google 更驕傲的表示，AlphaGo 目前已能打敗所有用樹狀搜尋所建立的人工智慧系統。

更厲害的是，這個接受過訓練的「策略網絡」，還能反過來訓練 AlphaGo 中的「評估網絡」，讓它能評估所有圍棋中可能出現的局面，進而評估最後的贏家會是誰，顛覆了原本被認為不可能發生的事情。

然而，要想達到這樣的結果必須要有非常強大的運算能力，所以 Google 團隊更運用了 Google 雲端平台，讓這些研究人工智慧與機器學習的學者能隨時彈性的運算、儲存以及取得網路容量。除此之外，有了運用數據曲線圖的數字運算新開放原始碼資料庫，就能允許研究學者在不同的 CPU 和 GPU 上，更有效的支配其學習演算法的運算方式。

而為了證明 AlphaGo 能贏過市面上其他的人工智慧系統，Google 更用它來與其他系統玩遊戲，結果證明，即使 AlphaGo 讓他們四步還是能贏過所有的系統。除此之外，AlphaGo 還推出了高性能版本，其成效更可以說是無人能敵。

▲ Google 製作 AlphaGo 程度圖表。（Source：Google Research Blog）

Google 並不以此滿足，他們要的是能擊敗真人的人工智慧系統。於是，他們邀請了曾經贏得 3 屆歐洲圍棋盃冠軍的樊麾與 AlphaGo 競賽。樊麾自 12 歲起就開始接觸圍棋，生涯中贏得的獎盃已不可數，更是圍棋界中的佼佼者。在 2015 年 10 月 5-9 日進行的比賽中，樊麾卻以 0：5 的比數慘敗給 AlphaGo，這也成為電腦程式率先贏過專業圍棋選手的第一例。

▲ AlphaGo 與樊麾競賽的影片。（Source：Google）

而 AlphaGo 下一個挑戰就是要與在過去 10 年間最頂尖的圍棋選手李世乭比賽，這場比賽將於今年 3 月在南韓首爾舉行。李世乭也很興奮的接受挑戰並表示：「我很高興我成為能與他對決的選手，但我也很有信心我能贏得這場比賽。」而這絕對將會是一場史無前例的比賽。

Google 也在最後表示，他們很開心能打造出 AlphaGo 這套系統，但他們並不想讓它被定位成一個手工打造的專家系統，而是一種藉由純粹的觀賞與玩遊戲的方式，運用機器學習讓它能改進自己的下棋技巧的人工智慧系統。他們最終想完成的並不只是玩遊戲而已，而是要能將人工智慧運用在解決真實世界的問題中，幫助人類解決煩惱。