AlphaGo 靠識破李世乭棋路致勝?台灣之光黃士傑回台,解密世紀人機大戰

作者 | 發布日期 2016 年 03 月 19 日 | 分類 Google , 網路 , 遊戲軟體
0318-AlphaGo-Aja

在人工智慧系統 AlphaGo 與南韓棋王李世乭的對弈直播中,許多網友都在問:AlphaGo 怎麼決定要下哪顆棋子?AlphaGo 懂得投降嗎?AlphaGo 是不是看破李世乭的棋路才贏的這麼順利?黃士傑為什麼都不用喝水上廁所?黃士傑,在世紀人機大賽中負責為 AlphaGo 執棋、同時也是 AlphaGo 開發者之一的台灣博士,在賽後回到台灣,特別為人們解答對於 AlphaGo 的一切好奇。



AlphaGo 怎麼下棋,怎麼贏?

圍棋第一步有 361 個點可以下,第二步有 360 個點可以下,整個盤面的可能性高達 10 的 170 次方,比宇宙的原子數量還要高,就知道這是多可怕的天文數字,因此才說圍棋是最複雜的棋盤遊戲。

然而 Google 旗下人工智慧公司 DeepMind 所開發的 AlphaGo,其過人之處就在於利用深度學習技術搭配「策略網路(Policy Network)」和「值網路(Value Network)」,把搜尋層面縮小,讓電腦運算足以負荷。

0318-AlphaGo-2
0318-AlphaGo-3

▲DeepMind 利用「策略網路」和「值網路」,讓 AlphaGo 把搜尋層面縮小,也極大幅度縮小運算需求。綠色和粉紅色區塊為被排除掉的搜尋範圍。

黃士傑說明,他們先是讓 AlphaGo 看 2、30 萬個棋譜,等於是汲取人類幾千年來的智慧,之後「策略網路」會要求 AlphaGo 利用所學找出前 20 個最佳的棋步,「值網路」再來判斷盤面,分析每個步數的權重。一方面減少搜尋廣度,另一方面減少搜尋深度,變成 AlphaGo 可以處理的運算範圍,讓 AlphaGo 效能有極大的提升,也是今日電腦能贏過人腦的關鍵。

 

澄清:並非靠研究對手、識破棋路獲勝

在最新出刊的天下雜誌 593 期,陳文茜女士在專文中寫下,「AlphaGo 短時間內記住了李世乭的棋譜,識破『冠軍高手』的棋路。」這說法也遭黃士傑反駁,「AlphaGo 並沒有針對李世乭九段做任何訓練,他跟任何人下棋都是一樣的。」也就是說,AlphaGo 都是依上述的方式行動,盤面怎麼發展,他就接著運算、下棋。

另外,陳文茜在同篇文章所說的「AlphaGo 更是史上首次開發出默默學習的人工智慧」也並非事實。黃士傑在會中有提到,目前人工智慧已成功應用在圖片分析、語言分析等多個領域,其他許多領域也有探討。科技新報也寫過不少關於機器學習、人工智慧的報導。

 

AlphaGo 在勝率低於 20% 時就會投降

不過 AlphaGo既然能看好、算好該走哪步,那在與李世乭的第 4 盤對弈又怎麼會有「棋子滿天飛」、「看不懂在下什麼」的亂流發生,最後更是落敗呢。黃士傑反問,怎麼不說是李世乭下了神來一手的「挖」?不過團隊也的確在找問題,看是系統有 BUG,或者是值網路判斷有誤。

而第 4 盤對弈發展到最後,AlphaGo 明顯屈居弱勢,大家都在等 AlphaGo 會怎麼輸,是一路下到棋局結束比目數還是投降,但它懂不懂投降?黃士傑說,AlphaGo 會在棋局開始後判斷勝率,它被設定為當勝率小於 20% 時就會投降。但黃士傑強調,AlphaGo 要在開始下棋後才能判斷勝率,因此在開賽前,它是無法預測勝率的;此外,比賽中雖然後台看得到 AlphaGo 判斷的勝率,但坐在李世乭面前的黃士傑是完全不知情。

 

坐在李世乭對面,黃:以尊敬的心情盡量不影響他

0313-alphago-2

▲代替 AlphaGo 下棋的是台灣的資工博士黃士傑,目前在 DeepMind 擔任資深研究員,是 AlphaGo 的主要程式開發者。(Source : 截取自 AlphaGo 與李世乭第 4 盤對弈直播,當時AlphaGo 投降。)

 

常常有人評,AlphaGo 是電腦不會覺得緊張也不會有壓力,黃士傑做為代執棋的人,也盡量不讓自己的行為帶給李世乭壓力。黃士傑說,「我是下圍棋的人,李世乭九段我看過他大部分的棋譜,我對他有一種尊敬的心情,比賽中我是覺得很榮幸坐他對面,那我就盡我所能不要影響他、尊重他。」包括喝水、上廁所、露出表情都盡可能不會,但另一方面也是考量到不要浪費 AlphaGo 的時間。

不過在第 4 盤 AlphaGo 投降那一刻,黃士傑有笑了一下,他澄清自己不是在取笑什麼,而是「為李世乭高興」,因為感受到李世乭比賽壓力很大。最終 AlphaGo 以比數 4:1 獲勝,黃士傑認為是圓滿的結果。

至於 AlphaGo 開發公司 DeepMind 未來的計畫是什麼?除了比較明確的把人工智慧應用在醫療、機器人領域之外,也有其他團隊在討論是否開發策略遊戲中的對戰 AI。「讓世界變得更好是 DeepMind 的終極目標」,黃士傑說。

 

台灣之光黃士傑

黃士傑是台灣人,是台灣師範大學資訊工程系博士,也是業餘六段的圍棋棋手,他研發的圍棋程式「Erica」於 2010 年獲得第 15 屆奧林匹亞電腦遊戲程式競賽(Computer Olympiad)金牌。隨後加入 Google 旗下人工智慧公司 DeepMind 擔任資深研究員,是 AlphaGo 的主要程式開發者,他研發的「Erica」更是能夠做 AlphaGo 的基礎。

 

延伸閱讀:

如果你喜歡我們的分享和文章,請幫我們按個讚

呂 紹玉

我希望可以靠人性、靠政治、靠公民力量讓世界變得更美好,但更快的方法,似乎是靠科技。

發表迴響