AlphaGo 靠識破李世乭棋路致勝？台灣之光黃士傑回台，解密世紀人機大戰

在人工智慧系統 AlphaGo 與南韓棋王李世乭的對弈直播中，許多網友都在問：AlphaGo 怎麼決定要下哪顆棋子？AlphaGo 懂得投降嗎？AlphaGo 是不是看破李世乭的棋路才贏的這麼順利？黃士傑為什麼都不用喝水上廁所？黃士傑，在世紀人機大賽中負責為 AlphaGo 執棋、同時也是 AlphaGo 開發者之一的台灣博士，在賽後回到台灣，特別為人們解答對於 AlphaGo 的一切好奇。

AlphaGo 怎麼下棋，怎麼贏？

圍棋第一步有 361 個點可以下，第二步有 360 個點可以下，整個盤面的可能性高達 10 的 170 次方，比宇宙的原子數量還要高，就知道這是多可怕的天文數字，因此才說圍棋是最複雜的棋盤遊戲。

然而 Google 旗下人工智慧公司 DeepMind 所開發的 AlphaGo，其過人之處就在於利用深度學習技術搭配「策略網路（Policy Network）」和「值網路（Value Network）」，把搜尋層面縮小，讓電腦運算足以負荷。

▲DeepMind 利用「策略網路」和「值網路」，讓 AlphaGo 把搜尋層面縮小，也極大幅度縮小運算需求。綠色和粉紅色區塊為被排除掉的搜尋範圍。

黃士傑說明，他們先是讓 AlphaGo 看 2、30 萬個棋譜，等於是汲取人類幾千年來的智慧，之後「策略網路」會要求 AlphaGo 利用所學找出前 20 個最佳的棋步，「值網路」再來判斷盤面，分析每個步數的權重。一方面減少搜尋廣度，另一方面減少搜尋深度，變成 AlphaGo 可以處理的運算範圍，讓 AlphaGo 效能有極大的提升，也是今日電腦能贏過人腦的關鍵。

澄清：並非靠研究對手、識破棋路獲勝

在最新出刊的天下雜誌 593 期，陳文茜女士在專文中寫下，「AlphaGo 短時間內記住了李世乭的棋譜，識破『冠軍高手』的棋路。」這說法也遭黃士傑反駁，「AlphaGo 並沒有針對李世乭九段做任何訓練，他跟任何人下棋都是一樣的。」也就是說，AlphaGo 都是依上述的方式行動，盤面怎麼發展，他就接著運算、下棋。

另外，陳文茜在同篇文章所說的「AlphaGo 更是史上首次開發出默默學習的人工智慧」也並非事實。黃士傑在會中有提到，目前人工智慧已成功應用在圖片分析、語言分析等多個領域，其他許多領域也有探討。科技新報也寫過不少關於機器學習、人工智慧的報導。

AlphaGo 在勝率低於 20% 時就會投降

不過 AlphaGo既然能看好、算好該走哪步，那在與李世乭的第 4 盤對弈又怎麼會有「棋子滿天飛」、「看不懂在下什麼」的亂流發生，最後更是落敗呢。黃士傑反問，怎麼不說是李世乭下了神來一手的「挖」？不過團隊也的確在找問題，看是系統有 BUG，或者是值網路判斷有誤。

而第 4 盤對弈發展到最後，AlphaGo 明顯屈居弱勢，大家都在等 AlphaGo 會怎麼輸，是一路下到棋局結束比目數還是投降，但它懂不懂投降？黃士傑說，AlphaGo 會在棋局開始後判斷勝率，它被設定為當勝率小於 20% 時就會投降。但黃士傑強調，AlphaGo 要在開始下棋後才能判斷勝率，因此在開賽前，它是無法預測勝率的；此外，比賽中雖然後台看得到 AlphaGo 判斷的勝率，但坐在李世乭面前的黃士傑是完全不知情。

坐在李世乭對面，黃：以尊敬的心情盡量不影響他

▲代替 AlphaGo 下棋的是台灣的資工博士黃士傑，目前在 DeepMind 擔任資深研究員，是 AlphaGo 的主要程式開發者。（Source : 截取自 AlphaGo 與李世乭第 4 盤對弈直播，當時AlphaGo 投降。）

常常有人評，AlphaGo 是電腦不會覺得緊張也不會有壓力，黃士傑做為代執棋的人，也盡量不讓自己的行為帶給李世乭壓力。黃士傑說，「我是下圍棋的人，李世乭九段我看過他大部分的棋譜，我對他有一種尊敬的心情，比賽中我是覺得很榮幸坐他對面，那我就盡我所能不要影響他、尊重他。」包括喝水、上廁所、露出表情都盡可能不會，但另一方面也是考量到不要浪費 AlphaGo 的時間。

不過在第 4 盤 AlphaGo 投降那一刻，黃士傑有笑了一下，他澄清自己不是在取笑什麼，而是「為李世乭高興」，因為感受到李世乭比賽壓力很大。最終 AlphaGo 以比數 4：1 獲勝，黃士傑認為是圓滿的結果。

至於 AlphaGo 開發公司 DeepMind 未來的計畫是什麼？除了比較明確的把人工智慧應用在醫療、機器人領域之外，也有其他團隊在討論是否開發策略遊戲中的對戰 AI。「讓世界變得更好是 DeepMind 的終極目標」，黃士傑說。

台灣之光黃士傑

黃士傑是台灣人，是台灣師範大學資訊工程系博士，也是業餘六段的圍棋棋手，他研發的圍棋程式「Erica」於 2010 年獲得第 15 屆奧林匹亞電腦遊戲程式競賽（Computer Olympiad）金牌。隨後加入 Google 旗下人工智慧公司 DeepMind 擔任資深研究員，是 AlphaGo 的主要程式開發者，他研發的「Erica」更是能夠做 AlphaGo 的基礎。