幫 AlphaGo 擊敗南韓李世乭的那個人:台灣資工博士黃士傑

作者 | 發布日期 2016 年 03 月 12 日 | 分類 Google , 網路 , 遊戲軟體
help-alphago-beat-nanhanlishishi-of-the-people-taiwan-1

AlphaGo 首戰擊敗南韓棋王李世乭,成為 9 日轟動科技界的大事。有人不免會拿漫畫棋靈王(棋魂)來做比較,一個在背後遙控人類的靈魂,指揮下贏了當代一等一的棋手。如果 AlphaGo 是佐為的話,那麼,與李世乭實際對戰的那位「阿光」人類棋手又是誰呢?答案揭曉:他是台灣師範大學資工博士,黃士傑。



在第一場比賽,根據職業棋手認為,首戰導致李世乭落敗的原因並不在於 AlphaGo 的強大,而是他的輕敵。最明顯表現是他的思考並不充分,所用的時間遠遠少於對手。

跟機器對戰與跟人類對戰的差異點在於,棋手原本會從現場對手的表現、下子的姿態來判斷對方的心情、狀況。但是與 AlphaGo對決,那個「人」只是一個替代電腦下子的工具。李世乭無法從這個棋手的表現來判斷,只能從對方下子的策略來觀察。

但是 AlphaGo 首戰的水準漂浮不定,在比賽開始前期犯下了一些低級錯誤,但後來又有一些妙招,讓李世乭難以判斷對手下棋的方式,並且可能是這個開始的錯誤導致李世乭的輕敵。

不過,如果他能與這位「阿光」多談談,或許就能多了解 AlphaGo 的「個性」。因為這位坐在他對面的人類棋手黃士傑,其實不光只是一個人類傀儡而已,他也是負責打造 AlphaGo 大腦的團隊核心人物之一。

help-alphago-beat-nanhanlishishi-of-the-people-taiwan-2

▲ 之前 AlphaGo 擊敗歐洲歐洲圍棋冠軍樊麾(左)時,也是由黃士傑(右)擔任人類棋手。

「深藍」不是已經打敗過西洋棋王了嗎?圍棋有什麼難的?

有些網友說,早在多年前 IBM 的深藍不是已經在 1997 年打敗過棋王了嗎?這次 AlphaGo 打敗棋王又有什麼大驚小怪?

問題是那次深藍打敗的是西洋棋的冠軍,這次打敗的是圍棋冠軍。圍棋,被視為是目前難度最高的一項棋類比賽,難就難在圍棋的變化高出西洋棋許多。因此擊敗人類的圍棋冠軍,一直是科學界發展人工智慧的重要目標。

以複雜度來說:

  • 西洋棋的複雜度為:10 的 123 次方。
  • 中國象棋的複雜度為:10 的 150 次方。
  • 日本將棋的複雜度為:10 的 226 次方。
  • 圍棋的複雜度為:10 的 360 次方。

棋類比賽基本上都是利用搜尋樹展開演算法,用搜尋樹來判斷對手下子的可能性,然後依照一些資訊來進行優劣判斷,再來從多種可能的結果選出最好的一步來下子。

help-alphago-beat-nanhanlishishi-of-the-people-taiwan-3
help-alphago-beat-nanhanlishishi-of-the-people-taiwan-4

▲ 西洋棋每走一步,有 24 種可能性。而圍棋則每一步有 200 種,再算下去將無窮無盡。

在西洋棋裡面,電腦的搜尋樹可以利用棋子的位置、棋子的數量來判斷優劣,因此在樹的展開可以依照每個棋局的局面來往下進行深度的搜尋。但是圍棋的邏輯性沒有那麼強,比較難得到判斷的方式。甚至有時你問頂尖棋手為什麼當時要下某一子的時候,他也只能回答你「靈光乍現」,這也是為什麼科技人工智慧這麼想要在圍棋上取得成果的原因。

 

黃士傑,一位熱愛圍棋的資工人

黃士傑是土生土長的台灣人,業餘圍棋六段,台灣師範大學資訊工程系碩士、台灣師範大學資訊工程系博士。他在 2002 年的碩士論文為「電腦圍棋打劫的策略」,2010 年的博士論文為「應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法」。

他在這次比賽之後接受採訪時表示:「Deepmind 應該是在 2014 年底之前、在 AlphaGo 團隊出現之前就創建了。我本人喜歡下圍棋,棋力是台灣業餘六段,去年在德國的比賽我甚至贏過一位日本職業棋手。但 AlphaGo 肯定是比我強太多了。職業水準的圍棋軟體,應該最慢在 1-2 年之內就會在市面上普及。」

根據他在論文中表示,雖然電腦圍棋的研究開始於 1970 年,但是圍棋程式從未被人們認為是強大的。一直到 2006 年,當「蒙地卡羅樹搜尋」與「樹狀結構信賴上界法」出現之後,才帶來了圍棋程式的革命。

蒙地卡羅是一種大數法則的方法,使用隨機取樣,而不用把所有的可能都估算到。但是當取樣的次數越多,其所得出的平均值將趨近於理論值。這個方式應用在圍棋時,會隨機下子直到盤末,由此依據各點模擬的結果,來對於盤面進行優劣的評估,從中選出最好的下子方式。

這個方法多少帶有點運氣,但是當取樣數量越多的時候,誤差會相對變低。2006 年,法國科學家以蒙地卡羅方式發展出的 Crazy Stone 在 第 11 屆電腦奧林匹克 9×9 比賽中獲得了冠軍。

help-alphago-beat-nanhanlishishi-of-the-people-taiwan-5

而「應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法」這篇博士論文的指導教授之一,正是 Crazy Stone 的那位法國開發者 Rémi Coulom 博士。而拿到了博士學位的黃士傑,之後也曾獲 2012 年台灣電腦對局學會博士論文獎與 2010 年19 路電腦圍棋金牌。

最後,值得一提的是,在這份 2010 年他才發表的博士論文摘要中,有這樣一段話:

「雖然電腦圍棋的研究開始於 1970 年,但是圍棋程式從未被人們認為是強大的。一直到 2006 年,當「蒙地卡羅樹搜尋」與「樹狀結構信賴上界法」出現之後,才帶來了圍棋程式的革命。人們才開始相信,圍棋程式在 10 年或者 20 年之後,將能夠擊敗頂尖的人類棋手。」

現在,這份論文才發表不過 6 年的時間,他就親手把自己的預言打破。

(本文由 T客邦 授權轉載)

延伸閱讀:

如果你喜歡我們的分享和文章,請幫我們按個讚
T客邦

T客邦

《T客邦》是由台灣最大的電腦出版集團「PC home電腦家庭」所經營,每日提供專業、詳實、高品質的科技資訊,成為許多電腦族群愛好的科技網站。
T客邦

發表迴響