2017年5月30日 星期二

在AlphaGo之後。

2016年以四勝一敗戰績擊敗「南韓棋王李世石」的AlphaGo經過一年的調整及改良,於數日前的中國烏鎮圍棋峰會再次登場,對決「世界棋王柯潔」,同時新版AlphaGo預計將在此戰後正式退休,可說是「人機圍棋最後一戰」。

新版AlphaGo除了要和柯潔對戰三局外,額外還有由五位高段棋士聯合迎戰機器以及兩位棋士各搭配一台機器進行人機配對賽。

昔日曾擊敗李世石的舊版AlphaGo棋力已經非常可觀,當時雖然並未和柯潔實際對戰,不過已能讓柯潔說出無法評估自己和舊版AlphaGo的強弱。經過一年後,新版AlphaGo的實力當然是大幅進步了,先是在網路圍棋上留下600敗的完美戰績,這60勝的對手無一不是高段棋士,甚至包含柯潔在內。故此次人機圍棋最後一戰,坦白說實在沒幾個人看好柯潔。

而柯潔身為人腦最後堡壘,在和新版AlphaGo的三戰中著實不負世界棋王之名,縱然最後仍是三戰皆敗,但實戰表現遠超過許多人的預期,尤其第二戰十分精彩,一度在中盤占上風,Google Deepmind公司亦稱柯潔成功把新版AlphaGo逼到極限了。


我在去年曾寫過「人機圍棋世紀之戰」並簡單談過人工智能的成長威力,所以對柯潔的落敗並不意外,他確實盡力了。這次真正讓我想討論的是相較於柯潔對戰新版AlphaGo,獲得關注度明顯較低落的另外兩系列賽。

五位高段棋士聯合迎戰機器沒什麼看點,畢竟那五位棋士各有各的棋風和布局習慣,聯合起來別說是加分,我甚至懷疑有可能會因為彼此相剋而扣分,比任一位單獨迎戰機器的效果還差。

人機配對賽原本也不是那麼備受注意,一般賽前猜測局面會變成新版AlphaGo對隊友的教學指導棋,其實就過程來說也的確頗有這種味道在,不過其中發生了一件非常詭異的狀況。

中盤過後和古力同隊的AlphaGo可能是認為勝率已經很低,難以挽回頹勢決定投降。可是古力不同意,比賽繼續進行。面對勝利無望,古力的AlphaGo隊友似乎開始亂下棋,逼迫古力投降。最終古力無力回天,只能選擇投降。最後這場人類與人工智能組隊的團體賽,由連笑搭配AlphaGo那隊勝出。

投降被拒後的AlphaGo行為相當有趣,以人類的角度看來它似乎是開始「亂下」,我想討論的是,所謂AlphaGo的亂下,究竟是要逼迫人類投降?還是其實是敗中求勝的高端險棋,只是人類看不懂呢?

如果是後者倒也罷了,畢竟我們知道連棋王柯潔都敗於AlphaGo之下,人類棋力還無法到達AlphaGo的境界,無法理解它的想法完全是合情合理。但如果是前者呢?那問題可就大了。

這場人機配對賽為人類與AlphaGo合作進行,勝負意義較低,目的是探討人類與人工智能之間的互動狀況,作為之後其他領域人機合作的可能與參考。

先回過頭看發明AlphaGo的初衷,嚴格來說是將人工智能應用在圍棋領域,應該是希望借助人工智能來提升、改善人類的圍棋實力。若哪天將人工智能應用在其他任何領域,也會是期許其對人類的文明有絕對且正向的幫助,我想這點毫無爭議。

如今人工智能對人類進行扯後腿、欲逼迫人類投降這件事,因為是發生在圍棋競技上,所以大家覺得好笑又有趣。假設類似狀況發生在醫療行為呢?我們原本希望在人工智能的幫助下改善人類的醫療技術水準,結果人工智能認為治癒率太低,不但不幫忙反而想辦法加速病情惡化;或是發生在急難救援時,人工智能認為成功率太低所以選擇放棄,試問還有誰笑得出來?

我對人工智能的了解並不是那麼清楚,無法斷言AlphaGo在人機配對賽中展現的行為和其背後意義,到底只是人類無法理解?還是訓練模型不夠嚴謹?或是這種等級的人工智能已開始出現人類無法預期的行為,甚至是人工智能失控的徵兆?



沒有留言:

張貼留言

注意:只有此網誌的成員可以留言。