人畇亦云 Cloud's Nonsense: 在AlphaGo之後。

2017年5月30日星期二

在AlphaGo之後。

在2016年以四勝一敗戰績擊敗「南韓棋王李世石」的AlphaGo，經過一年的調整及改良，於數日前的中國烏鎮圍棋峰會再次登場，對決「世界棋王柯潔」，同時新版AlphaGo預計將在此戰後正式退休，可說是「人機圍棋最後一戰」。

新版AlphaGo除了要和柯潔對戰三局外，額外還有由五位高段棋士聯合迎戰機器，以及兩位棋士各搭配一台機器進行人機配對賽。

昔日曾擊敗李世石的舊版AlphaGo棋力已經非常可觀，當時雖然並未和柯潔實際對戰，不過已能讓柯潔說出無法評估自己和舊版AlphaGo的強弱。經過一年後，新版AlphaGo的實力當然是大幅進步了，先是在網路圍棋上留下60勝0敗的完美戰績，這60勝的對手無一不是高段棋士，甚至包含柯潔在內。故此次人機圍棋最後一戰，坦白說實在沒幾個人看好柯潔。

而柯潔身為人腦最後堡壘，在和新版AlphaGo的三戰中著實不負世界棋王之名，縱然最後仍是三戰皆敗，但實戰表現遠超過許多人的預期，尤其第二戰十分精彩，一度在中盤占上風，Google Deepmind公司亦稱柯潔成功把新版AlphaGo逼到極限了。

我在去年曾寫過「人機圍棋世紀之戰」並簡單談過人工智能的成長威力，所以對柯潔的落敗並不意外，他確實盡力了。這次真正讓我想討論的是相較於柯潔對戰新版AlphaGo，獲得關注度明顯較低落的另外兩系列賽。

五位高段棋士聯合迎戰機器沒什麼看點，畢竟那五位棋士各有各的棋風和布局習慣，聯合起來別說是加分，我甚至懷疑有可能會因為彼此相剋而扣分，比任一位單獨迎戰機器的效果還差。

人機配對賽原本也不是那麼備受注意，一般賽前猜測局面會變成新版AlphaGo對隊友的教學指導棋，其實就過程來說也的確頗有這種味道在，不過其中發生了一件非常詭異的狀況。

中盤過後和古力同隊的AlphaGo可能是認為勝率已經很低，難以挽回頹勢決定投降。可是古力不同意，比賽繼續進行。面對勝利無望，古力的AlphaGo隊友似乎開始亂下棋，逼迫古力投降。最終古力無力回天，只能選擇投降。最後這場人類與人工智能組隊的團體賽，由連笑搭配AlphaGo那隊勝出。

投降被拒後的AlphaGo行為相當有趣，以人類的角度看來它似乎是開始「亂下」，我想討論的是，所謂AlphaGo的亂下，究竟是要逼迫人類投降？還是其實是敗中求勝的高端險棋，只是人類看不懂呢？

如果是後者倒也罷了，畢竟我們知道連棋王柯潔都敗於AlphaGo之下，人類棋力還無法到達AlphaGo的境界，無法理解它的想法完全是合情合理。但如果是前者呢？那問題可就大了。

這場人機配對賽為人類與AlphaGo合作進行，勝負意義較低，目的是探討人類與人工智能之間的互動狀況，作為之後其他領域人機合作的可能與參考。

先回過頭看發明AlphaGo的初衷，嚴格來說是將人工智能應用在圍棋領域，應該是希望借助人工智能來提升、改善人類的圍棋實力。若哪天將人工智能應用在其他任何領域，也會是期許其對人類的文明有絕對且正向的幫助，我想這點毫無爭議。

如今人工智能對人類進行扯後腿、欲逼迫人類投降這件事，因為是發生在圍棋競技上，所以大家覺得好笑又有趣。假設類似狀況發生在醫療行為呢？我們原本希望在人工智能的幫助下改善人類的醫療技術水準，結果人工智能認為治癒率太低，不但不幫忙反而想辦法加速病情惡化；或是發生在急難救援時，人工智能認為成功率太低所以選擇放棄，試問還有誰笑得出來？

我對人工智能的了解並不是那麼清楚，無法斷言AlphaGo在人機配對賽中展現的行為和其背後意義，到底只是人類無法理解？還是訓練模型不夠嚴謹？或是這種等級的人工智能已開始出現人類無法預期的行為，甚至是人工智能失控的徵兆？

沒有留言:

張貼留言

注意：只有此網誌的成員可以留言。

2017年5月30日 星期二

在AlphaGo之後。

沒有留言:

張貼留言

2017年5月30日星期二