AlphaGo不只會玩棋還要幫電力公司配電

AlphaGo與中國棋王柯潔第二戰，柯潔（持白子）開局表現完美，但人腦仍不敵電腦，在中盤投子認輸。（畫面：Google）

發布時間：2017.05.26 07:47 臺北時間

更新時間：2023.09.12 20:24 臺北時間

文

謝樹寬

已複製連結

贊助本文

中國圍棋天才小子柯潔與人工智慧AlphaGo，在中國烏鎮舉行的「人機對弈」三盤大戰中再度敗下陣來。棋評一致認定柯潔的表現出乎意料的頑強，已接近人類腦力的極限。
不過，根據開發AlphaGo的谷歌DeepMind團隊的說法，下遍天下已無敵手的AlphaGo目標並不只是玩圍棋，未來它也可以協助運算如何運送電力，開展更多任務。

2017年5月25日，人機大戰第二局，世界排名第一的柯潔與AlphaGo對弈過程中，頻頻搔首陷入長考。（東方IC）谷歌DeepMind人工智慧（AI）實驗室打造出的AlphaGo，如今打遍天下無敵手。

不過，眾所周知，研究員在設計開發機器棋王過程中，一開始仍需要人類的圍棋高手提供協助。它透過分析專業圍棋手超過三億個棋步，不斷自我學習進化。
當AlphaGo有能力模仿人類下棋之後，它透過自己和自己下棋並追蹤每個棋步衍生的局勢變化，而讓棋力提升到了更高的境界。 
於是，當它正式亮相時，一舉打敗了韓國的世界棋王李世乭。在雙方五場對弈中，李世乭艱苦拿下其中一盤。當時就有人預測，在圍棋盤上，這將是人類的棋王最後一次打敗機器。 
不過，對AlphaGo來說，這還是剛起步而已。 

一年多前，DeepMind重新設計了它的系統。基本上，可以說他們打造了一個沒有借助人類棋步的新AlphaGo。他們完全使用AlphaGo自己跟自己對弈的棋局，來訓練AlphaGo。也就是說，它是真正藉由自我學習不斷進展的人工智慧技術。 
AlphaGo已經成了自己的老師。 
自教自學 潛力無窮 
目前在烏鎮與世界排名第一的中國棋王柯潔對戰的，正是最新版的AlphaGo。 DeepMind的創辦人兼執行長哈薩比斯（Demis Hassabis）說，由於AlphaGo現在可以用更少的資料進行更多的自我學習，所以它適合學習更廣範圍的任務。它可以幫忙優化供電的電網、簡化航運路線、或是精進科學研究。 
事實上，AlphaGo的核心技術——被稱為「深度強化學習」(deep reinforcement learning）——在AI研究領域越來越具有影響力。 
谷歌的另一個人工智慧實驗室Google Brain，利用強化學習來訓練機器手臂自己開門和拿取物品；Uber使用這個技術來教導AI玩類似「俠盜獵車手（Grand Theft Auto）」這類的賽車遊戲，為未來人工智慧在真實路況駕駛真正的車子預做準備；Tesla的創辦人穆斯克一手扶植的實驗室OpenAI，則應用類似的概念各式的遊戲和模擬。 
我們打算向前推進的是：人工智慧系統能否靠自己而學得更多？它們能否與它們本身的環境互動並學習，在那個環境中發展得更好？ 

研究人員相信，只要研究者打造正確的模擬環境而且讓人工智慧有足夠時間在裡面訓練，它們幾乎有辦法處理所有的任務。 
例如：有一天DeepMind學會我們人類談話自然的方式。 
現在看來，這目標也許還很遠，不過AlphaGo已經顯示朝這個方向邁進的實質進展。 
圍棋大師：機器神 
最初的AlphaGo依賴兩個深度神經網絡，類似人類大腦一樣透過分析大量數據來學習。新版的AlphaGo，仍依賴類似的神經網絡，但是它一開始就是以AlphaGo自己與自己對弈的棋局來訓練。 
這個系統嚴格說起來還是要依賴人類棋手，因為它接受訓練的棋步，是來自早先版本的AlphaGo，它是以人類棋步訓練成的。 
不過，根據哈薩比斯的說法，現在AlphaGo已經具有潛力可以從隨意的棋步中學習，也就是說，在整個過程中將不再需要人類棋手的協助。 
事實上，AlphaGo現在已經可以不用人類的介入，而讓棋力繼續不斷提升。這種進步明顯展現在今年初的網路大戰中。 
AlphaGo化名「圍棋大師」（Master），在網路上與多名人類的圍棋高手對弈，拿下了六十勝零敗的完美戰績。 
這個星期，它與柯潔在烏鎮的人機對決三場比賽已連取兩勝，而第三戰的勝負在大多數人的眼中也是毫無懸念。DeepMind的創辦人哈薩比斯不吝一再用「完美」、「驚人」、「把AlphaGo的棋力推到極致」等等讚譽之詞，讚賞苦戰落敗的柯潔。 
Deep Mind執行長在推特大讚柯潔的表現，把AlphaGo「逼到了極限」。
哈薩比斯認為，他們的團隊已經修正了AlphaGo與李世乭在首爾五戰的唯一一敗所暴露的缺失。同時，新的演算法比起最早先AlphaGo使用的演算法明顯更有效率。在烏鎮的比賽中，人工智慧系統可以只用一個雲端TPU（tensor processing unit，谷歌為機器學習軟體運作而打造的專用晶片）。 換句話說，它只需用到原本AlphaGo大約十分之一的運算力。 
AlphaGo新任務：協助供電 
不過，稱霸圍棋並不是唯一的目標。
DeepMind團隊正開始把這個技術推向新的領域。目前，DeepMind的實驗室已經開始與英國國家電網（National Grid UK）合作，目標是借助AlphaGo的類神經網絡科技，預測供電與用電的尖峰，優化能源的使用，來改善英國供電網的效率。 
研發AlphaGo的Deep Mind實驗室與英國電網公司達成合作協議。透過機器學習協助提升供配電的效率。（東方IC）過去，DeepMind已曾為谷歌龐大的網路帝國，達成節電的任務。它建立了模擬谷歌電腦數據中心的系統，由人工智慧透過學習而更有效率控制風扇、空調、和其他硬體設備，讓數據中心的用電量減少了15%。 
這一套機器自主學習、對未來進行預測、做出相對調整的過程，和AIlphaGo走向棋王之路，基本上並無不同，只不過它的規模、效益、和影響範圍，將不再侷限於棋秤之間。 
參考資料：
Google's AlphaGo levels up from board games to power grids （The Wired）