2019.02.23 11:54 臺北時間

繼下棋和撲克之後　AI 開始挑戰難度更高的戰略遊戲

發布時間：2019.02.23 11:54 臺北時間

更新時間：2023.09.12 20:29 臺北時間

文

MIT科技評論

已複製連結

贊助本文

遊戲人工智慧 AI技術 MIT

這一過程實際上是一系列對於戰略、推理和合作的強大考驗和訓練。也正是因為這一原因，Google Brain 和 DeepMind 公司的研究人員都把這一遊戲認作是值得人工智慧下一步去挑戰的完美遊戲。 

如果你曾經玩過卡牌遊戲 Hanabi，那麼你就會明白這款遊戲與其他遊戲相比的特殊之處。這是一款需要協作的遊戲，而且尤其特殊的是，在這款遊戲裡，你可以看到所有其他人的牌，卻唯獨看不到自己的牌。

為了在這一遊戲中獲勝，每個玩家需要給其他玩家相應的提示，以便每個玩家能夠按照特定順序排列自己所有的牌，而且必須要在有限的出牌輪次中。這一過程實際上是一系列對於戰略、推理和合作的強大考驗和訓練。也正是因為這一原因，Google Brain 和 DeepMind 公司的研究人員都把這一遊戲認作是值得人工智慧下一步去挑戰的完美遊戲。
在最近的一篇新論文中，這兩家公司的研究人員們指出，Hanabi 和到目前為止人工智慧已經學習訓練過的如國際象棋，圍棋和撲克等其他遊戲不同，Hanabi 這一遊戲需要玩家掌握的還有心理學原理和更高層次的推理。這裡說到的心理學原理是指需要理解其他人的心理狀態 – 尤其是要理解其他玩家很有可能與自己的心理狀態非常不同。理解人的心理是實際上是人類自身其整個群體得以在這個世界上有效運作所需的一項基礎技能，它也是一項我們在很小的時候通常就已經掌握的技能。
在 Hanabi 這一遊戲中，玩家可以獲得的資訊十分有限，僅僅是其他玩家提供給自己的有限的提示以及這一提示中所包含的其他隱形資訊。因此，為了贏得這一遊戲，人工智慧必須學會從其他玩家的行動中獲取隱含資訊——對於人工智慧來說，這是之前從來沒有遇到過的挑戰。
此外，人工智慧還必須學習如何在自己提示和行動中為其他的玩家提供最大可能的信息量，來幫助其他玩家成功。研究人員認為，如果人工智慧能夠在這種不完善的資訊環境贏得遊戲，人工智慧也將可以與人類進行更加有效的合作。

上面所說的這些都是人工智慧研究界正在面臨的新挑戰，為了解決這些問題，需要新的演算法進步，來將人工智慧的幾個子領域的工作彼此互相聯繫起來，包括強化學習、博弈論等，也將需要進行有關協作環境中多個人工智慧之間如何進行「溝通」的研究學習。
為了證實人工智慧可以協同工作的這一假設，谷歌團隊測試了當前最先進的所有強化學習演算法，結果發現，現有的演算法的表現並不理想。現在，他們新發佈了一個開源的 Hanabi 環境，來促進人工智慧研究界的進一步工作和進展。
「作為一名研究人員，我對人工智慧如何可以學會彼此溝通和合作，甚至最終與人類進行交流這一課題非常感興趣，」該論文的共同作者之一 Jakob Foerster 說。「而 Hanabi 這一遊戲可以為這一重大挑戰提供了十分合適的獨特的機會。」
本文係由DeepTech深科技授權刊登。原文連結：DeepMind新计划：训练AI玩一款比下棋更难的牌类游戏

更新時間｜2023.09.12 20:29 臺北時間

支持鏡週刊

小心意大意義
小額贊助鏡週刊！

每期 $35 元動態話題報導
無限閱讀解鎖新鮮事

更多內容，歡迎鏡週刊紙本雜誌、鏡週刊數位訂閱、了解內容授權資訊。

獨家深度分析報導

線上閱讀

繼下棋和撲克之後 AI 開始挑戰難度更高的戰略遊戲

繼下棋和撲克之後　AI 開始挑戰難度更高的戰略遊戲