首頁/ 遊戲/ 正文

DeepMind 打造 AI 遊戲系統,可以玩撲克、國際象棋、圍棋等,戰鬥力爆表

編譯 | 禾木木

谷歌母公司 Alphabet 的人工智慧實驗室 DeepMind 長期以來一直投資於遊戲人工智慧系統。實驗室的理念是,遊戲雖然缺乏明顯的商業應用,但卻是認知和推理能力的獨特相關挑戰。這使它們成為 AI 進步的有用基準。

與此前開發的遊戲系統不同,DeepMind 建立了一個名為 Player of Games 的系統,是第一個在完全資訊遊戲以及不完全資訊遊戲中都能實現強大效能的 AI 演算法。與 DeepMind 之前開發的其他遊戲系統,如國際象棋冠軍AlphaZero和星際爭霸 II 的 AlphaStar 不同,博弈者可以在完全資訊遊戲(例如中國圍棋和國際象棋)和不完全資訊遊戲(例如,撲克)中表現出色。

無論是解決交通擁堵問題的道路規劃,還是合同談判、與顧客溝通等互動任務,都要考慮和平衡人們的偏好,這與遊戲策略非常相似。AI系統可能透過協調、合作和群體或組織之間的互動而獲益。像 Player of Games 這樣的系統,能推斷其他人的目標和動機,使其與他人成功合作。

DeepMind 打造 AI 遊戲系統,可以玩撲克、國際象棋、圍棋等,戰鬥力爆表

不完全對完全

不完全資訊遊戲的資訊在遊戲過程中對玩家是隱藏的,相比之下,完全資訊遊戲在開始時會展示所有的資訊。

要玩好完全的資訊遊戲,需要相當多的預見性和計劃。玩家必須處理他們在棋盤上看到的東西,並決定他們的對手可能會做什麼,同時努力實現最終的勝利目標。不完全資訊遊戲則要求玩家考慮隱藏的資訊,並思考下一步應該如何行動才能獲勝,包括可能的虛張聲勢或組隊對抗對手。

DeepMind 稱,Player of Games是首個“通用且健全的搜尋演算法”,在完全和不完全的資訊遊戲中都實現了強大的效能。

Player of Games 有很強通用性,不過不是什麼遊戲都能玩。參與研究的DeepMind高階研究科學家馬丁·施密德(Martin Schmid)說,在完全資訊遊戲中,AlphaZero比Player of Games更強大,但在不完全的資訊遊戲中,就沒有那麼厲害。系統需要考慮每個玩家在遊戲中的所有可能觀點。雖然在完全資訊遊戲中只有一個視角,但在不完全資訊遊戲中可以有很多這樣的視角,例如,撲克大約有 2,000 個。此外,與 DeepMind AlphaZero 的繼任者 MuZero 不同,Player of Games 也需要了解它所玩的遊戲規則,而 MuZero 可以即時掌握完全資訊遊戲的規則。

在其研究中,DeepMind 在國際象棋、圍棋、德州撲克和戰略棋盤遊戲《蘇格蘭場》上的表現,評估了 Player of Games 使用谷歌 TPUv4 加速晶片組進行訓練。對於圍棋,它在 AlphaZero 和 Player of Games 之間設定了 200 場比賽,而對於國際象棋,DeepMind 則讓 Player of Games 和 GnuGo、Pachi 和 Stockfish 以及 AlphaZero 在內的頂級系統進行了較量。Player of Games 的德州撲克比賽使用公開可用的 Slumbot 進行,該演算法還與 Joseph Antonius Maria Nijssen 開發的 PimBot 進行了蘇格蘭場的比賽。DeepMind 的合著稱為“PimBot”。

DeepMind 打造 AI 遊戲系統,可以玩撲克、國際象棋、圍棋等,戰鬥力爆表

在國際象棋和圍棋中,Player of Games 被證明在某些配置中比 Stockfish 和 Pachi 更強大,並且它在對抗最強的 AlphaZero 系統時贏得了 0。5% 的比賽。儘管在對陣 AlphaZero 的比賽中損失慘重,但 DeepMind 認為 Player of Games 的表現達到了“頂級人類業餘愛好者”的水平,甚至可能達到了職業水平。

結果顯示,Player of Games是一個更好的德州撲克和蘇格蘭場玩家。與Slumbot對戰時,該演算法平均每hand贏得700萬個大盲注(mbb/hand),mbb/hand是每1000 hand贏得大盲注的平均數量。

同時在蘇格蘭場,DeepMind稱,儘管PimBot有更多機會搜尋獲勝的招數,但Player of Games還是“顯著”擊敗了它。

DeepMind 打造 AI 遊戲系統,可以玩撲克、國際象棋、圍棋等,戰鬥力爆表

未來

Schmid 相信 Player of Games 是向真正通用的遊戲系統邁出的一大步。

實驗的總體趨勢是,隨著計算資源增加,該演算法的效能會更好,Schmid 預計這種方法將在可預見的範圍內擴充套件未來。

“人們會認為,受益於AlphaZero的應用程式可能也會受益於遊戲玩家。”他談道,“讓這些演算法更加通用是一項令人興奮的研究。”

參考連結:

https://venturebeat。com/2021/12/08/deepmind-makes-bet-on-ai-system-that-can-play-poker-chess-go-and-more/

DeepMind 打造 AI 遊戲系統,可以玩撲克、國際象棋、圍棋等,戰鬥力爆表

分享

點收藏

點點贊

年終理財爆款福利!領取8%+理財券,每日限額2000份,先到先得!

相關文章

頂部