團滅!馬斯克的OpenAI在5V5比賽中擊敗人類玩家

高層速讀

關鍵信息:OpenAI今日宣布,一個由5個神經(jīng)網(wǎng)絡組成的OpenAI Five,已經(jīng)開始擊敗Dota 2的業(yè)余玩家隊伍。利用強化學習,模型可以在沒有人類數(shù)據(jù)的情況下學到可識別的策略,在每秒30幀的游戲中實時做出決定??梢婑R斯克玩起游戲來也不輸任何人, 玩得了火箭,開通的能了隧道,還能利用游戲AI擊敗人類。

關鍵數(shù)據(jù):OpenAI Five在256個GPU和128,000個CPU內(nèi)核上進行訓練,每天需要玩180年之久的Dota 2游戲來進行自我對戰(zhàn)學習。

關鍵意義:OpenAI Five的下一步目標是擊敗專業(yè)玩家隊伍。

團滅!馬斯克的OpenAI在5V5比賽中擊敗人類玩家

人工智能與人類的較量是計算機科學的一大傳統(tǒng),幸運的是,我們還處在一個不是戰(zhàn)爭較量的游戲階段?;ㄙM大量的時間和精力來研究AI如何在游戲中打敗人類,似乎是一件沒有實際用途的怪事,但這一切都是AlphaGo和深藍把研究方向帶到這里的延續(xù):建造能夠在看似簡單的游戲中擊敗人類的機器。

OpenAI一直在Dota 2游戲中嘗試人工智能與人類玩家對弈的可能性。

OpenAI今日宣布,一個由5個神經(jīng)網(wǎng)絡組成的OpenAI Five,已經(jīng)開始擊敗Dota 2的業(yè)余玩家隊伍。在2017年,其人工智能在Dota2 1v1 比賽中戰(zhàn)勝了人類職業(yè)玩家 Dendi。

團滅!馬斯克的OpenAI在5V5比賽中擊敗人類玩家

埃隆?馬斯克與他人共同創(chuàng)立的這家創(chuàng)業(yè)公司旨在提高人們對人工智能技術的認識,以及科技行業(yè)如何能夠促進未來安全,并讓每個人都從中受益。

與國際象棋或圍棋這樣的回合制游戲不同,Dota 2是一個需要大量實時決策的游戲,盡管AlphaGo有時要花幾分鐘來決定如何應對一個精心設計的步驟,但OpenAI Five沒有那么多奢侈的時間,因為它的對手在此期間也會采取行動。

團滅!馬斯克的OpenAI在5V5比賽中擊敗人類玩家

OpenAI說,這些游戲的運行速度為每秒30幀,平均為45分鐘,最終產(chǎn)生了大約8萬幀圖像,OpenAI Five在256個GPU和128,000個CPU內(nèi)核上進行訓練,與之前在1v1的比賽中所做的努力相比,這是一個由五個不同的神經(jīng)網(wǎng)絡組成的團隊,共同作用于最優(yōu)秀的人類對手。

團滅!馬斯克的OpenAI在5V5比賽中擊敗人類玩家

OpenAI對OpenAI Five給出了一些有趣的數(shù)據(jù),特別是它如何通過每天玩180年之久的Dota 2游戲來進行自我對戰(zhàn)學習。OpenAI Five為每個英雄使用單獨的一個LSTM,模型可以在沒有人類數(shù)據(jù)的情況下學到可識別的策略。這表明強化學習即使沒有根本性的進步,也能夠產(chǎn)生大規(guī)模但也可接受的長期規(guī)劃。

OpenAI Five的目標是在8月的Dota 2電子競技世界錦標賽上與人類玩家進行競爭,在那里將進行全面的測試。此外,OpenAI將在下個月舉辦一場Twitter直播的Dota 2錦標賽,以展示它與頂級玩家競爭時的場景。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2018-06-26
團滅!馬斯克的OpenAI在5V5比賽中擊敗人類玩家
OpenAI今日宣布,一個由5個神經(jīng)網(wǎng)絡組成的OpenAIFive,已經(jīng)開始擊敗Dota2的業(yè)余玩家隊伍。

長按掃碼 閱讀全文