智元開源百萬真機(jī)數(shù)據(jù)集!具身智能領(lǐng)域的ImageNet時(shí)刻已到來!

作為上海模塑申城語料普惠計(jì)劃中的一份子,智元機(jī)器人攜手上海人工智能實(shí)驗(yàn)室、國家地方共建人形機(jī)器人創(chuàng)新中心以及上海庫帕思,今天重磅發(fā)布全球首個(gè)基于全域真實(shí)場景、全能硬件平臺、全程質(zhì)量把控的百萬真機(jī)數(shù)據(jù)集開源項(xiàng)目AgiBot World。這一里程碑式的開源項(xiàng)目,標(biāo)志著具身智能領(lǐng)域“ImageNet時(shí)刻”已到來。

1.jpg

這是智元機(jī)器人本年度開源的第三個(gè)項(xiàng)目,亦是對智元818發(fā)布會承諾的完美兌現(xiàn)。我們將按計(jì)劃在HuggingFace、Github以及agibot-world.com項(xiàng)目主頁上分批上傳數(shù)據(jù),加速人類邁向通用人工智能的新時(shí)代。

項(xiàng)目開源地址

HuggingFace:

https://huggingface.co/agibot-world

Github:

https://github.com/OpenDriveLab/agibot-world

項(xiàng)目主頁:

https://agibot-world.com/

AgiBot World是全球首個(gè)基于全域真實(shí)場景、全能硬件平臺、全程質(zhì)量把控的百萬真機(jī)數(shù)據(jù)集。相比 Google 開源的 Open X-Embodiment 數(shù)據(jù)集,AgiBot World 長程數(shù)據(jù)規(guī)模高出10倍,場景范圍覆蓋面擴(kuò)大100倍,數(shù)據(jù)質(zhì)量從實(shí)驗(yàn)室級上升到工業(yè)級標(biāo)準(zhǔn)!在這個(gè)具身數(shù)據(jù)的世界里,機(jī)器人不再只是進(jìn)行簡單的桌面任務(wù),而是進(jìn)入到人類日常生活的方方面面。

多樣任務(wù)  十八般武藝樣樣精通

AgiBot World數(shù)據(jù)集中涵蓋的場景具備多樣化和多元化特點(diǎn),從抓取、放置、推、拉等基礎(chǔ)操作,到攪拌、折疊、熨燙等復(fù)雜動作,幾乎涵蓋了人類日常生活所需的絕大多數(shù)場景。比如,其中一個(gè)視頻展示的是機(jī)器人在電腦主機(jī)中內(nèi)存條的過程,這需要機(jī)器人毫米級精細(xì)控制,稍有不慎就可能導(dǎo)致設(shè)備損壞,其如神經(jīng)纖維般靈敏的末端觸覺傳感器,助力機(jī)器人實(shí)現(xiàn)了精準(zhǔn)的對接;還有試圖教會機(jī)器人如何用洗碗機(jī)的視頻——在這條數(shù)據(jù)中,展現(xiàn)了廚房水池里勺筷碗盤層層堆疊,機(jī)器人將雜亂的餐具一一準(zhǔn)確無誤地整理至洗碗機(jī)相應(yīng)卡槽中,操作流程長且動作十分繁瑣。AgiBot World數(shù)據(jù)集中收錄了80多種日常生活中的多樣化技能視頻,讓機(jī)器人能夠“十八般武藝樣樣精通”。

2.jpg

3.jpg

4.jpg

5.jpg

全域場景  上得廳堂下得廚房

AgiBot World數(shù)據(jù)集誕生于智元自建的大規(guī)模數(shù)據(jù)采集工廠與應(yīng)用實(shí)驗(yàn)基地,空間總面積超過4000平方米,包含3000多種真實(shí)物品,一方面為機(jī)器人大規(guī)模數(shù)據(jù)訓(xùn)練提供場地,另一方面真實(shí)復(fù)刻了家居、餐飲、工業(yè)、商超和辦公五大核心場景,全面覆蓋了機(jī)器人在生產(chǎn)、生活中的典型應(yīng)用需求。

6.jpg

家居場景再現(xiàn)人類真實(shí)住宅布局,包括臥室、客廳、廚房、衛(wèi)生間等核心空間,可以實(shí)現(xiàn)機(jī)器人家務(wù)清潔、物品整理和廚房任務(wù)等。工業(yè)場景模擬分揀與物流自動化,復(fù)刻工業(yè)倉庫與生產(chǎn)線,包括分揀系統(tǒng)、打包設(shè)備、傳輸帶等,可以實(shí)現(xiàn)物料分揀、包裝打包、物流搬運(yùn)等。通過多場景的高度還原與任務(wù)設(shè)計(jì),AgiBot World為機(jī)器人研發(fā)和測試構(gòu)建了實(shí)現(xiàn)具身智能的必要條件。

7.jpg

8.jpg

9.jpg

10.jpg

像這樣類似的真實(shí)場景AgiBot World百萬真機(jī)數(shù)據(jù)集中有100多種,家居占40%、餐飲20%、工業(yè)20%、商超10%以及辦公場景10%,其中80%的任務(wù)均為長程任務(wù),任務(wù)時(shí)長集中在60s-150s之間,并且包含多個(gè)原子技能,長程數(shù)據(jù)是DROID和OpenX-Embodiment 的10倍以上,3000多種物品基本涵蓋了這五大場景,同時(shí)還在不斷豐富中。

11.jpg

場景和任務(wù)分布

12.jpg

各個(gè)場景物品分類

13.jpg

數(shù)據(jù)集時(shí)長分布

全能硬件   沒有金剛鉆難攬瓷器活

機(jī)器人能夠如此靈活智能、勝任多種任務(wù)和技能,也得益于智元對于機(jī)器人本體的迭代升級——我們?yōu)闄C(jī)器人安裝了8個(gè)環(huán)繞式布局的攝像頭,讓機(jī)器人可以實(shí)時(shí)360度全方位感知周圍環(huán)境的動態(tài)變化;配備6自由度靈巧手,保障動作精準(zhǔn)且靈活,同時(shí)末端還增加了六維力傳感器和高精度觸覺傳感器,能夠感知力的微小變化,做到“拿捏有度”;機(jī)器人全身擁有32個(gè)主動自由度,能夠靈活應(yīng)對多種復(fù)雜任務(wù)。

14.jpg

15.jpg

質(zhì)量把控 嚴(yán)師出高徒

同時(shí),數(shù)據(jù)集的質(zhì)量,也是決定機(jī)器人能否快速學(xué)習(xí)的關(guān)鍵。AgiBot World中的數(shù)據(jù),都需歷經(jīng)一套嚴(yán)苛的流程與驗(yàn)證鏈路。在項(xiàng)目之初,我們便邀請學(xué)界、工業(yè)界、消費(fèi)者等多方介入提出建議,不斷迭代流程設(shè)計(jì)規(guī)劃;數(shù)據(jù)采集質(zhì)量環(huán)節(jié),無論是采集員還是采集質(zhì)量,均由完善的管理體系和專業(yè)的管理團(tuán)隊(duì)全程保障;對于采集到的數(shù)據(jù)本身,將通過端、云兩側(cè)嚴(yán)格篩選,自動剔除不符合要求的數(shù)據(jù),再由專業(yè)的審核員逐幀審核,確保每一個(gè)動作都符合任務(wù)標(biāo)準(zhǔn);最后,這些數(shù)據(jù)還會通過算法進(jìn)行二次驗(yàn)證,全方位筑牢數(shù)據(jù)質(zhì)量防線。

16.jpg

———————————————————————————————

高質(zhì)量的數(shù)據(jù)集對于當(dāng)下具身智能技術(shù)的發(fā)展尤為重要?,F(xiàn)有開源數(shù)據(jù)集,或多或少都存在采集流程缺乏標(biāo)準(zhǔn)化、機(jī)器人構(gòu)型過時(shí)、數(shù)據(jù)質(zhì)量格式參差不齊等問題,在機(jī)器人策略學(xué)習(xí)的過程中甚至?xí)砀弊饔谩?/p>

17.jpg

谷歌OXE數(shù)據(jù)集,任務(wù)缺少真實(shí)生活場景,本體多樣,數(shù)據(jù)質(zhì)量和格式參差不齊

智元在此刻開源全球首個(gè)基于全域真實(shí)場景、全能硬件平臺、全程質(zhì)量把控的百萬真機(jī)數(shù)據(jù)集AgiBot World,是具身智能技術(shù)發(fā)展的重大突破和里程碑事件,更是推進(jìn)具身智能通用人工智能(AGI)實(shí)現(xiàn)的重要加速器。我們通過匯聚頂尖資源與技術(shù)力量,將共同推動具身智能發(fā)展新范式,加速人類邁向通用人工智能的新時(shí)代,在全球范圍內(nèi)奠定中國在這一前沿領(lǐng)域的領(lǐng)導(dǎo)地位。

18.jpg

未來,智元機(jī)器人將陸續(xù)開源千萬仿真數(shù)據(jù),以支持更泛化和更通用的大模型訓(xùn)練;將發(fā)布具身基座大模型,可支持模型微調(diào),賦能千行百業(yè);發(fā)布全套工具鏈,實(shí)現(xiàn)采集、訓(xùn)練和評測完美閉環(huán);為激發(fā)創(chuàng)新的無限潛能,我們還將舉辦一系列AgiBot World Challenge,歡迎科技愛好者加入我們!

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-12-30
智元開源百萬真機(jī)數(shù)據(jù)集!具身智能領(lǐng)域的ImageNet時(shí)刻已到來!
作為上海模塑申城語料普惠計(jì)劃中的一份子,智元機(jī)器人攜手上海人工智能實(shí)驗(yàn)室、國家地方共建人形機(jī)器人創(chuàng)新中心以及上海庫帕思,今天重磅發(fā)布全球首個(gè)基于全域真實(shí)場景、全能硬件平臺、全程質(zhì)量把控的百萬真機(jī)數(shù)據(jù)集開源項(xiàng)目AgiBot World。

長按掃碼 閱讀全文