Meta啟示:AI是通往元宇宙的關(guān)鍵變量

原標(biāo)題:Meta啟示:AI是通往元宇宙的關(guān)鍵變量

近日,元宇宙界中又有新的活水涌入。在Meta舉辦的實(shí)驗(yàn)室討論會(huì)上,Meta CEO小扎公布了自家元宇宙的多項(xiàng)新技術(shù)。

無論是資金還是技術(shù),Meta都是構(gòu)建元宇宙世界中跑在最前面的一位,從去年十月不惜將Facebook改為Meta,到旗幟鮮明的花費(fèi)百億投入其中,一系列的砸錢收購,小扎行動(dòng)派的作風(fēng)頭鐵一股腦扎入元宇宙的深海,近日也取得了一系列的成果公開分享。

此次元宇宙中Meta實(shí)驗(yàn)室的技術(shù)突破,會(huì)給行業(yè)帶來哪些啟示?作為行業(yè)的技術(shù)前驅(qū)者,小扎對(duì)自家的新技術(shù)評(píng)價(jià)是“勾勒出元宇宙的關(guān)鍵步驟,解鎖許多進(jìn)步的是AI”。AI與元宇宙碰撞,給元宇宙世界帶來的影響又是什么呢?你是否心中也有許多問號(hào)?話不多說,進(jìn)入正題,我們先從這些新技術(shù)的模樣談起。

AI引人遐想

在新技術(shù)公布前,有關(guān)Meta最火的消息是在二月初的財(cái)報(bào)。整個(gè)2021年度,Meta現(xiàn)實(shí)實(shí)驗(yàn)室虧損了101.9億美元,2020年度的虧損為66.2億美元。

真金白銀的投入砸下去,雷聲大,雨點(diǎn)小。許多投資人與從業(yè)者從元宇宙的狂熱中清醒了一些,不過近日Meta在元宇宙中技術(shù)的突破,似乎又讓很多人對(duì)Meta有了點(diǎn)信心,也讓元宇宙的數(shù)字世界往前邁了一步。

Meta公布的新技術(shù)包括語音生成元宇宙場(chǎng)景的Builder Bot、超級(jí)AI助手CAIRaoke等。

1.語音生成場(chǎng)景的Builder Bot。在錄制的視頻中,我們可以看到小扎和一位同伴在虛擬的環(huán)境中,通過一系列的語音指令讓本來單調(diào)的虛擬背景中,增加云朵、樹木、小島、桌椅等虛擬物品,隨著語音指令的結(jié)束,一個(gè)相較豐富的虛擬場(chǎng)景建立了起來。不過現(xiàn)在的Builder Bot只是簡(jiǎn)單的demo展示,更加復(fù)雜的3D環(huán)境的生成需要時(shí)間與更深的研究。

2.超級(jí)AI助手CAIRaoke。底層是一種自我監(jiān)督端到端的神經(jīng)網(wǎng)絡(luò)模型,這個(gè)模型可以理解與學(xué)習(xí)用戶的聲音與肢體語言,讓我們可以在虛擬數(shù)字世界中和語音助手的對(duì)話更加流暢自然。在視頻的演示中,AI助手可以與人交流的同時(shí),關(guān)注到煮飯過程中的鹽量,并且及時(shí)的提醒用戶補(bǔ)充鹽的份量。目前,這一技術(shù)已經(jīng)在其視頻通話potal設(shè)備中應(yīng)用,未來也會(huì)集成在AR/VR產(chǎn)品中,增加與數(shù)字助手的交互。

3.通用機(jī)器翻譯工具。這是Meta正在開發(fā)的一項(xiàng)技術(shù)-通用的語音翻譯器,旨在提供所有語言的即時(shí)語音到語音的翻譯,而語言的種類涵蓋所有書面語言。這個(gè)通用的AI機(jī)器翻譯工具可以打通我們與信息、人的屏障,語言從此不再是限制我們獲取信息的障礙。

除此之外,Meta還公布了其他的一些AI工具,這些公布的最新AI技術(shù)和此前Meta公布的超級(jí)計(jì)算機(jī)等,未來的成熟轉(zhuǎn)化,給元宇宙帶來的影響令人遐想。

元宇宙作為下一個(gè)技術(shù)形態(tài)入口,與AI技術(shù)的耦合,我們可以明顯感受到對(duì)元宇宙世界生態(tài)內(nèi)容的豐富。數(shù)字世界中的智能陪伴、智能交互、場(chǎng)景內(nèi)容的生成與構(gòu)建等,無不在訴說著AI各類智能工具對(duì)元宇宙世界的基建設(shè)施的智能改造,不僅僅是將大量的基礎(chǔ)設(shè)施與引導(dǎo)的工作包攬,為從業(yè)人員的減負(fù),也給人類與機(jī)器的交流,用戶在生態(tài)內(nèi)的體驗(yàn),提供不同于人類現(xiàn)實(shí)社會(huì)的價(jià)值。

我們看到,AI賦予的能力使得元宇宙世界的模態(tài)運(yùn)轉(zhuǎn)加速,換句話說,元宇宙的世界構(gòu)建也會(huì)朝著電影頭號(hào)玩家中的“綠洲”深入。

智能的“人”與“環(huán)境”

對(duì)于元宇宙世界來說,最本質(zhì)的核心是交互,而讓交互有身臨其境的感受,需要元宇宙的沉浸式體驗(yàn)。作為虛擬的平行世界,元宇宙需要包含現(xiàn)實(shí)世界擁有的所有元素。如果想要討論Meta此次的新技術(shù)為元宇宙帶來了什么,就需要回到元宇宙的基本要素中尋找答案。

行業(yè)對(duì)元宇宙的基本要素的共識(shí)基本就是以Roblox公司給出了元宇宙的八大要素為主,包含:身份、社交、沉浸感、低延遲、多元化、隨時(shí)、經(jīng)濟(jì)系統(tǒng)、文明。

筆者認(rèn)為Meta的技術(shù)突破為元宇宙帶來的變化,可以歸結(jié)為交互與沉浸體驗(yàn)的豐富。

首先是沉浸式體驗(yàn),語音生成場(chǎng)景的Builder Bot,歸根結(jié)底是讓元宇宙朝著沉浸感更加智能化的方向發(fā)展。用語音生產(chǎn)場(chǎng)景,這種探索式的方式,顯示了AI可以在元宇宙創(chuàng)造復(fù)雜3D環(huán)境與新世界的潛力。

在建設(shè)多樣的沉浸式社交元宇宙路上,如果窮盡參與者的生產(chǎn)能力來場(chǎng)景內(nèi)容構(gòu)建,內(nèi)容的生產(chǎn)仍舊是產(chǎn)能有限。如果轉(zhuǎn)化為AI技術(shù)的自動(dòng)化構(gòu)建,一些重復(fù)的素材與腳本設(shè)計(jì)等,簡(jiǎn)單耗時(shí)的工作可以讓AI工具完成,元宇宙世界最核心的產(chǎn)品內(nèi)容,就可以花更多的精力來打磨。

在交互感方面,包含著社交、低延時(shí)、多元化的要素需求。超級(jí)AI助手CAIRaoke與通用機(jī)器翻譯工具的未來形態(tài),可以讓元宇宙中人與人、人與數(shù)字人的交互更加流暢。元宇宙中的“人”是基礎(chǔ)的組成單元,既包含著進(jìn)入元宇宙的探索者們,也包含著元宇宙中的虛擬數(shù)字人。超級(jí)AI助手CAIRaoke可以理解與學(xué)習(xí)用戶的聲音,從而讓我們與生態(tài)中的各類數(shù)字人進(jìn)行自然的交互。與此同時(shí),通用機(jī)器翻譯工具可以即時(shí)的翻譯不同民族的語言,讓進(jìn)入元宇宙的各類背景用戶無障礙溝通。

超級(jí)AI助手CAIRaoke與通用機(jī)器翻譯工具的未來,可以掃平元宇宙中交互的語言障礙,讓數(shù)字世界的交互更加簡(jiǎn)單歸一。

Builder Bot、 CAIRaoke、通用機(jī)器翻譯工具等AI技術(shù)的研發(fā)方向與未來形態(tài),讓元宇宙中基本組成單元人與環(huán)境智能升級(jí),這也讓元宇宙越來越接近理想的狀態(tài),吸引更多的人進(jìn)入元宇宙社交。當(dāng)然,虛擬AI與現(xiàn)實(shí)AI技術(shù)的學(xué)習(xí)與進(jìn)階會(huì)互相反哺,對(duì)于現(xiàn)實(shí)世界來說,也推進(jìn)了創(chuàng)造性人工智能技術(shù)的前進(jìn)。

元宇宙的生態(tài)籍由此會(huì)變得更加立體,我們知道內(nèi)容是吸引人的關(guān)鍵,但人在數(shù)字世界的感受才是粘合與長(zhǎng)存的基礎(chǔ),而這個(gè)感受需要數(shù)字技術(shù)將我們的感官在虛擬世界中放大,真實(shí)的質(zhì)化讓沉浸感升級(jí)。

捕捉現(xiàn)實(shí)世界:數(shù)字“通感”的步步進(jìn)階

談?wù)撐覀冊(cè)跀?shù)字世界的感官,引入通感的概念,可能會(huì)更加好理解。通感的本意指的是把不同感官如視覺、嗅覺、觸覺、聽覺等感覺互相溝通,互相轉(zhuǎn)化,借以讓人的感受更加立體豐富。那么,在元宇宙的世界,數(shù)字“通感”就是借由AI與機(jī)器讓肉身更加生動(dòng)的體驗(yàn)與探索虛擬世界,表達(dá)與傳遞情感的溫度。

數(shù)字的通感中語言是交互的底色,聽覺是語言交互的基礎(chǔ),數(shù)字視覺(VR)與觸覺(傳感設(shè)備)則讓我們的肉身在虛擬世界有了真實(shí)的質(zhì)感和觸動(dòng)。聽覺設(shè)備與技術(shù)的進(jìn)階,再與數(shù)字視覺(VR)與傳感器設(shè)備的耦合,驅(qū)動(dòng)著元宇宙世界的真實(shí)感步步深入。

聽覺的AI技術(shù)主要以智能語音識(shí)別和智能語音合成為主,在前文的敘述中,我們了解到,在虛擬世界中,與語音技術(shù)集成的AI助手結(jié)合,無論是指令,還是常態(tài)的語音交互,AI語音技術(shù)的引入都會(huì)讓用戶體驗(yàn)到機(jī)器與人的陪伴和歸屬感。虛擬世界的溫度,也因?yàn)檎Z音技術(shù)的擬人更加自然,同時(shí)機(jī)器在交流溝通過程中的不斷學(xué)習(xí),也會(huì)讓虛擬世界的數(shù)字人更加了解用戶的特性, AI助手成長(zhǎng)為虛擬的密友只剩下時(shí)間。

元宇宙數(shù)字視覺方面的“通感”依賴AR/VR技術(shù)。其與AI的結(jié)合,也是未來AR/VR發(fā)展的重要一環(huán)。拿Meta旗下的Oculus舉例來說,Oculus是許多人選擇頭顯的首選,在Horizon Home的虛擬空間,可以用Oculus進(jìn)行社交聚會(huì),其中的手勢(shì)識(shí)別、桌面、鍵盤、沙發(fā)等物品的追蹤都離不開AI技術(shù)的加持。視覺的數(shù)字通感,讓AR與VR從虛擬世界的入口,再到AI交互體驗(yàn)的智能升階,由實(shí)入虛,由虛到智。

數(shù)字觸覺的通感則來自于一些搭載AI技術(shù)的傳感器設(shè)備。例如Meta發(fā)布過的可穿戴手套和智能手腕設(shè)備,這些設(shè)備可以對(duì)手部手勢(shì)與腕部的動(dòng)態(tài)追蹤,感知環(huán)境。通過對(duì)手腕的肌電圖信號(hào)分析,系統(tǒng)可以理解微小的手指運(yùn)動(dòng),進(jìn)而轉(zhuǎn)換為數(shù)字命令發(fā)送到設(shè)備上,實(shí)現(xiàn)數(shù)字交互與控制。觸覺手套則通過氣動(dòng)裝置和觸覺渲染系統(tǒng)來模擬真實(shí)的觸感。觸覺渲染系統(tǒng)需要構(gòu)建相應(yīng)的軟件和算法來建模,根據(jù)手的位置、對(duì)虛擬環(huán)境物品的重量、紋理、硬度等理解分析,然后向手套的氣動(dòng)裝置發(fā)送正確的指令,來呈現(xiàn)真實(shí)物理世界的觸感。

數(shù)字的視覺、聽覺、觸覺在AI技術(shù)的加持下,破開了虛擬世界的次元壁,我們?cè)谠钪嬷械姆稚硖摂M人,可以在數(shù)字空間中感受到虛擬世界物質(zhì)的“實(shí)感”,與信息碰撞,在虛擬世界中成長(zhǎng)。

元宇宙基礎(chǔ)設(shè)施的完善,是一個(gè)任重道遠(yuǎn)的過程,依賴通用智能技術(shù)的持續(xù)進(jìn)步,在建設(shè)元宇宙的路上,AI的應(yīng)用是讓元宇宙更富沉浸感、更具多元化的關(guān)鍵。這也是吸引無數(shù)用戶進(jìn)入與常駐元宇宙平臺(tái)的有效方式。

在傳統(tǒng)的互聯(lián)網(wǎng)中,我們的體驗(yàn)歸根結(jié)底是作為旁觀者的身份進(jìn)行信息的傳遞與交互。元宇宙中,使用AI不僅可以為元宇宙創(chuàng)造廣泛且豐富的環(huán)境與內(nèi)容,AI加持下的數(shù)字通感讓用戶可以在虛擬空間中,感官被開啟并放大,并以擁有通感的虛擬人身份作為參與者身處其中,我們可以丟掉肉身的各種限制去互動(dòng)、探索與分享。

數(shù)字通感與元宇宙的契合,AI是連通的橋梁,不可或缺,為億萬用戶構(gòu)筑出人機(jī)共生共融的新未來。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-02-28
Meta啟示:AI是通往元宇宙的關(guān)鍵變量
許多投資人與從業(yè)者從元宇宙的狂熱中清醒了一些,不過近日Meta在元宇宙中技術(shù)的突破,似乎又讓很多人對(duì)Meta有了點(diǎn)信心,也讓元宇宙的數(shù)字世界往前邁了一步。

長(zhǎng)按掃碼 閱讀全文