FBEC未來商業(yè)生態(tài)鏈接大會于2023年2月24日在深圳福田大中華喜來登酒店盛大召開,本次大會由廣東省游戲產(chǎn)業(yè)協(xié)會、深圳市互聯(lián)網(wǎng)文化市場協(xié)會指導,陀螺科技主辦。
大會以“勇毅前行·逐光而上”為主題,以具有行業(yè)前瞻洞察的“探索者”為視角,逐“光”之旅為主線,聚焦元宇宙、XR、游戲、電競、數(shù)字營銷等前沿行業(yè),全方位呈現(xiàn)科技前沿成果,探討時代與商業(yè)議題,謀劃新科技、新商業(yè)、新模式未來價值,與時代同行者共赴劇變革新下的勇毅逐光之道!
FBEC主會場C:相信的力量——FBEC全球元宇宙CEO峰會由武漢東湖新技術開發(fā)區(qū)管理委員會與陀螺科技聯(lián)合主辦,邀請到海信集團聚好看科技股份有限公司AR/VR事業(yè)部總經(jīng)理吳連朋帶來主題為“虛擬空間及數(shù)字人交互的技術應用趨勢”的精彩演講。吳連朋認為,如果我們繞開數(shù)字人的發(fā)展,談元宇宙就是沒有意義的。
以下為演講實錄:
大家下午好!
很開心有機會能跟大家進行分享交流,前面的嘉賓從不同的業(yè)務領域進行了分享,我會從元宇宙的基礎“人+場”的應用方向,也就是數(shù)字人+虛擬空間的技術方向進行切入,在這個過程中,希望也能把海信集團聚好看的思考和正在做的事情介紹給大家。
我們是海信旗下的一家互聯(lián)網(wǎng)公司,這是云服務板塊,從下往上有企業(yè)級的、基礎的PaaS云平臺,目前包括國家電網(wǎng)、中大型企業(yè)數(shù)字化轉型里做私有云的PaaS平臺的切換。除此之外,還有通用互聯(lián)網(wǎng)架構下所需要的PaaS云的部分,以及音視頻的解決方案,是面向移動互聯(lián)網(wǎng)基礎能力的構建。
2016年的時候,在集團戰(zhàn)略的部署下,我們開始承擔XR板塊,其中包括眼鏡的探索方向。
2020年,我們發(fā)布了國內首個雙8K直播的VR云平臺,這是基于VR的視頻處理、編解碼處理以及傳輸分發(fā)的云平臺,包括本次大會的VR視頻直播也是我們平臺的產(chǎn)品來提供,這是比較成熟的應用方向。
在此基礎上,2019、2020、2021年,我們不斷探索XR領域跟硬件結合、跟應用結合的新的解決方案。我們的路線,是從數(shù)字虛擬人的引擎開始,再到基于人+虛擬空間的元宇宙的互動活動平臺的應用。
現(xiàn)在大家都談數(shù)字人,為什么大家都在談、也還有人去做呢?這個問題我們從2019年就開始思考了。目前數(shù)字人的引擎沒有成為通用能力的情況下,一個企業(yè)想要做好XR領域的應用和解決方案,是無法繞過一些基礎核心技術的積累和突破的。
說元宇宙,首先會說到數(shù)字人,說得最多的也是數(shù)字人。其實在五年前、十年前,虛擬仿真的技術,包括游戲的應用就已經(jīng)非常成熟。所以,如果我們繞開數(shù)字人的發(fā)展,談元宇宙就是沒有意義的。
基于數(shù)字人生產(chǎn)的效率和性能的提升,是驅動元宇宙應用的基礎邏輯。這里有兩個案例,一個是目前行業(yè)中做得非常好的歐美超寫實數(shù)字人,左上角是相對比較輕量級的數(shù)字人。在數(shù)字人發(fā)展的基礎上,有各行各業(yè)元宇宙數(shù)字人的探索。
雖然說數(shù)字人的建模和渲染技術不斷提升,也可以做各領域探索,但不代表每一個領域在一兩年內就可以成熟。從我們自己的思考來講,比如社交的元宇宙,Meta已經(jīng)投入了很長的時間,但是目前最高用戶也才達到20萬,日活還在不斷下降,所以偏社交、大C端的社交應用的方向,不是我們目前想要去拓展的方向。
從技術角度去看,數(shù)字人從開始構建,到真正在元宇宙里應用起來,具體需要做哪些,以及它的應用趨勢是怎樣的?拆解出來是以下五個階段。
第一,把人生產(chǎn)出來,這就是建模的技術。建模技術發(fā)展的趨勢,首先是要達到更高的精度,其次是以更小的成本和更小的算力去獲得更高的精度。從多視角幾何,純數(shù)字算法的模式,向深度學習大模型去發(fā)展。
第二,人建出來之后,需要使面部的動作動起來,動作的方向是更加輕便,讓人無感知地應用起來,才能在消費級有更好的應用,所以從傳統(tǒng)的光學、慣性動作捕捉等往更加輕量的可以消費級應用的單RGB攝像頭的精細化驅動方向發(fā)展。
第三,動起來以后,需要人周邊的服飾和頭發(fā)等的仿真效果。
第四,在把人生產(chǎn)、動作、周邊服飾都做出來以后,重要的方向是能夠把這些很好地渲染出來。
第五,前面四個階段生產(chǎn)完以后,只能說有了這樣的形象出來,可以有基礎的活動交互,而最終還是要用AI給它賦能,讓它具有靈魂。最近有很多人討論ChatGPT,ChatGPT結合數(shù)字人一定是可以的,并且很快能夠改變很多行業(yè)的應用方向,尤其是數(shù)字智能化的助手方向,替代一些人力,更好地展現(xiàn)效率。
從數(shù)字人的劃分來講,我們做了一個分類:從最基礎的風格化的數(shù)字人,到寫實數(shù)字人,再到超寫實數(shù)字人。
風格化數(shù)字人,目前國外已經(jīng)有很多通用的模型,很多行業(yè)應用都在基于這些模型去做。我們認為,它更加適合偏游戲、偏輕量化的娛樂性方向,而不適合行業(yè)級的應用方向。
2020年,海信推出了自己的第一個元宇宙電視行業(yè)發(fā)布會,當時也是風格化數(shù)字人。但近一兩年我們想要進行行業(yè)應用拓展和規(guī)?;?,就一定要往寫實和更加超寫實的方向推進。寫實和超寫實數(shù)字人這兩個部分是有交叉的,這取決于具體的應用場景。
比如寫實的數(shù)字人,基于單張的圖片,基于1萬以內的面片數(shù)去生產(chǎn)數(shù)字人的形象,才有可能在目前的終端算力下,做到幾百上千的并發(fā),去進行交互和這個范圍內的應用。
這是我們自己打造的其中一個超寫實形象,它現(xiàn)在承載著我們流量代理人的角色。我們自己的超寫實數(shù)字人的打造技術,從學術到真正能落地的趨勢是一致的,就是高精度掃描以后,AI能夠自動化的建模,可以把原來需要專業(yè)團隊做幾個月的工作量縮短到兩周以內。我們說超寫實,不僅僅是代表它有8K的貼圖和毛孔級的精度,更重要的是面部的表情,還有身體和骨骼動作的精細化處理。
這是我們最近兩周的案例,背景是中亞五國在集團的采訪。這個場景需要長達6分鐘的俄語播報內容,常規(guī)的展廳不太可能完成,但是現(xiàn)在通過AI數(shù)字人,包括語音的技術和自動的動作捕捉,2個小時以內可以生產(chǎn)這樣的內容,滿足應用場景的需求。我們說元宇宙、數(shù)字人,還是要考慮到底是在什么樣的場景下提供了什么樣的價值。
另一個案例是更輕量級的模型,精度相對沒有那么高,但是一切的技術都是服務具體落地的場景。比如今天的大會,我們有兩路不同的直播,一路是基于VR視頻的直播,另一路是基于元宇宙活動的直播,當面臨上百或者是上千虛擬人在同一個空間里進行活動和交互的時候,就必須要平衡它千人千面的追求,以及算力、精度、實時互動的流暢。在不同的場景需要不同的寫實度,這是我們在應用落地場景的結合探索中得出的經(jīng)驗。大部分場景可能不需要達到95%的寫實度,可能只需要達到60%以上的寫實度就可以達到流暢、體驗感平衡的效果。
我們對技術服務場景這個方向的思考,它不是適合于通用的、想把所有的企業(yè)和用戶都放在一個公共的大空間里的應用,而是要聚焦于某一個很小的細分場景,比如會議的活動,虛擬的教研活動,或者其他的展覽展示活動。
現(xiàn)在大家都在談數(shù)字人的技術,但3年以后,基礎數(shù)字人的能力,無論是建模、驅動,還是結合云以后整個AI的生成能力,可能馬上就會成為基建的技術,它會像現(xiàn)在云計算和大數(shù)據(jù)公共算力一樣,成為一種基礎能力。但是在這段時間里,整個行業(yè)的從業(yè)者如果要做到真正的落地和實現(xiàn),還是要明確自己的方向,以及對關鍵領域進行突破。
引用一個報告的數(shù)據(jù),后疫情時代,虛擬活動的場景占比和用戶接受度在逐漸增高。在這種情況下,我們有基礎的面向一個一個活動場景的產(chǎn)品架構,在這樣的架構里面,無論是數(shù)字人,還是云渲染,都已經(jīng)是基礎的技術能力。傳統(tǒng)的虛擬仿真教育,也面臨著往基于多人的互動遠程空間更加真實和更具沉浸感的發(fā)展方向,這也是未來我們發(fā)力的細分場景。
謝謝大家!
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- CSDN「智研社」第四期活動開啟-共敘大模型驅動的云產(chǎn)業(yè)變革與應用創(chuàng)新
- 助推低空經(jīng)濟發(fā)展 2025北京無人機展會 歡迎您
- 第十五屆中國國際納米技術產(chǎn)業(yè)博覽會
- CHInano 2025 第十五屆中國國際納米技術產(chǎn)業(yè)博覽會
- 文旅類:品牌較量的新高地丨第十六屆虎嘯獎征賽進行中!
- 答案即將揭曉|2024視聽圈,誰在突破重圍,誰在改變未來?
- 十余年煉就細分王者,這家激光企業(yè)“毫厘之間見真功”
- 銅業(yè)龍頭齊聚南昌!SMM銅業(yè)大會第一波進程函搶先看!
- IBS 2025 第十三屆中國國際生物質能源與有機固廢資源化利用高峰論壇
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。