自ChatGPT問(wèn)世以來(lái),以通用人工智能為代表的AI技術(shù)發(fā)展開(kāi)始“狂飆”,多家企業(yè)和研究機(jī)構(gòu)入局大模型賽道,新應(yīng)用場(chǎng)景不斷涌現(xiàn)。如何理解通用人工智能技術(shù)將帶來(lái)的巨大影響,并把握隨之而來(lái)的機(jī)遇和挑戰(zhàn),是我們面臨的兩大關(guān)鍵問(wèn)題。
5月13日,「直面AI的新一輪變革浪潮」TVP走進(jìn)騰訊活動(dòng)重磅召開(kāi),活動(dòng)邀請(qǐng)了來(lái)自產(chǎn)、學(xué)、研等領(lǐng)域的技術(shù)專家,閉門(mén)暢聊AI前沿?zé)狳c(diǎn)、未來(lái)趨勢(shì),以多元視角碰撞出眾多深度觀點(diǎn)與精彩火花。
大模型時(shí)代的學(xué)科交叉研究:以政治人物建模為例
復(fù)旦大學(xué)大數(shù)據(jù)學(xué)院副教授、數(shù)據(jù)智能與社會(huì)計(jì)算實(shí)驗(yàn)室負(fù)責(zé)人魏忠鈺帶來(lái)了題為《大模型時(shí)代的學(xué)科交叉研究:以政治人物建模為例》的主題分享。
魏忠鈺老師首先分享了現(xiàn)如今人類進(jìn)入大模型時(shí)代,大模型為學(xué)科交叉研究帶來(lái)的機(jī)遇與挑戰(zhàn),并以政治人物建模為例,剖析大模型對(duì)學(xué)科交叉研究的影響。
人類進(jìn)入大模型時(shí)代
在自然語(yǔ)言處理領(lǐng)域,每個(gè)時(shí)代都有對(duì)應(yīng)的范式。經(jīng)歷專家系統(tǒng)、淺層機(jī)器學(xué)習(xí)及深層學(xué)習(xí)這三個(gè)發(fā)展階段,隨著ChatGPT及GPT-4的出現(xiàn),人類進(jìn)入新的范式——由基座模型-指令微調(diào)-人類反饋形成的框架。
魏忠鈺老師分析到,作為當(dāng)下最前沿的技術(shù)力量,相較于傳統(tǒng)范式,大模型優(yōu)勢(shì)更明顯:
● 特征表示上,專家系統(tǒng)是基于規(guī)則的辦法;淺層機(jī)器學(xué)習(xí)具備明顯的手工特征;深層學(xué)習(xí)采取低維稠密的建模方式;大模型升級(jí)到用簡(jiǎn)單結(jié)構(gòu)化數(shù)據(jù),處理大規(guī)模高維復(fù)雜數(shù)據(jù)的水平。
● 模型構(gòu)建上,傳統(tǒng)范式只能根據(jù)任務(wù),制作對(duì)應(yīng)的定制模型,如分類模型、生成模型、檢索模型等;大模型以生成式框架完成多種任務(wù),實(shí)現(xiàn)模型的大統(tǒng)一。
●泛化能力上,過(guò)去每個(gè)模型只能解決一個(gè)指定任務(wù)或者一組相關(guān)任務(wù);而預(yù)訓(xùn)練的大模型可以在幾乎所有自然語(yǔ)言處理任務(wù)中進(jìn)行小樣本甚至零樣本的適配使用。
大模型為學(xué)科交叉帶來(lái)的機(jī)遇與挑戰(zhàn)
大模型通過(guò)構(gòu)建基座模型、利用交叉數(shù)據(jù)微調(diào),在人機(jī)交互中不斷優(yōu)化,實(shí)現(xiàn)快速開(kāi)發(fā)具備一定動(dòng)態(tài)交互能力的智能系統(tǒng),解決了傳統(tǒng)范式在學(xué)科交叉領(lǐng)域上存在的數(shù)據(jù)樣式多變、難以泛化與復(fù)用、交互能力弱等問(wèn)題。
魏忠鈺老師分析到,大模型為學(xué)科交叉帶來(lái)新機(jī)遇,提供統(tǒng)一的建模范式、實(shí)現(xiàn)知識(shí)遷移、提高建模效果以及重塑學(xué)科交叉的技術(shù)框架。但大模型也有局限性,它以語(yǔ)言模型為基礎(chǔ),僅能處理文本序列數(shù)據(jù),對(duì)真實(shí)場(chǎng)景中存在的其它蘊(yùn)含知識(shí)的數(shù)據(jù)形態(tài)進(jìn)行處理,比如行為數(shù)據(jù)、關(guān)系數(shù)據(jù)等。
魏忠鈺老師表示,想要真正發(fā)揮大模型在學(xué)科交叉研究的影響,需要在強(qiáng)大的語(yǔ)言模型的基礎(chǔ)上,考慮如何增強(qiáng)其多數(shù)據(jù)類型的處理能力,擴(kuò)展它對(duì)于領(lǐng)域知識(shí)的理解和使用,只有這樣才能達(dá)到對(duì)真實(shí)世界的深層次理解。
以政治人物建模為例,在大模型時(shí)代下學(xué)科交叉研究的發(fā)展
政治人物建模是用數(shù)據(jù)構(gòu)建政治人物的全面畫(huà)像,關(guān)鍵數(shù)據(jù)來(lái)源于公開(kāi)言論、關(guān)系數(shù)據(jù)及行為數(shù)據(jù)。魏忠鈺老師介紹了在研究過(guò)程中的三個(gè)階段:
●行為建模:基于政治人物的投票數(shù)據(jù)進(jìn)行建模,可理解其政治傾向。
●社會(huì)關(guān)系建模:構(gòu)建政治人物之間的互動(dòng)與合作關(guān)系網(wǎng)絡(luò),可理解其在政治網(wǎng)絡(luò)中的角色與地位。
●言論內(nèi)容建模:分析政治人物的公開(kāi)言論與文本數(shù)據(jù),提取觀點(diǎn)與立場(chǎng),可理解其思想主張。
三種類型的數(shù)據(jù),在政治人物畫(huà)像的過(guò)程中各自有自己的局限性,行為建模的數(shù)據(jù)易受外界影響,難以清晰表達(dá)人的核心理念;社會(huì)網(wǎng)絡(luò)分析僅依賴關(guān)系數(shù)據(jù),難以深入理解人的思想與主張;言論數(shù)據(jù)受到開(kāi)放平臺(tái)的影響,難以全面反映目標(biāo)的真實(shí)立場(chǎng)?;趫D模型的建模方法可以將這三種類型的信息進(jìn)行有效融合,完成對(duì)于目標(biāo)人物的全面建模。
圖模型雖然可以有機(jī)融合三種數(shù)據(jù),但是在具體的使用過(guò)程中,它也有自己的局限性,比如框架難以快速對(duì)未見(jiàn)過(guò)的議員進(jìn)行快速的表示學(xué)習(xí),從而限制了模型的場(chǎng)景遷移能力。為了進(jìn)一步完善政治人物建模,魏忠鈺老師及相關(guān)研究人員利用語(yǔ)言作為政治人物的表示學(xué)習(xí)基礎(chǔ),構(gòu)建出一體化的政治人物表征框架,特點(diǎn)如下:
●不直接學(xué)習(xí)政治人物節(jié)點(diǎn)的表征,而是學(xué)習(xí)政治人物言論到其表征的映射過(guò)程。
●通過(guò)檢索政治人物的所有公開(kāi)言論,構(gòu)建兩種粒度的言論表征:通用言論表征與政治領(lǐng)域言論表征。
●通過(guò)兩種自監(jiān)督任務(wù)實(shí)現(xiàn)場(chǎng)景知識(shí)的注入與優(yōu)化:
(1)結(jié)構(gòu)感知對(duì)比學(xué)習(xí):利用人物與黨派、其他人物的關(guān)系作為監(jiān)督信號(hào)更新參數(shù)。
(2)行為驅(qū)動(dòng)對(duì)比學(xué)習(xí):利用人物與投票結(jié)果的關(guān)系作為監(jiān)督信號(hào)更新參數(shù)。
在大模型基礎(chǔ)之上,政治人物表征框架利用大規(guī)模語(yǔ)料構(gòu)建語(yǔ)言模型,通過(guò)設(shè)計(jì)自監(jiān)督任務(wù),實(shí)現(xiàn)外界知識(shí)的注入與優(yōu)化,打開(kāi)了一條融合多學(xué)科與多模態(tài)知識(shí)的新路徑,助推學(xué)科交叉領(lǐng)域的進(jìn)一步發(fā)展。
引爆:ChatGPT與AIGC帶來(lái)的思考與應(yīng)用趨勢(shì)
騰訊政策發(fā)展中心副主任Darren老師,帶來(lái)了《引爆:ChatGPT與AIGC帶來(lái)的思考與應(yīng)用趨勢(shì)》的主題演講,從變革趨勢(shì)、產(chǎn)業(yè)應(yīng)用及后續(xù)布局角度切入進(jìn)行分享,探討AI技術(shù)發(fā)展如何為用戶創(chuàng)造更高價(jià)值。
從超級(jí)個(gè)體看AIGC的發(fā)展
Darren老師指出,ChatGPT和GPT-4等先進(jìn)語(yǔ)言模型的出現(xiàn),標(biāo)志著AI已經(jīng)初步實(shí)現(xiàn)與人類的自然交互。這一突破預(yù)示著AI將對(duì)各行各業(yè)產(chǎn)生深遠(yuǎn)影響。然而,將AI視為產(chǎn)品或服務(wù)的賣(mài)點(diǎn)是片面的,應(yīng)把AI深度融入產(chǎn)品或服務(wù)之中,成為核心競(jìng)爭(zhēng)力。
另一大趨勢(shì)為產(chǎn)品逐漸從適應(yīng)大多數(shù)用戶,轉(zhuǎn)向滿足每個(gè)用戶的個(gè)性化需求,這意味著“產(chǎn)品適配用戶”將取代“用戶適配產(chǎn)品”,甚至?xí)霈F(xiàn)“一次性使用”的產(chǎn)品。Darren老師表示,隨著技術(shù)的進(jìn)步,個(gè)性化定制的AI助理即將問(wèn)世,但這項(xiàng)技術(shù)的前提,需要企業(yè)掌握海量的用戶數(shù)據(jù),深度理解用戶需求并迅速響應(yīng),這意味著企業(yè)需有快速的產(chǎn)品設(shè)計(jì)與迭代能力。
從應(yīng)用角度看AIGC的影響
AI技術(shù)的快速發(fā)展正在驅(qū)動(dòng)產(chǎn)業(yè)變革,大模型與生成式人工智能的出現(xiàn)顯現(xiàn)出強(qiáng)大的生產(chǎn)力。Darren老師認(rèn)為,隨著大模型參數(shù)的增加和泛化能力的提高,AI可以完成更復(fù)雜的任務(wù),生成式人工智能可高效生產(chǎn)各種創(chuàng)意和素材。
在人工智能的加持下,電商領(lǐng)域形成了逆向種草現(xiàn)象,通過(guò)AI生成多樣化案例,吸引用戶主動(dòng)提出定制化意見(jiàn),從而實(shí)現(xiàn)快速生產(chǎn)與銷(xiāo)售;AI變聲技術(shù)通過(guò)人工智能賦能音樂(lè)創(chuàng)作,實(shí)現(xiàn)更豐富多樣的音樂(lè)體驗(yàn);AI生成包裝設(shè)計(jì)可自動(dòng)生成設(shè)計(jì)方案,提高效率的同時(shí),滿足品牌和用戶的個(gè)性化定制需求。從C端滲透到B端,AI技術(shù)為傳統(tǒng)行業(yè)帶來(lái)了深刻影響。
大模型的未來(lái)布局
大模型創(chuàng)新面臨著社會(huì)各界缺乏共識(shí)以及企業(yè)視角局限的挑戰(zhàn),該如何衡量創(chuàng)業(yè)賽道是否適合應(yīng)用AI技術(shù)呢?Darren老師指出,關(guān)鍵因素在于賽道對(duì)AI技術(shù)的濃度。所謂“濃度”是指AI技術(shù)在這一賽道上的實(shí)際應(yīng)用程度與集成度,只有當(dāng)AI技術(shù)能夠高度融入并在業(yè)務(wù)流程或領(lǐng)域中發(fā)揮關(guān)鍵作用時(shí),才有望將AI從輔助工具變成顛覆性武器,從簡(jiǎn)單的“點(diǎn)綴”變成“改變游戲規(guī)則”的力量。AI的最高境界,就是AI與業(yè)務(wù)場(chǎng)景的深度融合。
選擇研發(fā)通用大模型還是領(lǐng)域模型?Darren老師表示,通用大模型與領(lǐng)域模型的優(yōu)勢(shì)不同,通用大模型具有海量數(shù)據(jù),專屬模型在特定領(lǐng)域中表現(xiàn)出色,例如Bloomberg的金融領(lǐng)域?qū)I(yè)模型,需大量金融知識(shí)與數(shù)據(jù)投入,才能超越通用模型的表現(xiàn)。因此若是細(xì)分行業(yè),可以嘗試建立領(lǐng)域?qū)倌P汀nA(yù)計(jì)下半年會(huì)有更多垂直領(lǐng)域的AI模型問(wèn)世,這將成為未來(lái)企業(yè)創(chuàng)造價(jià)值的重要途徑。
圓桌論壇 |ChatGPT狂飆,如何應(yīng)對(duì)AI的新一輪技術(shù)變革?
本場(chǎng)圓桌論壇以《ChatGPT狂飆,如何應(yīng)對(duì)AI的新一輪技術(shù)變革?》為主題,由新浪微博新技術(shù)研發(fā)負(fù)責(zé)人、騰訊云TVP 張俊林老師擔(dān)任主持,提出眾多深度問(wèn)題,圖靈聯(lián)合創(chuàng)始人、智源研究院前副院長(zhǎng)、騰訊云TVP創(chuàng)始委員 劉江老師、復(fù)旦大學(xué)大數(shù)據(jù)學(xué)院副教授、數(shù)據(jù)智能與社會(huì)計(jì)算實(shí)驗(yàn)室負(fù)責(zé)人 魏忠鈺老師、熵簡(jiǎn)科技聯(lián)合創(chuàng)始人、騰訊云TVP 李漁老師共同參加對(duì)話交流。
ChatGPT引發(fā)巨大反響的原因
李漁:這次給我們非常大的震撼,讓我們意識(shí)到AGI的曙光真正來(lái)了。我之前一直從事NLP方面的研究,這次以ChatGPT為代表的技術(shù),相對(duì)之前有兩個(gè)方面的重要突破,第一,有強(qiáng)大的通用學(xué)習(xí)能力,用一個(gè)模型可以做各種各樣專業(yè)的任務(wù),我們?cè)诙鄠€(gè)金融場(chǎng)景下測(cè)試,效果超出業(yè)務(wù)人員預(yù)期;第二,它有強(qiáng)大的常識(shí)與推理能力,具備較為完備的常識(shí)知識(shí)與理解力,在生成語(yǔ)言表達(dá)時(shí)可根據(jù)上下文做出精準(zhǔn)回應(yīng)。
魏忠鈺:學(xué)術(shù)研究到產(chǎn)品化到商業(yè)落地,這個(gè)過(guò)程一直是非常漫長(zhǎng)的,這個(gè)過(guò)程也給了整個(gè)社會(huì)接受新技術(shù)的時(shí)間。然而類似于ChatGPT這樣的大規(guī)模語(yǔ)言模型,本來(lái)在技術(shù)層面上就是最前沿的,而得益于優(yōu)秀的產(chǎn)品設(shè)計(jì),直接從最前沿的學(xué)術(shù)理論,一躍成為商業(yè)產(chǎn)品,這帶來(lái)的影響是震撼的。相當(dāng)于社會(huì)對(duì)最新技術(shù)的理解消化過(guò)程急劇縮短了。
通用大模型VS領(lǐng)域大模型的關(guān)系
魏忠鈺:通用模型和領(lǐng)域模型區(qū)別在于,通用大模型提供最基本的語(yǔ)義理解與知識(shí)表達(dá)能力,領(lǐng)域模型針對(duì)特定領(lǐng)域數(shù)據(jù)與任務(wù)進(jìn)行優(yōu)化,具有更加專業(yè)的知識(shí)與理解力。雖然大模型具備了強(qiáng)大的泛化能力,但在特定任務(wù)的學(xué)習(xí)過(guò)程中仍然存在一定程度的“災(zāi)難遺忘”,使得它在具體任務(wù)中的表現(xiàn)并非出類拔萃。在一些特定場(chǎng)景下,我們對(duì)于模型的寬容度很低,因此,需要對(duì)模型進(jìn)行任務(wù)或者場(chǎng)景導(dǎo)向下的定向調(diào)優(yōu),這給領(lǐng)域模型留出了空間。
張俊林:關(guān)于這兩者的關(guān)系,現(xiàn)在市面上存在兩種不同的觀點(diǎn)。一種觀點(diǎn)認(rèn)為,未來(lái)通用模型將越來(lái)越強(qiáng),領(lǐng)域模型只有建立在非常強(qiáng)大的通用模型上才能發(fā)揮最大優(yōu)勢(shì);另一種觀點(diǎn)則認(rèn)為,直接利用領(lǐng)域數(shù)據(jù)在普通的通用模型上進(jìn)行修正與優(yōu)化,可以更快建立適用于該領(lǐng)域的強(qiáng)大模型。目前很多人更偏向于第二種觀點(diǎn)。
李漁:我覺(jué)得通用模型和領(lǐng)域模型是互補(bǔ)的關(guān)系。GPT-4代表當(dāng)前通用大模型的天花板,它的背后對(duì)應(yīng)著一個(gè)非常強(qiáng)大的認(rèn)知能力,這種強(qiáng)大的認(rèn)知和推理能力在小模型或是領(lǐng)域模型上是很難實(shí)現(xiàn)的。領(lǐng)域模型的好處在于更專業(yè)的場(chǎng)景上有更專業(yè)的知識(shí)和表達(dá)。在特定的任務(wù)場(chǎng)景下?lián)碛歇?dú)特優(yōu)勢(shì)。二者互相配合去完成現(xiàn)實(shí)世界中的各種復(fù)雜任務(wù)。
國(guó)內(nèi)大模型研發(fā)的現(xiàn)狀、機(jī)遇與挑戰(zhàn)
李漁:大模型整個(gè)生態(tài)是一個(gè)完整的鏈條,從基礎(chǔ)的算力到大模型的研發(fā),再到產(chǎn)品化落地,是一個(gè)很廣的生態(tài)。做基座大模型對(duì)資源投入要求確實(shí)很高,目前階段,對(duì)于小團(tuán)隊(duì)而言,做一些垂直領(lǐng)域的差異化的產(chǎn)品是更好的選擇。另外,算力的提升也是影響國(guó)產(chǎn)大模型發(fā)展很重要的方面。國(guó)內(nèi)研發(fā)出與GPT-4完全對(duì)標(biāo)的大模型所需要的具體時(shí)間目前來(lái)看較難確定,這取決于很多因素,但如果某個(gè)模型的認(rèn)知與學(xué)習(xí)能力不斷在進(jìn)化,它可以反過(guò)來(lái)調(diào)教另外的模型,實(shí)現(xiàn)螺旋上升的效果。
魏忠鈺:對(duì)國(guó)內(nèi)大模型的研發(fā),我保持樂(lè)觀態(tài)度,并且相信在基座大模型方面雙方距離是會(huì)越來(lái)越接近的,在當(dāng)前的開(kāi)源環(huán)境下,很多的所謂的“護(hù)城河”并不堅(jiān)固,甚至可以說(shuō),沒(méi)有秘密可言。另外一個(gè)判斷是,目前的大模型依舊難以突破“意識(shí)”的天花板,現(xiàn)在我們看到的或許已經(jīng)是當(dāng)前技術(shù)路徑的最終形態(tài)了,難以通過(guò)迭代實(shí)現(xiàn)“階躍式”的進(jìn)步。如果是這樣的話,那么,我們還有足夠的時(shí)間去無(wú)限靠近當(dāng)前的最終形態(tài)。
張俊林:類似GPT水準(zhǔn)的模型,我相信國(guó)內(nèi)一定是可以做出來(lái)的,只要持續(xù)投入計(jì)算資源、數(shù)據(jù)采集與人才團(tuán)隊(duì)等方面的成本就可以。我認(rèn)為明年6月之前是可以做出對(duì)標(biāo)ChatGPT3.5版本的,但是能達(dá)到具備GPT-4水準(zhǔn)的模型,我的態(tài)度不太樂(lè)觀。因?yàn)榫湍壳皝?lái)說(shuō)國(guó)內(nèi)整體環(huán)境還是相對(duì)浮躁,要達(dá)到GPT-4水準(zhǔn)還需要研發(fā)攻堅(jiān)和大量的創(chuàng)新投入。
AI重構(gòu)產(chǎn)業(yè)形態(tài),如何應(yīng)對(duì)沖擊與變革
李漁:我認(rèn)為我們應(yīng)持積極擁抱的態(tài)度。ChatGPT作為工具,將為我們的工作效率帶來(lái)乘數(shù)級(jí)別的提升。越聰明、越積極主動(dòng)的人,這個(gè)工具給他帶來(lái)的乘數(shù)效應(yīng)將會(huì)越大,這對(duì)于個(gè)人而言是極其幸運(yùn)的。對(duì)于企業(yè)來(lái)說(shuō),管理層也應(yīng)當(dāng)把數(shù)字員工計(jì)劃作為企業(yè)的重要議題開(kāi)始考慮,當(dāng)然這需要一定的時(shí)間。
魏忠鈺:我非常贊同超級(jí)個(gè)體這一概念。在這個(gè)時(shí)代后,對(duì)于個(gè)人創(chuàng)業(yè)者將會(huì)越來(lái)越友好。ChatGPT出來(lái)后,可以預(yù)見(jiàn)到很多技術(shù)門(mén)檻將會(huì)越來(lái)越低,在大模型時(shí)代,我們應(yīng)該發(fā)揮主觀能動(dòng)性,想方設(shè)法把這個(gè)東西用起來(lái),真正去創(chuàng)造價(jià)值。
結(jié)語(yǔ)
隨著大模型技術(shù)的日益成熟,未來(lái)通用人工智能將引發(fā)更多領(lǐng)域的變革與重塑,深層次的人工智能應(yīng)用將創(chuàng)造更多跨業(yè)態(tài)、個(gè)性化、高效率的商業(yè)模式與服務(wù)模式。在通用人工智能時(shí)代,TVP將繼續(xù)秉持著“用科技影響世界”的初心,通過(guò)每一場(chǎng)深度分享,攜手行業(yè)技術(shù)專家,共同助推人工智能的健康發(fā)展,讓技術(shù)普惠于人。
TVP,即騰訊云最具價(jià)值專家(Tencent Cloud Valuable Professional),是騰訊云授予云計(jì)算領(lǐng)域技術(shù)專家的一個(gè)獎(jiǎng)項(xiàng)。TVP致力打造與行業(yè)技術(shù)專家的交流平臺(tái),促進(jìn)騰訊云與技術(shù)專家和用戶之間的有效溝通,從而構(gòu)建云計(jì)算技術(shù)生態(tài),實(shí)現(xiàn)“用科技影響世界”的美好愿景。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )