中國(guó)大模型應(yīng)用,正在進(jìn)入“可觀(guān)測(cè)期”。
《中國(guó)大模型中標(biāo)項(xiàng)目監(jiān)測(cè)報(bào)告(2024年5月)》中顯示,截至5月,中國(guó)大模型的相關(guān)中標(biāo)金額已經(jīng)超過(guò)2023年全部中標(biāo)項(xiàng)目的披露金額。
在大模型全面落地四處開(kāi)花的同時(shí),大模型正擺脫“不可觀(guān)測(cè)”狀態(tài),過(guò)去由于大量大模型應(yīng)用在B端,信息相對(duì)封閉,對(duì)于產(chǎn)業(yè)來(lái)說(shuō),他們很難清晰獲知大模型技術(shù)水平、擅長(zhǎng)領(lǐng)域、落地能力,無(wú)形中增加了智慧化轉(zhuǎn)型的決策成本。
隨著大模型技術(shù)評(píng)測(cè)體系的逐漸成熟,我們仿佛擁有了天文望遠(yuǎn)鏡,可以在群星閃耀中,找到那顆最耀眼的星。
最近,國(guó)際權(quán)威機(jī)構(gòu)IDC發(fā)布了《中國(guó)大模型市場(chǎng)主流產(chǎn)品評(píng)估,2024》,智源研究院打造的FlagEval天秤大模型評(píng)測(cè)平臺(tái)也發(fā)布了最新一期模型評(píng)測(cè)排行榜單,兩項(xiàng)評(píng)測(cè)中百度文心大模型實(shí)現(xiàn)了雙榜奪魁。
“望遠(yuǎn)鏡”背后技術(shù)評(píng)價(jià)機(jī)制
我們可以簡(jiǎn)單看看,這兩架“天文望遠(yuǎn)鏡”分別采用了哪些評(píng)價(jià)機(jī)制。
IDC的評(píng)估分為基礎(chǔ)能力和應(yīng)用能力,其中基礎(chǔ)方面涉及問(wèn)答、推理、創(chuàng)作、數(shù)學(xué)、代碼等能力,應(yīng)用方面既考驗(yàn)toC通用場(chǎng)景,也考驗(yàn)金融、零售、法律等toB細(xì)分場(chǎng)景。
盡管有GPT-4這樣的有力對(duì)手,文心一言仍然在七大維度全面領(lǐng)先。
智源研究院打造的FlagEval天秤大模型測(cè)評(píng)平臺(tái)發(fā)布于2023年,面向視頻、語(yǔ)音、多模態(tài)等多個(gè)領(lǐng)域,在FlagEval大語(yǔ)言模型評(píng)測(cè)體系當(dāng)前包含6大評(píng)測(cè)任務(wù),近30個(gè)評(píng)測(cè)數(shù)據(jù)集,超10萬(wàn)道評(píng)測(cè)題目。
在閉源對(duì)話(huà)模型榜單中,文心大模型4.0以89.72的綜合評(píng)分排名第一,OpenAI的GPT-4o等位列其后。
可見(jiàn)不論是從全領(lǐng)域能力角度進(jìn)行評(píng)估,還是考察至關(guān)重要的大語(yǔ)言水平,文心一言毫無(wú)疑問(wèn)都是中文大模型的榜首,是星海中光芒最耀眼的一顆。
技術(shù)之光
抬頭仰望星空時(shí),我們看到的,其實(shí)是星星幾年,甚至幾十幾百年以前留下的掠影。
同樣,想要讓大模型從“不可觀(guān)測(cè)”變?yōu)椤翱捎^(guān)測(cè)”,除了對(duì)當(dāng)下的技術(shù)能力進(jìn)行評(píng)測(cè),我們也要回溯光芒的源頭,也就是大模型的技術(shù)內(nèi)核。
從文心大模型來(lái)看,這種技術(shù)之光可以分為兩個(gè)層面:
第一層,是技術(shù)投入的“原生光芒”。
百度對(duì)于深度學(xué)習(xí)的探索挖掘,包括對(duì)AI技術(shù)的應(yīng)用,已經(jīng)有十?dāng)?shù)年之久。在大模型熱還未被掀起的2019年,百度就打造了第一代文心大模型體系,從而才有了建立在文心大模型之上的文心一言。
如今經(jīng)過(guò)數(shù)次迭代,文心大模型在理解、生成、邏輯、記憶四大能力讓其他廠(chǎng)商難以望其項(xiàng)背。IDC報(bào)告中就顯示,在數(shù)學(xué)類(lèi)和代碼類(lèi)等考驗(yàn)?zāi)P瓦壿?、推理等能力的評(píng)測(cè)中,百度文心大模型體現(xiàn)出了強(qiáng)大的體系化思維、邏輯思維和抽象思維能力。
能力迭代背后,是文心大模型有條不紊的全面技術(shù)布局。
比如通過(guò)文心飛槳的聯(lián)合調(diào)優(yōu),通過(guò)高效算力和自研框架來(lái)提升大模型的訓(xùn)練效率,增加技術(shù)的迭代速度。
又比如面對(duì)近年來(lái)爆火的智能體Agent技術(shù),文心大模型第一時(shí)間推出了文心智能體平臺(tái)。在基礎(chǔ)模型能力上疊加思考增強(qiáng)訓(xùn)練,以基礎(chǔ)模型+思考模型的形式,讓大模型更接近于人類(lèi)的學(xué)習(xí)、理解和執(zhí)行模式。
像百度自己,就通過(guò)這種模式打造了代碼智能體和智能代碼助手Comate,目前Comate生成代碼整體采納率已達(dá)46%,新增代碼中生成比例已達(dá)27%。IDC的報(bào)告中我們也能發(fā)現(xiàn),在代碼類(lèi)所有6個(gè)細(xì)分維度中,百度均入圍優(yōu)勢(shì)廠(chǎng)商。
對(duì)于技術(shù)研發(fā)的深埋與前瞻,讓這顆星體源源不斷的釋放著創(chuàng)新之火,點(diǎn)亮宇宙的一隅。
第二層,是產(chǎn)業(yè)協(xié)作的“折射光芒”。
文心大模型能力的來(lái)源,除了自身的研發(fā)投入,還有廣泛的產(chǎn)業(yè)實(shí)踐。
截至目前,文心一言累計(jì)用戶(hù)規(guī)模已達(dá)2億,日均調(diào)用量也達(dá)到了2億。這一數(shù)字在同類(lèi)生成式AI產(chǎn)品中一騎絕塵。
在toB領(lǐng)域,百度一方面將文心大模型全面落地于自身業(yè)務(wù)中,如搜索、地圖、信息流。同時(shí)百度智能云還推出了千帆大模型平臺(tái),打造一站式企業(yè)級(jí)大模型開(kāi)發(fā)平臺(tái)。不久前,文心大模型還對(duì)外免費(fèi)開(kāi)放了ERNIE Speed、ERNIE Lite兩款主力模型。
在不斷對(duì)外開(kāi)放的過(guò)程中,文心大模型的調(diào)用量呈幾何式增長(zhǎng),合作伙伴與案例也越來(lái)越多。從國(guó)家電網(wǎng)、南方電網(wǎng)、中國(guó)航天這樣的國(guó)之重器,到金融保險(xiǎn)領(lǐng)域的浦發(fā)銀行、泰康保險(xiǎn),再到終端領(lǐng)域的榮耀、三星,媒體領(lǐng)域汽車(chē)之家……在不斷與合作伙伴共建行業(yè)大模型的過(guò)程中,文心大模型已經(jīng)實(shí)現(xiàn)了中國(guó)最為廣泛的產(chǎn)業(yè)落地規(guī)模。
在廣泛的產(chǎn)業(yè)合作中,文心大模型得以被真實(shí)應(yīng)用場(chǎng)景滋養(yǎng),不斷從中發(fā)掘細(xì)節(jié)需求,進(jìn)而針對(duì)性地提升技術(shù)能力。
舉例來(lái)說(shuō),在大量的實(shí)踐中百度得以發(fā)掘,大模型落地過(guò)程中,效果、效率和成本都是重要考量。因此,推出了多模型推理技術(shù)來(lái)提升推理效率,以降低落地成本。
有對(duì)周?chē)a(chǎn)業(yè)伙伴光芒的“折射”,我們觀(guān)測(cè)到的星光可以更加立體。文心大模型的成就不僅僅來(lái)自機(jī)構(gòu)評(píng)測(cè)的認(rèn)可,更來(lái)自一個(gè)個(gè)堅(jiān)實(shí)的落地案例。
大模型星光如何照耀產(chǎn)業(yè)星球
當(dāng)我們望見(jiàn)星光時(shí),它正在向軌道更遠(yuǎn)處運(yùn)行著,從大模型元年,走入了大模型落地元年。
《中國(guó)大模型中標(biāo)項(xiàng)目監(jiān)測(cè)報(bào)告(2024年5月)》中顯示,今年5月份大模型中標(biāo)項(xiàng)目數(shù)量創(chuàng)下了新高。毫無(wú)疑問(wèn),隨著大模型“不可觀(guān)測(cè)性”逐漸褪去,產(chǎn)業(yè)對(duì)于大模型的需求,正在進(jìn)入井噴狀態(tài)。需求暴漲的情況下,大模型要如何站穩(wěn)潮頭,真正在行業(yè)領(lǐng)域站穩(wěn)腳跟?以文心大模型為例,縱觀(guān)文心大模型近一年來(lái)的動(dòng)作,仿佛是一場(chǎng)星際旅行,不斷從遙遠(yuǎn)的技術(shù)天空貼近我們所在的應(yīng)用星球。
文心大模型留下了技術(shù)的軌跡,通過(guò)不斷的研發(fā),讓大模型更加貼近AGI,在能力層面更適應(yīng)應(yīng)用領(lǐng)域的復(fù)雜任務(wù)。
文心大模型也留下了普惠的軌跡,主力模型的免費(fèi)開(kāi)放,落地成本的不斷降低,都讓大模型更加易用,讓更多產(chǎn)業(yè)伙伴加入行業(yè)大模型的聯(lián)合創(chuàng)新中。
文心大模型還留下了生態(tài)的軌跡,百度對(duì)于開(kāi)發(fā)者生態(tài)的建設(shè)持之以恒,目前已在全國(guó)最大AI社區(qū)“星河社區(qū)”中打造了大模型板塊,也推出了智能體平臺(tái)這樣降低大模型應(yīng)用研發(fā)門(mén)檻的工具。開(kāi)發(fā)生態(tài)的繁榮,讓文心具備更多引力,加速向產(chǎn)業(yè)目標(biāo)行駛而去。
有了這三道清晰的軌跡,我們也就能夠望見(jiàn)文心,包括整體中國(guó)大模型的未來(lái)將如何到來(lái)。
星移斗轉(zhuǎn)中,產(chǎn)業(yè)對(duì)于大模型能力與價(jià)值的認(rèn)知正在逐漸清晰。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀(guān)察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀(guān)點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美國(guó)無(wú)人機(jī)禁令升級(jí)?當(dāng)?shù)乜茖W(xué)家率先“喊疼”:我們離不開(kāi)大疆
- iQOO Neo10 Pro:性能特長(zhǎng)之外,亦有全能實(shí)力
- 自動(dòng)駕駛第一股的轉(zhuǎn)型迷途:圖森未來(lái)賭上了AIGC
- 明星熱劇、品牌種草、平臺(tái)資源,京東讓芬騰雙11的熱度“沸騰”了
- 一加 Ace 5 Pro明牌:游戲手機(jī)看它就夠了!
- 游戲體驗(yàn)天花板,一加 Ace 5 系列售價(jià) 2299 元起
- 16個(gè)月沒(méi)工資不敢離職,這些打工人“自費(fèi)上班”
- 怎樣利用微信小店“送禮”功能賺錢(qián)?
- 鴻蒙智行問(wèn)界M9,中國(guó)豪華車(chē)的龍門(mén)一躍
- 科技云報(bào)道:人工智能時(shí)代“三大件”:生成式AI、數(shù)據(jù)、云服務(wù)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。