豆包,大模型的磁力三重奏

如今,很多媒體與AI從業(yè)者都在追問一個(gè)問題:大模型,究竟堵在哪了?

經(jīng)歷了2023年的百模大戰(zhàn),AI產(chǎn)業(yè)迎來了從“是否有大模型”到“如何用大模型”的轉(zhuǎn)換期。各個(gè)大模型平臺(tái)紛紛走向了公開應(yīng)用階段,面向C端與B端提供能力繁多的大模型應(yīng)用。

然而問題也隨之而來。在大模型平臺(tái)百花齊放的同時(shí),我們也能發(fā)現(xiàn)平臺(tái)之間的同質(zhì)化急速加劇。C端用戶很難分清不同大模型應(yīng)用之間的差異化,企業(yè)用戶面臨著復(fù)雜的大模型應(yīng)用成本,進(jìn)而導(dǎo)致真正能夠?qū)崿F(xiàn)規(guī)?;{(diào)用的大模型寥寥無幾。

在技術(shù)相對(duì)成熟之后,大模型與用戶之間,似乎還是缺少了一點(diǎn)磁力。

我們經(jīng)常討論,沒有任何底層技術(shù)可以不經(jīng)過產(chǎn)品化探索,不進(jìn)行商業(yè)邏輯設(shè)計(jì)就獲得用戶認(rèn)可。技術(shù)、產(chǎn)品、商業(yè),三者之間一定是互為犄角的態(tài)勢(shì),缺一不可。而在百模大戰(zhàn)的進(jìn)程中,行業(yè)往往會(huì)更重視模型本身的技術(shù)發(fā)展,忽視產(chǎn)品化與商業(yè)設(shè)計(jì)的重要性。這種缺失與真空,也就是大模型缺乏用戶磁力的來源。

好在隨著時(shí)間推移,類似難題正在得到正視和解決。不久之前,在火山引擎2024“AI創(chuàng)新巡展”成都站期間,火山引擎宣布豆包大模型日均Tokens使用量已突破5000億,平均每家企業(yè)用戶日均Tokens使用量較5月15日模型發(fā)布時(shí)期增長了22倍。

豆包大模型的高增長,或許正是給大模型的用戶磁力難題,寫下了一張答卷。

被廣泛討論的大模型的商業(yè)難,落地難,究竟來源于何處?

從軟件技術(shù)走向應(yīng)用的時(shí)間邏輯上看。基礎(chǔ)軟件技術(shù)迭代之后,往往需要較長的產(chǎn)品化周期,進(jìn)而其中優(yōu)秀的產(chǎn)品最終走向商業(yè)化。但大模型風(fēng)潮與以往不同,其技術(shù)特征中本身就有極強(qiáng)的應(yīng)用色彩。這導(dǎo)致AIGC類平臺(tái)與應(yīng)用的爆發(fā),基本沒有經(jīng)歷任何的產(chǎn)品化周期,而是直接從算法革新走向了商用落地。

這種特殊的發(fā)展方式,讓大模型短期內(nèi)走到了“兩多一快”的境地:市場上的大模型應(yīng)用多,單一大模型應(yīng)用提供的AIGC能力多,從技術(shù)走向商用的時(shí)間快。于是,用戶還沒來得及了解,眼前就被擺滿了花樣繁多的大模型應(yīng)用;企業(yè)用戶還沒有準(zhǔn)備好大模型的應(yīng)用場景與商業(yè)邏輯,就被智能化熱潮裹挾其中。

大模型帶來的全新應(yīng)用可能性,原本應(yīng)該與用戶形成極強(qiáng)的磁力,但大模型的同質(zhì)化,與用戶的沒有準(zhǔn)備好之間,反而形成了一種“消磁”效應(yīng)。具體來看,我們可以將其拆解為三個(gè)問題:

1.C端消磁。產(chǎn)品體驗(yàn)感的缺失,以及技術(shù)的雷同化,讓用戶難以體會(huì)到大模型的魅力所在,進(jìn)而在嘗鮮期過后,快速出現(xiàn)了對(duì)大模型應(yīng)用的擱置。

2.B端消磁。過高的嘗試成本,讓企業(yè)在還沒有準(zhǔn)備好實(shí)用大模型的時(shí)候,就需要付出較大的模型部署成本,從而導(dǎo)致大量企業(yè)傾向?qū)Υ竽P瓦M(jìn)行觀望。

3.行業(yè)消磁。快速成型的大模型體系,更多提供的是通用性較強(qiáng)的能力。然而眾多行業(yè)需要的是專業(yè)化、定制化的AI功能,不能充分了解行業(yè)需求,導(dǎo)致大模型能力浮于行業(yè)表面,無法深入其中。

2023年8月,字節(jié)旗下的首款類GPT應(yīng)用豆包正式發(fā)布,很快攻陷各大應(yīng)用市場。目前豆包底層的大模型已經(jīng)應(yīng)用于字節(jié)內(nèi)部各大業(yè)務(wù),覆蓋了協(xié)同辦公、數(shù)據(jù)分析、文案創(chuàng)作、輔助編程、內(nèi)容審核等場景。當(dāng)這個(gè)大模型最終以“豆包大模型”的名稱正式發(fā)布走向市場,所需面對(duì)的最大挑戰(zhàn)就是如何建立AI與用戶之間的磁力,打通大模型的商業(yè)化落地空間。

此后的近一年時(shí)間里,我們能看到豆包帶來了關(guān)于大模型磁力的三重奏。

經(jīng)歷了快速的技術(shù)迭代與產(chǎn)品梳理,如今“豆包”的定義更加明確和統(tǒng)一。它表面是一款類GPT的應(yīng)用,背后實(shí)際是一整個(gè)豆包模型家族,而與底層大模型同名的豆包APP,則是字節(jié)通過模型升級(jí)產(chǎn)品體驗(yàn),與C端用戶重新建立磁力的通道。

為了破解大模型應(yīng)用缺乏魅力,產(chǎn)品同質(zhì)化太高的問題,豆包貫徹了一個(gè)核心產(chǎn)品設(shè)計(jì)原則,擬人化。

從AI命題被提出的那一刻,這種技術(shù)的核心就是讓機(jī)器模仿人。而伴隨著無數(shù)科幻作品的熏陶,大眾對(duì)AI魅力的認(rèn)知與期待也都在于擬人。但要注意的是,AI擬人的目標(biāo)并不能僅僅依靠技術(shù)手段來實(shí)現(xiàn)。而是需要產(chǎn)品層面的更多雕琢。

為了實(shí)現(xiàn)豆包的擬人化,相關(guān)團(tuán)隊(duì)在多個(gè)層級(jí)進(jìn)行了一系列產(chǎn)品設(shè)計(jì)。比如說,依靠豆包家族里的語音識(shí)別模型和聲音復(fù)刻模型,進(jìn)而實(shí)現(xiàn)與其對(duì)話貼近與真人對(duì)話的感覺。

在進(jìn)入豆包聊天界面后,用戶會(huì)感覺到與社交軟件非常相似的產(chǎn)品設(shè)計(jì)。比如說,聊天框頂部有對(duì)話頭像,這一點(diǎn)繼承了用戶與真人聊天的產(chǎn)品習(xí)慣。

在豆包大模型家族中,還推出了角色扮演模型。這個(gè)模型當(dāng)中,AI會(huì)模仿不同人設(shè)、不同性格的人來與用戶進(jìn)行對(duì)話,并且可以通過智能體來自行設(shè)定聊天角色。將擬人化作為核心功能之一,可以快速拉近與用戶的距離,消弭掉用戶對(duì)AI技術(shù)的陌生感。

具體到AIGC能力當(dāng)中,豆包同樣強(qiáng)調(diào)擬人化思路的貫徹。比如豆包在進(jìn)行PPT制作功能時(shí),在PPT生成之外還會(huì)提出制作PPT所需注意的問題。這就非常類似于朋友或同事進(jìn)行合作時(shí)的情況,而不僅僅是簡單的AI工具。

在擬人化核心特性的加持下,豆包很快得到了用戶群,尤其是年輕用戶的認(rèn)可。隨后,豆包的戰(zhàn)略權(quán)重開始不斷上升。形成了具有多模態(tài)能力的模型家族,包含了通用模型pro、通用模型lite、語音識(shí)別模型、語音合成模型、文生圖模型等十款模型。

豆包雖然是AI模型,但其差異化恰好在于對(duì)“人”的重視。通過精細(xì)的擬人化產(chǎn)品設(shè)計(jì),其完成了對(duì)大模型同質(zhì)化問題的擺脫。

而在產(chǎn)業(yè)端,豆包也將這種直面問題核心的思路貫徹了下去。

面對(duì)大模型機(jī)遇,各行業(yè)以及無數(shù)AI開發(fā)者都躍躍欲試。但較高的模型使用成本,依舊會(huì)給企業(yè)進(jìn)行大模型探索、試錯(cuò)造成一定的影響。尤其伴隨業(yè)務(wù)的不斷發(fā)展,大模型成本也會(huì)不斷上升。在真正推動(dòng)大模型落地前,成本賬是企業(yè)用戶必須先算清楚的。

與此同時(shí),大模型的開發(fā)方面臨著另一重困境。模型的調(diào)用量不足,開發(fā)者生態(tài)無法成型,直接導(dǎo)致大模型無法根據(jù)反饋進(jìn)行優(yōu)化調(diào)整,單位模型的推理成本也居高不下。因此,只有用起來才是大模型的唯一出路。對(duì)于大模型本身和企業(yè)用戶而言,中間的成本門檻已經(jīng)成為雙方共同的困擾。

在這樣的態(tài)勢(shì)下,豆包率先進(jìn)行了大模型低成本化的商業(yè)思路。豆包大模型目前通過字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái)火山引擎面向企業(yè)開放,5月15日,豆包大模型正式發(fā)布之時(shí),火山引擎宣布豆包主力模型在企業(yè)市場的定價(jià)已經(jīng)達(dá)到了0.0008元/千Tokens,0.8厘就能處理1500多個(gè)漢字。這個(gè)價(jià)格已經(jīng)降低到了此前行業(yè)通行方案的1%還低。

豆包率先推動(dòng)大模型進(jìn)入“厘時(shí)代”,為企業(yè)降低智能化成本帶來了巨大的影響。整個(gè)行業(yè)開始跟隨和效仿,企業(yè)以更低成本、更便捷方式接入大模型成為新的主流。

尤其值得注意的是,與行業(yè)內(nèi)流行輕量化版本降價(jià),吸引企業(yè)用戶試用,然后主力模型保持較高價(jià)格的思路不同。豆包將主力模型與輕量化模型都進(jìn)行了大幅價(jià)格優(yōu)化,主力模型給出了低于行業(yè)價(jià)格99%的定價(jià)。為企業(yè)用戶與大模型之間的深度結(jié)合,掃清了最后的障礙。

除了大眾用戶與企業(yè)用戶之外,大模型落地的很大一部分動(dòng)力,來自全行業(yè)模式的驅(qū)動(dòng)。大模型可以伴隨著行業(yè)頭部用戶的使用,快速在行業(yè)軌道中進(jìn)行復(fù)制和推廣,從而深度加強(qiáng)行業(yè)智能化水平。

在這個(gè)過程中,大模型了解行業(yè),深入行業(yè)成為最主要的挑戰(zhàn)。而想要解決它,也只有真正走進(jìn)行業(yè),與行業(yè)達(dá)成生態(tài)合作這一條通道。

不久之前,火山引擎聯(lián)合中國電動(dòng)汽車百人會(huì),與吉利汽車、長城汽車、捷途汽車、賽力斯、智己汽車等20余家廠商,宣布成立汽車大模型生態(tài)聯(lián)盟,致力于為消費(fèi)者帶來汽車全場景AI新體驗(yàn)。

通過生態(tài)合作,火山引擎可以獲得更加清晰的汽車行業(yè)智能化訴求,從而讓豆包給出更有針對(duì)性與專業(yè)性的落地方案。比如說,當(dāng)前車企愈發(fā)重視用戶反饋,但伴隨網(wǎng)絡(luò)信息量的爆炸,人工收集網(wǎng)絡(luò)反饋的方式低效且不夠全面。豆包大模型可以幫助車企進(jìn)行反饋信息收集,并且進(jìn)行初步分析總結(jié),從而實(shí)現(xiàn)智能化的信息篩選與分類,提取出車主的主要關(guān)注點(diǎn)與情感傾向。

此外,豆包可以在汽車行業(yè)的多個(gè)角度、多個(gè)場景實(shí)現(xiàn)落地。比如搭載了豆包lite大模型后,車企可以在低延遲情況下為用戶提供清晰、智能的AI對(duì)話能力,支持閑聊、搜索、娛樂、導(dǎo)航、車控等多個(gè)座艙智能助手場景,效果要比傳統(tǒng)語音處理高達(dá)50%以上。在智能座艙、智能駕駛場景中,AI對(duì)話將成為十分重要的交互手段。豆包與汽車行業(yè)的深度融合,解決了車內(nèi)語音交互的系列痛點(diǎn)。

類似豆包與汽車的結(jié)合,火山引擎還與OPPO、vivo、榮耀、小米、三星、華碩成立了智能終端大模型聯(lián)盟。OPPO小布助手、榮耀智慧辦公智能助手、小米“小愛同學(xué)”,以及華碩筆記本電腦的豆叮AI助手等應(yīng)用,均已接入火山引擎的大模型服務(wù)。

可以看到,擬人化、低成本、重生態(tài),已經(jīng)成為豆包大模型的三個(gè)支點(diǎn)。它們?cè)诩夹g(shù)之上,為豆包大模型提供了產(chǎn)品、商業(yè)與產(chǎn)業(yè)合作層面的競爭力,消解了大模型同質(zhì)化帶來的落地難題。

用對(duì)用戶的尊重,對(duì)問題的正視,來重構(gòu)大模型的磁力。這或許才是日均Tokens使用量破5000億背后,豆包身上值得被提取出來的“營養(yǎng)物質(zhì)”。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-08-01
豆包,大模型的磁力三重奏
豆包,大模型的磁力三重奏

長按掃碼 閱讀全文