字節(jié)跳動將大模型價格打進“厘時代”?騰訊跟不跟?

本周科技圈的熱度,至少有一半來自大模型。OpenAI、谷歌、字節(jié)跳動、騰訊四家大廠前后腳升級大模型,最卷的是字節(jié)跳動,不僅卷模型應(yīng)用,還卷價格。

5月15日,字節(jié)跳動對外發(fā)布豆包大模型,同時公布了足以影響行業(yè)的大模型使用價格。其中,豆包通用模型pro-32k版,模型推理輸入價格僅為0.0008元/千Tokens,而市面上同規(guī)格模型的定價一般為0.12元/千Tokens,是豆包模型價格的150倍。豆包通用模型pro-128k版,模型推理輸入價格為0.005元/千Tokens,比行業(yè)價格低95.8%。

這意味著,字節(jié)跳動把Token的定價降低了一個數(shù)量級,從以分計價進入以厘計價時代。根據(jù)火山引擎公布的價格計算,1元就能買到豆包主力模型的125萬Tokens,大約是200萬個漢字,相當(dāng)于3本《三國演義》。

對于字節(jié)跳動掀起的這場大模型“價格戰(zhàn)”,國內(nèi)其他廠商是否會跟進?

騰訊、百度等廠商回應(yīng)

5月17日,在騰訊云生成式AI產(chǎn)業(yè)應(yīng)用峰會上,騰訊云副總裁、騰訊云智能負(fù)責(zé)人吳運聲在被問及這一問題時沒有正面回應(yīng),他表示,“騰訊更關(guān)注大模型能力的提升,致力于為行業(yè)提供能力和價格兼具的產(chǎn)品?!?/span>

當(dāng)天,騰訊集團副總裁蔣杰在大會上宣布,騰訊混元大模型通過持續(xù)迭代,目前整體性能已居國內(nèi)第一梯隊,部分中文能力已追平GPT-4。

5月15日,百度方面曾表示,“使用大模型不應(yīng)該只看價格,更要看綜合效果,只有讓AI應(yīng)用效果更好、響應(yīng)速度更快、分發(fā)渠道更廣,才能讓人們切實感受AI為社會生產(chǎn)帶來的便利?!币伤苹貞?yīng)大模型價格戰(zhàn)。

同時,百度披露,文心大模型日均處理Tokens文本已達2490億,并強調(diào)“‘閉源大模型+公有云’能實現(xiàn)比開源大模型性能更好、成本更低的綜合效果,并以此促進AI應(yīng)用生態(tài)繁榮?!?/span>

有業(yè)內(nèi)人士表示,今年以來大模型降價已成趨勢,將進一步加速應(yīng)用端的落地。

事實上,在字節(jié)跳動之前,已經(jīng)有不少廠商宣布下調(diào)大模型使用價格。5月11日,智譜大模型官宣新的價格體系,入門級產(chǎn)品GLM-3 Turbo模型調(diào)用價格從5元/百萬Tokens降至1元/百萬Tokens,降幅高達80%。

5月6日,私募巨頭幻方量化旗下AI公司DeepSeek發(fā)布全新第二代MoE大模型DeepSeek-V2,目前DeepSeek-V2 API定價為:每百萬Tokens輸入1元、輸出2元(32K上下文),僅是GPT-4 Turbo的近百分之一。

這樣的趨勢,同樣在國外發(fā)生。自去年以來,OpenAI已經(jīng)進行了4次降價,在剛剛結(jié)束的春季更新活動中,OpenAI發(fā)布了最新多模態(tài)大模型GPT-4o,不僅性能有了很大提升,價格也下調(diào)了50%。

各家大模型的技術(shù)實力、訓(xùn)練成本、應(yīng)用場景等不甚相同,也導(dǎo)致了定價的差異。而降價背后則是大模型結(jié)構(gòu)、訓(xùn)練等成本的持續(xù)優(yōu)化。

火山引擎總裁譚待直言,字節(jié)跳動能夠在大模型上做到低價,因為其在模型結(jié)構(gòu)、訓(xùn)練、生產(chǎn)等各種技術(shù)層面都能做得很好,有很多優(yōu)化手段能夠?qū)崿F(xiàn)降價。

此外,市場對降價的呼聲比較高,平臺必須把試錯成本做到非常低,才能讓大家用起來。只有大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本。

DeepSeek-V2則是通過架構(gòu)創(chuàng)新,實現(xiàn)了大模型成本尤其是推理成本的下降。李彥宏曾在Create 2024百度AI開發(fā)者大會上透露,與一年前相比,文心大模型推理性能實現(xiàn)了105倍增長,而推理成本降到了原來的1%。

大模型商業(yè)化落地提速

大模型定價的持續(xù)走低有望帶來更快的商業(yè)化落地。

本周,OpenAI、谷歌、字節(jié)跳動、騰訊四家大廠相繼披露在大模型領(lǐng)域的最新進展,無一不聚焦在應(yīng)用側(cè)。大模型卷到2024年,應(yīng)用場景的落地成為競爭主旋律。

硬核如OpenAI,對于最新發(fā)布的多模態(tài)大模型GPT-4o,也沒有以往對參數(shù)指標(biāo)的生硬強調(diào),而是選擇集中展示多場景下的用戶體驗。這被認(rèn)為是OpenAI加速應(yīng)用落地的表現(xiàn)。

公開報道顯示,OpenAI月活躍用戶數(shù)超10億,去年12月營收年率達到20億美金。由于營收增長極快,OpenAI采用了“營收年率”這一獨特的營收統(tǒng)計方式,即把上個月的營收乘以12。

國內(nèi)方面,百度、阿里等均已經(jīng)利用AI開始賺錢。根據(jù)最新財報,今年一季度,百度智能云收入為47億元,同比增長12%,并實現(xiàn)盈利,其中生成式AI帶來的收入占比為6.9%,以此計算,百度生成式AI一季度收入約為3.24億元。

阿里、騰訊沒有披露生成式AI帶來的具體營收金額。但阿里在2024財年Q4財報中表示,AI相關(guān)收入三位數(shù)增長。騰訊則披露了AI對于業(yè)務(wù)的促進作用,比如,廣告技術(shù)平臺升級后,顯著提升了騰訊廣告業(yè)務(wù)的推薦精準(zhǔn)度和投放效率。

此外,科大訊飛、360等A股上市公司的財報中“AI含量”也大幅提升。其中,科大訊飛一季度營收增長26%,虧損擴大至3億元。虧損的原因,一方面是業(yè)務(wù)季節(jié)性特點在全年收入中占比較小,但是剛需投入在;另一方面是在大模型研發(fā)以及核心技術(shù)自主可控和產(chǎn)業(yè)鏈可控,以及大模型產(chǎn)業(yè)落地拓展等方面堅定投入,其中,研發(fā)費用相較去年同期增加1億多元,同時,銷售費用也有所增加。

生成式AI在幫助企業(yè)提質(zhì)增效上,或許已經(jīng)有不錯的進展。但要幫企業(yè)盈利,可能還沒有那么容易。

目前大模型的應(yīng)用還在早期階段,仍有很大的發(fā)展空間。QuestMobile數(shù)據(jù)顯示,截至今年3月,基于大模型的AIGC行業(yè)用戶量為7380萬,盡管同比增長了8倍,也僅占移動互聯(lián)網(wǎng)用戶量的6%。

平安證券研報稱,大模型能力達到一定水平時必然會走向應(yīng)用,大模型廠商通過提升其產(chǎn)品性價比,助推下游應(yīng)用端的推廣部署,有望加速大模型產(chǎn)業(yè)鏈商業(yè)閉環(huán)的形成。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-05-18
字節(jié)跳動將大模型價格打進“厘時代”?騰訊跟不跟?
字節(jié)跳動把Token的定價降低了一個數(shù)量級,從以分計價進入以厘計價時代。對于字節(jié)跳動掀起的這場大模型“價格戰(zhàn)”,國內(nèi)其他廠商是否會跟進?

長按掃碼 閱讀全文