AI推理模型崛起:挑戰(zhàn)與成本飆升之戰(zhàn)

AI推理模型崛起的挑戰(zhàn)與成本飆升之戰(zhàn)

隨著人工智能(AI)技術(shù)的不斷發(fā)展,AI推理模型已成為研究熱點(diǎn)。這些模型能夠像人類一樣逐步思考問(wèn)題,并在特定領(lǐng)域展現(xiàn)出強(qiáng)大的能力,如物理學(xué)。然而,隨著這些模型的崛起,其測(cè)試成本也相應(yīng)飆升,給研究者帶來(lái)了新的挑戰(zhàn)。

首先,讓我們了解一下AI推理模型的工作原理。這些模型能夠理解和分析輸入的信息,并根據(jù)已有的知識(shí)庫(kù)進(jìn)行推理,得出相應(yīng)的結(jié)論。在某些領(lǐng)域,如物理學(xué)中,這種推理能力被認(rèn)為比非推理模型更具優(yōu)勢(shì)。然而,這種優(yōu)勢(shì)的代價(jià)是高昂的測(cè)試成本。

據(jù)第三方AI測(cè)試機(jī)構(gòu)“人工智能分析”(Artificial Analysis)的數(shù)據(jù)顯示,評(píng)估OpenAI的o1推理模型在七個(gè)流行的AI基準(zhǔn)測(cè)試中的表現(xiàn),需要花費(fèi)高達(dá)2767.05美元。而評(píng)估Anthropic的Claude 3.7 Sonnet這一“混合”推理模型的成本也達(dá)到了1485.35美元。相比之下,測(cè)試OpenAI的o3-mini-high只需344.59美元。盡管有些推理模型的測(cè)試成本相對(duì)較低,但從整體來(lái)看,推理模型的測(cè)試成本仍然較高。

那么,為什么推理模型的測(cè)試成本如此之高呢?主要原因在于它們生成了大量的token。Token代表原始文本的片段,例如將單詞“fantastic”拆分為音節(jié)“fan”、“tas”和“tic”。據(jù)“人工智能分析”稱,在該公司的基準(zhǔn)測(cè)試中,OpenAI的o1生成了超過(guò)4400萬(wàn)個(gè)token。這不僅意味著需要大量的計(jì)算資源,還使得評(píng)估成本容易累積。

此外,現(xiàn)代基準(zhǔn)測(cè)試通常會(huì)從模型中引出大量token,因?yàn)樗鼈儼婕皬?fù)雜、多步驟任務(wù)的問(wèn)題。這不僅是因?yàn)榛鶞?zhǔn)測(cè)試現(xiàn)在更加復(fù)雜,而且每個(gè)基準(zhǔn)測(cè)試的問(wèn)題數(shù)量總體有所減少。它們通常試圖評(píng)估模型執(zhí)行現(xiàn)實(shí)世界任務(wù)的能力,例如編寫和執(zhí)行代碼、瀏覽互聯(lián)網(wǎng)以及使用計(jì)算機(jī)。

然而,這并不是推理模型測(cè)試成本飆升的唯一原因。隨著時(shí)間的推移,模型的性能和復(fù)雜性不斷提高,但達(dá)到給定性能水平的成本并沒(méi)有相應(yīng)大幅下降。相反,隨著競(jìng)爭(zhēng)加劇和研發(fā)投入的增加,每個(gè)token的成本也在增加。例如,Anthropic在2024年5月發(fā)布的Claude 3 Opus是當(dāng)時(shí)最昂貴的模型,每百萬(wàn)輸出token的成本為75美元。而OpenAI今年早些時(shí)候推出的GPT-4.5和o1-pro,每百萬(wàn)輸出token的成本分別為150美元和600美元。

盡管隨著時(shí)間的推移,模型的性能有所提高,達(dá)到給定性能水平的成本也確實(shí)大幅下降了,但如果你想在任何特定時(shí)間評(píng)估最大最好的模型,你仍然需要支付更多。這也意味著難以復(fù)制和比較不同實(shí)驗(yàn)室的研究結(jié)果,給學(xué)術(shù)界和研究機(jī)構(gòu)帶來(lái)了新的挑戰(zhàn)。

盡管面臨這些挑戰(zhàn)和成本飆升,AI推理模型的發(fā)展仍具有重要意義。它們?yōu)樘囟I(lǐng)域的科研和應(yīng)用提供了強(qiáng)大的工具,有望推動(dòng)科學(xué)和技術(shù)的進(jìn)步。因此,我們需要繼續(xù)研究和開(kāi)發(fā)這些模型,同時(shí)也要尋找降低測(cè)試成本的方法,以便更廣泛地應(yīng)用這些模型。這可能包括改進(jìn)基準(zhǔn)測(cè)試方法、優(yōu)化模型生成過(guò)程和使用更經(jīng)濟(jì)高效的計(jì)算資源。

最后,雖然推理模型的測(cè)試成本高昂,但我們必須認(rèn)識(shí)到這只是技術(shù)發(fā)展過(guò)程中的一個(gè)暫時(shí)問(wèn)題。隨著科研人員的努力和技術(shù)的進(jìn)步,我們相信會(huì)有更多的解決方案出現(xiàn),幫助我們克服這些挑戰(zhàn)并加速AI技術(shù)的發(fā)展。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
1970-01-01
AI推理模型崛起:挑戰(zhàn)與成本飆升之戰(zhàn)
AI推理模型崛起的挑戰(zhàn)與成本飆升之戰(zhàn) 隨著人工智能(AI)技術(shù)的不斷發(fā)展,AI推理模型已成為研究熱點(diǎn)。這些模型能夠像人類一樣逐步思考問(wèn)題...

長(zhǎng)按掃碼 閱讀全文