Deepseek打破AI訓(xùn)練燒錢魔咒:僅需1.2萬美元,MT-Bench跑分媲美GPT-4,成本降低50倍

DeepSeek打破AI訓(xùn)練燒錢魔咒:僅需1.2萬美元,MT-Bench跑分媲美GPT-4

隨著人工智能(AI)技術(shù)的飛速發(fā)展,越來越多的企業(yè)和研究機(jī)構(gòu)投入巨資進(jìn)行模型訓(xùn)練和開發(fā)。然而,這種“燒錢魔咒”的現(xiàn)象一直備受爭(zhēng)議,許多專家和機(jī)構(gòu)呼吁降低AI訓(xùn)練的成本,提高其效率。在這個(gè)背景下,DeepSeek的出現(xiàn)無疑為AI領(lǐng)域帶來了一股清流。近日,DeepSeek與清華大學(xué)合作推出的全新AI對(duì)齊技術(shù)SPCT(自我原則點(diǎn)評(píng)調(diào)優(yōu))引起了廣泛關(guān)注。據(jù)測(cè)試結(jié)果顯示,DeepSeek-GRM模型在性能水平上達(dá)到了671B規(guī)模模型的性能水平,且訓(xùn)練成本僅為1.2萬美元,MT-Bench跑分媲美GPT-4,成本降低50倍。

首先,讓我們來了解一下DeepSeek-GRM模型。該模型是一種深度學(xué)習(xí)模型,具有強(qiáng)大的自然語言處理能力。通過采用拒絕式微調(diào)作為冷啟動(dòng)階段和基于規(guī)則的在線強(qiáng)化學(xué)習(xí)階段,該模型能夠適應(yīng)不同輸入類型并以正確格式生成原則與點(diǎn)評(píng)內(nèi)容。值得一提的是,DeepSeek-GRM模型采用了混合專家系統(tǒng)(MoE),支持128k token上下文窗口,單查詢延遲僅1.4秒。這種設(shè)計(jì)使得該模型在處理大規(guī)模數(shù)據(jù)時(shí)具有很高的效率和準(zhǔn)確性。

接下來,我們來看看DeepSeek-GRM模型在測(cè)試中的表現(xiàn)。據(jù)報(bào)告顯示,通過每查詢32次采樣的推理計(jì)算,DeepSeek-GRM模型達(dá)到了671B規(guī)模模型的性能水平。這一表現(xiàn)不僅證明了該模型的強(qiáng)大性能,也說明了其硬件感知設(shè)計(jì)的高效性。此外,DeepSeek的SPCT技術(shù)通過“原則合成-響應(yīng)生成-批判過濾-原則優(yōu)化”的遞歸架構(gòu),讓模型能在推理時(shí)動(dòng)態(tài)修正輸出,從而顯著降低了高性能模型的部署門檻。

那么,DeepSeek-GRM模型的訓(xùn)練成本如何呢?據(jù)介紹,DeepSeek-GRM模型的訓(xùn)練成本僅為1.2萬美元,這一數(shù)字相較于傳統(tǒng)的高性能模型如GPT-4等動(dòng)輒數(shù)百萬美元的訓(xùn)練成本而言,無疑是一個(gè)巨大的降低。這得益于DeepSeek的SPCT技術(shù)以及其獨(dú)特的硬件感知設(shè)計(jì)。DeepSeek通過減少90%人工標(biāo)注需求,能耗較DPO降低73%,為實(shí)時(shí)機(jī)器人控制等動(dòng)態(tài)場(chǎng)景提供了新的可能。

此外,DeepSeek的MT-Bench得分也令人矚目。據(jù)報(bào)告顯示,DeepSeek-GRM模型的MT-Bench得分達(dá)到了8.35,與GPT-4的得分相近,但成本卻降低了50倍。這一表現(xiàn)無疑證明了DeepSeek在降低AI訓(xùn)練成本方面的巨大潛力。

總的來說,DeepSeek的出現(xiàn)為AI領(lǐng)域帶來了革命性的變化。通過與清華大學(xué)合作推出的全新AI對(duì)齊技術(shù)SPCT,DeepSeek成功地突破了傳統(tǒng)依賴海量訓(xùn)練數(shù)據(jù)的模式,通過推理階段動(dòng)態(tài)優(yōu)化輸出質(zhì)量。在測(cè)試中,DeepSeek-GRM模型的表現(xiàn)也證明了其強(qiáng)大的性能和高效的成本優(yōu)勢(shì)。隨著DeepSeek的不斷發(fā)展,我們有理由相信,它將為AI領(lǐng)域帶來更多的可能性,并為更多的企業(yè)和研究機(jī)構(gòu)提供便利。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2025-04-08
Deepseek打破AI訓(xùn)練燒錢魔咒:僅需1.2萬美元,MT-Bench跑分媲美GPT-4,成本降低50倍
DeepSeek打破AI訓(xùn)練燒錢魔咒:僅需1.2萬美元,MT-Bench跑分媲美GPT-4 隨著人工智能(AI)技術(shù)的飛速發(fā)展,越來越多的企業(yè)和研究機(jī)構(gòu)投入巨...

長(zhǎng)按掃碼 閱讀全文