另娄专区欧美制服在线亚洲欧,欧美成人在线观看

Deepseek打破AI訓(xùn)練燒錢魔咒：僅需1.2萬美元，MT-Bench跑分媲美GPT-4，成本降低50倍

人閱讀

2025-04-08 10:45:37

作者：極客AI
相關(guān)關(guān)鍵詞

DeepSeek打破AI訓(xùn)練燒錢魔咒：僅需1.2萬美元，MT-Bench跑分媲美GPT-4

隨著人工智能（AI）技術(shù)的飛速發(fā)展，越來越多的企業(yè)和研究機(jī)構(gòu)投入巨資進(jìn)行模型訓(xùn)練和開發(fā)。然而，這種“燒錢魔咒”的現(xiàn)象一直備受爭(zhēng)議，許多專家和機(jī)構(gòu)呼吁降低AI訓(xùn)練的成本，提高其效率。在這個(gè)背景下，DeepSeek的出現(xiàn)無疑為AI領(lǐng)域帶來了一股清流。近日，DeepSeek與清華大學(xué)合作推出的全新AI對(duì)齊技術(shù)SPCT（自我原則點(diǎn)評(píng)調(diào)優(yōu)）引起了廣泛關(guān)注。據(jù)測(cè)試結(jié)果顯示，DeepSeek-GRM模型在性能水平上達(dá)到了671B規(guī)模模型的性能水平，且訓(xùn)練成本僅為1.2萬美元，MT-Bench跑分媲美GPT-4，成本降低50倍。

首先，讓我們來了解一下DeepSeek-GRM模型。該模型是一種深度學(xué)習(xí)模型，具有強(qiáng)大的自然語言處理能力。通過采用拒絕式微調(diào)作為冷啟動(dòng)階段和基于規(guī)則的在線強(qiáng)化學(xué)習(xí)階段，該模型能夠適應(yīng)不同輸入類型并以正確格式生成原則與點(diǎn)評(píng)內(nèi)容。值得一提的是，DeepSeek-GRM模型采用了混合專家系統(tǒng)（MoE），支持128k token上下文窗口，單查詢延遲僅1.4秒。這種設(shè)計(jì)使得該模型在處理大規(guī)模數(shù)據(jù)時(shí)具有很高的效率和準(zhǔn)確性。

接下來，我們來看看DeepSeek-GRM模型在測(cè)試中的表現(xiàn)。據(jù)報(bào)告顯示，通過每查詢32次采樣的推理計(jì)算，DeepSeek-GRM模型達(dá)到了671B規(guī)模模型的性能水平。這一表現(xiàn)不僅證明了該模型的強(qiáng)大性能，也說明了其硬件感知設(shè)計(jì)的高效性。此外，DeepSeek的SPCT技術(shù)通過“原則合成-響應(yīng)生成-批判過濾-原則優(yōu)化”的遞歸架構(gòu)，讓模型能在推理時(shí)動(dòng)態(tài)修正輸出，從而顯著降低了高性能模型的部署門檻。

那么，DeepSeek-GRM模型的訓(xùn)練成本如何呢？據(jù)介紹，DeepSeek-GRM模型的訓(xùn)練成本僅為1.2萬美元，這一數(shù)字相較于傳統(tǒng)的高性能模型如GPT-4等動(dòng)輒數(shù)百萬美元的訓(xùn)練成本而言，無疑是一個(gè)巨大的降低。這得益于DeepSeek的SPCT技術(shù)以及其獨(dú)特的硬件感知設(shè)計(jì)。DeepSeek通過減少90%人工標(biāo)注需求，能耗較DPO降低73%，為實(shí)時(shí)機(jī)器人控制等動(dòng)態(tài)場(chǎng)景提供了新的可能。

此外，DeepSeek的MT-Bench得分也令人矚目。據(jù)報(bào)告顯示，DeepSeek-GRM模型的MT-Bench得分達(dá)到了8.35，與GPT-4的得分相近，但成本卻降低了50倍。這一表現(xiàn)無疑證明了DeepSeek在降低AI訓(xùn)練成本方面的巨大潛力。

總的來說，DeepSeek的出現(xiàn)為AI領(lǐng)域帶來了革命性的變化。通過與清華大學(xué)合作推出的全新AI對(duì)齊技術(shù)SPCT，DeepSeek成功地突破了傳統(tǒng)依賴海量訓(xùn)練數(shù)據(jù)的模式，通過推理階段動(dòng)態(tài)優(yōu)化輸出質(zhì)量。在測(cè)試中，DeepSeek-GRM模型的表現(xiàn)也證明了其強(qiáng)大的性能和高效的成本優(yōu)勢(shì)。隨著DeepSeek的不斷發(fā)展，我們有理由相信，它將為AI領(lǐng)域帶來更多的可能性，并為更多的企業(yè)和研究機(jī)構(gòu)提供便利。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）