釋放算力潛力 新華三布局在網(wǎng)計算

一個AI機器人有多會聊天?ChatGPT實力“聊”出了史上增長最快的消費級應(yīng)用,上線短短兩個月,月活用戶突破1億,每天用約有1300萬獨立訪客與之對話。敲代碼、寫論文、編劇本……這位多才多藝的“全能網(wǎng)友”,引爆了新一輪的人工智能熱潮。

然而,當(dāng)紅的ChatGPT也正經(jīng)歷著“成長的煩惱”。從GPT到GPT-3,優(yōu)化迭代主要源自模型的增大,訓(xùn)練參數(shù)量從1.17億增加到1750億,模型訓(xùn)練使用的數(shù)據(jù)量高達0.4萬億token,如此龐大的數(shù)據(jù)體量,對于分布式集群的運算效率提出了極高要求。事實上,不只是ChatGPT,整個AI產(chǎn)業(yè)的大規(guī)模商用都在經(jīng)歷算力限制的陣痛。

如何在整體資源有限的條件下,讓應(yīng)用獲取更多的計算資源,提升機器學(xué)習(xí)效率,人工智能和算網(wǎng)融合領(lǐng)域的前沿課題——在網(wǎng)計算(In Network Computing)成為其中一種有效解決方案。

讓網(wǎng)絡(luò)設(shè)備參與計算突破集群計算效率瓶頸

數(shù)據(jù)顯示,過去5年GPU算力增長近90倍,而網(wǎng)絡(luò)帶寬僅增長10倍。受網(wǎng)絡(luò)通信能力的限制,分布式集群的運算效率無法隨其規(guī)模線性增長,網(wǎng)絡(luò)通信能力日漸成為人工智能模型訓(xùn)練成熟發(fā)展的瓶頸。

傳統(tǒng)的計算集群,計算過程以計算節(jié)點為中心,網(wǎng)絡(luò)僅用于節(jié)點間的互聯(lián)。當(dāng)各計算節(jié)點之間進行一對多或多對多的集合通信時,多次通信交互不僅會影響計算效率,也會增加網(wǎng)絡(luò)負載,出現(xiàn)通信時延過大、通信效率降低等問題。

作為算網(wǎng)融合核心技術(shù)之一的“在網(wǎng)計算”技術(shù),是通過在網(wǎng)絡(luò)中部署對報文進行解析的算力,將部分計算任務(wù)從主機側(cè)遷移至網(wǎng)絡(luò)側(cè),由交換機、路由器、智能網(wǎng)卡、DPU等設(shè)備或部件完成計算加速的技術(shù)。通過網(wǎng)絡(luò)設(shè)備自身算力的共享,在不改變業(yè)務(wù)原有運行模式的前提下,在網(wǎng)計算將HPC和AI分布式計算的集合通信的操作卸載到網(wǎng)絡(luò)設(shè)備上,讓網(wǎng)絡(luò)設(shè)備參與計算,減少計算節(jié)點之間的消息交互,降低通信延遲,從而提高網(wǎng)絡(luò)帶寬利用效率,加速HPC和AI分布式計算效率。

加速布局在網(wǎng)計算推動“網(wǎng)絡(luò)計算化”演進

作為數(shù)字化解決方案領(lǐng)導(dǎo)者,紫光股份旗下新華三集團以科技創(chuàng)新為引領(lǐng),基于在網(wǎng)絡(luò)和計算領(lǐng)域深厚的技術(shù)積淀,主動擔(dān)起在網(wǎng)計算技術(shù)的產(chǎn)業(yè)化探索職責(zé),快速在網(wǎng)絡(luò)設(shè)備端完成研發(fā)落地。

全面支持在網(wǎng)計算的H3C P4可編程交換機支持Pytorch框架和DPDK UDP、RoCE通信方式,能夠?qū)?shù)據(jù)需求聚合統(tǒng)一操作,優(yōu)化通信網(wǎng)絡(luò)擁堵,減少主機的數(shù)據(jù)處理量。據(jù)新華三集團內(nèi)部實驗室測算,使用H3C P4可編程交換機加速數(shù)據(jù)并行訓(xùn)練,模型訓(xùn)練精度不受影響,計算節(jié)點間通信數(shù)據(jù)量平均減少30%,最多可以減少48%的訓(xùn)練時間,可大幅提升分布式集群的整體訓(xùn)練效率,創(chuàng)造更加出色的應(yīng)用價值。

圖片1.jpg

在網(wǎng)計算作為計算、網(wǎng)絡(luò)融合發(fā)展的關(guān)鍵技術(shù),不僅有效解決了HPC和AI分布式計算的集合通信問題,為提升數(shù)據(jù)中心的集群規(guī)模帶來了新的方案和思路,同時也將進一步加速算網(wǎng)融合“網(wǎng)絡(luò)計算化”演進,推動網(wǎng)絡(luò)從連接算力到感知、承載、調(diào)配算力的角色升級,助力算網(wǎng)融合縱深發(fā)展。

從AlphaGo擊敗圍棋世界冠軍,到ChatGPT火遍全球,人工智能時代正在加速到來。面向未來,在“云智原生”戰(zhàn)略指引下,新華三集團將以前瞻視野精耕科技,深入數(shù)字科技的實際應(yīng)用場景,為人工智能與經(jīng)濟社會的融合注入強大的創(chuàng)新動能,深度賦能百行百業(yè)的數(shù)字化轉(zhuǎn)型和智能化升級。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )