4月17日消息(九九)過去幾年,大模型掀起算力基礎(chǔ)設(shè)施建設(shè)的“軍備競賽”,對用于數(shù)據(jù)中心光互聯(lián)的高速數(shù)通光模塊需求顯著增長,且速率從400G迅速迭代到800G,再到1.6T。在此背景下,“超大規(guī)模智算中心:1.6T時代的全光互聯(lián)”研討會于4月17日下午舉辦,就智算中心內(nèi)光互聯(lián)進(jìn)行深入探討,展示光互連技術(shù)的最新進(jìn)展情況,介紹未來發(fā)展趨勢, 推動智算中心互聯(lián)技術(shù)的創(chuàng)新發(fā)展。
中國移動研究院基礎(chǔ)網(wǎng)絡(luò)技術(shù)研究所副所長程偉強在會議演講中表示,大規(guī)模智算集群時代,高性能訓(xùn)練和推理服務(wù)需要超大規(guī)模算力支撐,網(wǎng)絡(luò)成為算力效率的瓶頸。隨著智算網(wǎng)絡(luò)卡間互聯(lián)提升單點算力、機間互聯(lián)擴展集群規(guī)模、集群間互聯(lián)拓展分布式算力集群能力,1.6T以太網(wǎng)成為業(yè)內(nèi)關(guān)注的焦點。
1.6Tb/s以太網(wǎng)成為智算中心互聯(lián)關(guān)鍵布局方向
當(dāng)前,AI推動全球基礎(chǔ)設(shè)施廠商加速1.6T技術(shù)驗證和產(chǎn)品研發(fā),國際標(biāo)準(zhǔn)組織IEEE、OIF等也已開展1.6TE標(biāo)準(zhǔn)制定工作。
聚焦智算中心內(nèi)互聯(lián),IEEE802.3dj正在制定D1.5版本草案,覆蓋單通道200G的1.6TE DR8/DR8-2單模標(biāo)準(zhǔn),支持FECo和FECi兩種FEC模式,2025年5月進(jìn)入D2.0工作組階段,預(yù)計2026年中發(fā)布;802.3NEA目前正在討論200G/L MMF光接口、400G/L SMF光接口等技術(shù),支持1.6TE的架構(gòu)優(yōu)化和技術(shù)演進(jìn)。
200G/lane多模光技術(shù)是傳統(tǒng)DC、智算中心內(nèi)的1.6TE 100m內(nèi)短距互聯(lián)優(yōu)選解決方案;目前802.3NEA已開展200G/lane MMF Optical PMDs討論,中國移動正在參與200G/lane MMF CFI,后續(xù)將聯(lián)合推動成立SG或TF。400G單通道技術(shù)對優(yōu)化1.6TE系統(tǒng)架構(gòu)、提升系統(tǒng)性能和降低整體功耗有重要意義,是1.6TE技術(shù)標(biāo)準(zhǔn)的演進(jìn)方向。
聚焦智算中心間互聯(lián),簡化相干技術(shù)在IEEE 800GE速率已下沉至10km,同時新增ER1-20標(biāo)準(zhǔn),支持ER1-20、ER1、ZR/ZR+接口的互操作。OIF已領(lǐng)跑1.6T相干,同步開展1600ZR和1600ZR+標(biāo)準(zhǔn)化研究,IEEE暫未開展1.6TE相干標(biāo)準(zhǔn)研究;從技術(shù)可行性、互操作和共產(chǎn)業(yè)平臺等方面考慮,1.6TE相干覆蓋2km~40km場景并采用統(tǒng)一方案將會是標(biāo)準(zhǔn)化和產(chǎn)業(yè)化的優(yōu)選方案。
目前,國內(nèi)外多個OTT正逐步構(gòu)建跨智算中心分布式訓(xùn)練環(huán)境,已開始部署彩光方案以優(yōu)化網(wǎng)絡(luò)性能,這一領(lǐng)域正成為業(yè)界關(guān)注的焦點。OIF 800ZR標(biāo)準(zhǔn)已于2024年底發(fā)布,將在2025年迎來試點驗證元年;1.6T ZR/ZR+在智算互聯(lián)帶動下將進(jìn)入快速發(fā)展期。
GSE-N2N和GSE-E2E滿足不同GPU服務(wù)器組網(wǎng)需求
面向智算中心內(nèi)和智算中心間組網(wǎng),中國移動分別推出GSE和UDCI技術(shù)體系。
其中,全調(diào)度以太網(wǎng)(GSE)采用統(tǒng)一設(shè)計理念及技術(shù)架構(gòu),構(gòu)建GSE-N2N和GSE-E2E兩大場景,滿足不同GPU服務(wù)器組網(wǎng)需求。GSE-N2N是純網(wǎng)側(cè)優(yōu)化方案,在網(wǎng)側(cè)運行GSE,網(wǎng)卡不感知網(wǎng)絡(luò)行為,無額外功能要求,適配華為昇騰GPU等直出網(wǎng)卡服務(wù)器;GSE-E2E是端網(wǎng)協(xié)同優(yōu)化方案,部分功能下沉網(wǎng)卡,實現(xiàn)端網(wǎng)協(xié)同,適配英偉達(dá)GPU等配置獨立網(wǎng)卡服務(wù)器。
目前,中國移動已經(jīng)完成現(xiàn)網(wǎng)百卡級GSE-N2N中試平臺中試驗證,網(wǎng)絡(luò)性能較傳統(tǒng)RoCE網(wǎng)絡(luò)提升50%以上;并發(fā)布GSE-N2N首套千卡級商用方案和全套技術(shù)標(biāo)準(zhǔn)及GSE網(wǎng)卡芯片—“智算琢光”。后續(xù)希望聯(lián)合合作伙伴推動GSE-N2N萬卡級驗證系統(tǒng)發(fā)布。針對GSE-E2E場景,計劃年內(nèi)將200G GSE網(wǎng)卡芯片推向商用。
IP與光融合的DCI創(chuàng)新技術(shù)滿足智算中心互聯(lián)需求
隨著1.6T ZR/ZR+被廣泛采用,光和IP的融合是必然趨勢。中國移動基于IP+光融合打造的超級數(shù)據(jù)中心互聯(lián)技術(shù)體系,面向跨智算中心高突發(fā)、多并發(fā)“大象流”傳輸帶來的網(wǎng)絡(luò)運力受損、算效下降等問題,突破3大創(chuàng)新技術(shù),打造具備超大帶寬、超精細(xì)流控、超高安全的智算互聯(lián)網(wǎng)絡(luò)基礎(chǔ)設(shè)施,助力AI大模型分布式訓(xùn)練、AI普惠推理、存算分離等新型智算業(yè)務(wù)的創(chuàng)新及應(yīng)用。
一是創(chuàng)新提出10T級聚合通道SuperPipe技術(shù),基于報文組分發(fā)的廣域網(wǎng)以太網(wǎng)端口聚合機制,實現(xiàn)單通道400G-32T自適應(yīng)帶寬調(diào)整,解決傳統(tǒng)鏈路聚合技術(shù)(LAG、ECMP)無法滿足跨智算中心出口收斂情況下的負(fù)載均衡難題。
二是創(chuàng)新提出微流級精準(zhǔn)流控MicroPFC,切片ID標(biāo)識微流,將擁塞情況在網(wǎng)絡(luò)內(nèi)部逐跳反壓,支持百萬級微流,突破傳統(tǒng)網(wǎng)絡(luò)僅支持端口級8隊列反壓瓶頸,實現(xiàn)長距離精準(zhǔn)擁塞控制。
三是原創(chuàng)以太網(wǎng)物理層比特流加密機制——物理層安全PHYSec,解決傳統(tǒng)IPSec、MACSec基于報文加密大開銷、高時延問題,實現(xiàn)0開銷、全加密、納秒級時延的線速加解密。
截至目前,中國移動已經(jīng)發(fā)布《新型智算中心以太網(wǎng)物理層安全(PHYSec)架構(gòu)白皮書》,在CCSA完成PHYSec總體技術(shù)要求和高速直檢鏈路數(shù)據(jù)面技術(shù)要求立項,已推動芯片和光模塊廠家開始技術(shù)驗證和芯片開發(fā),下一步計劃推出原型芯片和原型光模塊,完成多廠家互通測試。
- 華工科技:全系列AI光模塊訂單還在激增
- 私有5G無線網(wǎng)絡(luò)會成為下一個熱門話題嗎?
- 11地“先飛” 浙江低空經(jīng)濟(jì)“先飛區(qū)”試點名單公布
- 量子人工智能:如何重塑商業(yè)世界的未來?
- Counterpoint:Q1全球智能手機出貨量同比增長3% 三星重奪第一
- 應(yīng)對人工智能能量峰值:基礎(chǔ)設(shè)施升級的必要性與路徑
- 技術(shù)革新:量子計算存儲與內(nèi)存
- 連接未來:物聯(lián)網(wǎng)如何塑造智慧城市生活
- 量子計算:供應(yīng)鏈管理的未來變革者
- 生成式人工智能與云計算:數(shù)據(jù)分析師的下一個重大飛躍
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。