天翼云,AI取經(jīng)路上的逐夢(mèng)人

最近,國產(chǎn)第一部3A游戲大作《黑神話:悟空》問世,引發(fā)了全網(wǎng)熱潮。游戲中的主角,重走西游之路,克服重重難關(guān),向世界展現(xiàn)了中國文化的絕美與中國科技的自信。

而在現(xiàn)實(shí)當(dāng)中,通往產(chǎn)業(yè)智能化的AI之路,同樣可以說是一條取經(jīng)之路。廣大行業(yè)大模型開發(fā)者,也像“取經(jīng)人”一樣需要跨越重重難關(guān),克服九九八十一難。那么,誰能來幫助他們攻克艱險(xiǎn),踏上靈山?

9月4日,天翼云在線上舉辦了息壤一體化智算服務(wù)平臺(tái)大模型訓(xùn)推服務(wù)能力升級(jí)發(fā)布會(huì)。面向行業(yè)大模型的真實(shí)開發(fā)需求與應(yīng)用場(chǎng)景,天翼云將2023年推出的智算服務(wù)平臺(tái)進(jìn)行了升級(jí)與革新,從而能夠?yàn)榇竽P烷_發(fā)訓(xùn)練、行業(yè)模型微調(diào)提供全生命周期的工具鏈。

經(jīng)過一年的精進(jìn),天翼云智算服務(wù)平臺(tái)具有全流程覆蓋、全方位支持、適配國內(nèi)行業(yè)大模型AI開發(fā)需求的特性。旨在簡(jiǎn)化大模型從訓(xùn)練到部署整個(gè)流程的息壤一體化智算服務(wù)平臺(tái),已經(jīng)可以在AI取經(jīng)之路上,助力每一位行業(yè)大模型開發(fā)者“取經(jīng)人”。

作為云服務(wù)國家隊(duì),天翼云所打造的息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力的躍遷,正在幫助中國AI開發(fā)者踏上智能化之路,盎然西行,直面天命。

就像西天取經(jīng)之路一樣,大模型開發(fā)者與千行百業(yè)的AI進(jìn)階之路,需要面臨重重艱險(xiǎn)。從AI大模型訓(xùn)練所需的數(shù)據(jù)準(zhǔn)備,到模型訓(xùn)練、推理部署,每一個(gè)環(huán)節(jié)對(duì)于行業(yè)大模型開發(fā)者來說都蘊(yùn)藏著不小的挑戰(zhàn)。我們可以揀選具有代表性的幾個(gè)“AI取經(jīng)難關(guān)”進(jìn)行討論:

1.數(shù)據(jù)的黑風(fēng)山。

AI大模型訓(xùn)練需要大量高質(zhì)量數(shù)據(jù),但對(duì)于行業(yè)大模型開發(fā)者來說,AI所需的優(yōu)質(zhì)數(shù)據(jù)獲取難度其實(shí)是非常大的。在各行各業(yè)中,數(shù)據(jù)資源呈現(xiàn)出極其有限,且分布非常分散的特點(diǎn)。在收集到一定的數(shù)據(jù)之后,開發(fā)者還需要面對(duì)數(shù)據(jù)標(biāo)注、數(shù)據(jù)清洗等一系列工作,開發(fā)成本極大。除此之外,行業(yè)大模型開發(fā)者還需要與行業(yè)內(nèi)的專家緊密配合,從而將專業(yè)知識(shí)與AI算法進(jìn)行緊密結(jié)合。這些行業(yè)數(shù)據(jù)相關(guān)的難題,構(gòu)成了一座重重險(xiǎn)阻的“黑風(fēng)山”,成為阻擋開發(fā)者踏上AI取經(jīng)路的第一道難關(guān)。

2.訓(xùn)練的獅駝嶺。

在化解數(shù)據(jù)難題之后,開發(fā)者還需要面對(duì)AI大模型訓(xùn)練這個(gè)關(guān)鍵環(huán)節(jié),而這個(gè)環(huán)節(jié)也是綜合成本開銷最大,且不確定性最高的一個(gè)。

對(duì)于行業(yè)大模型開發(fā)者來說,大模型訓(xùn)練面臨著AI算力稀缺的核心問題,而在極高的AI算力成本之下,還需要應(yīng)對(duì)傳統(tǒng)算子運(yùn)行效率差、訓(xùn)練集群故障多、故障定位與恢復(fù)時(shí)間漫長(zhǎng)等重重困難。極高的訓(xùn)練難度和訓(xùn)練穩(wěn)定性,成為困擾大模型智能化發(fā)展的高山。

3.模型的通天河。

對(duì)于眾多行業(yè)領(lǐng)域來說,進(jìn)行獨(dú)立的大模型研發(fā)并非唯一選擇,如果能夠基于先進(jìn)、成熟的大模型再結(jié)合自身行業(yè)所需進(jìn)行“定制化”開發(fā)可取得事半功倍的效果。然而在這種需求下,行業(yè)模型開發(fā)者也面臨著業(yè)界優(yōu)秀的模型與模型應(yīng)用實(shí)踐難以獲取,模型的本地化水平低等問題。模型的應(yīng)用部署,限制住了大模型在行業(yè)智能化的“最后一公里”。

能不能找到一個(gè)方法,連續(xù)攻克這重重難關(guān),給予行業(yè)大模型開發(fā)者一站式的幫助?

面對(duì)這個(gè)問題,能夠一站式全流程覆蓋的智算服務(wù)平臺(tái)成為關(guān)鍵的答案。天翼云對(duì)息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力的升級(jí),就是希望瞄準(zhǔn)真實(shí)的行業(yè)大模型開發(fā),與開發(fā)者一起踏破AI取經(jīng)的九九八十一難。

西天取經(jīng)需要一步步走,一關(guān)關(guān)過。對(duì)行業(yè)大模型開發(fā)的賦能,也需要了解每個(gè)環(huán)節(jié)行業(yè)大模型開發(fā)者真正面對(duì)的挑戰(zhàn),給出具有突破性的解決方案。

息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力升級(jí)的特點(diǎn),就是洞察真實(shí)的行業(yè)AI大模型開發(fā)工作的訴求,針對(duì)每個(gè)環(huán)節(jié)都給出對(duì)應(yīng)的解法。我們可以將天翼云息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力的演進(jìn),分為多個(gè)層面進(jìn)行理解??纯刺煲碓迫绾螏椭鶤I路上的“取經(jīng)人”,一步步踏碎AI難關(guān),走上陽關(guān)大道。

1.筋斗云,翻越模型天塹。

智算服務(wù)平臺(tái)對(duì)行業(yè)智能化的賦能,首先需要提供完善、優(yōu)質(zhì)的大模型。天翼云在息壤一體化智算服務(wù)平臺(tái)打造的大模型庫,擁有國內(nèi)領(lǐng)先的豐富大模型。其中包含Llama系列、Qwen系列、智譜系列、書生浦語系列等眾多主流大模型,涵蓋不同參數(shù)量級(jí),供用戶靈活選擇。在原來29個(gè)模型的基礎(chǔ)之上,本次新增上線重量級(jí)商業(yè)閉源大語言模型Baichuan4、主流開源大語言模型書生浦語2系列的InternLM2-Chat-7B和InternLM2-Chat-20B、圖文多模態(tài)大模型Qwen-VL-Chat,以及Qwen2系列、Qwen1.5系列和Llama3系列的諸多模型。在這樣的大模型陣容下,各行業(yè)可以輕松調(diào)用到符合自身需求的大模型,快速實(shí)現(xiàn)大模型到行業(yè)場(chǎng)景的孵化。

2.七十二變,化身數(shù)據(jù)萬千。

在困擾行業(yè)大模型開發(fā)者的數(shù)據(jù)工作中,息壤一體化智算服務(wù)平臺(tái)內(nèi)置了專業(yè)的大模型數(shù)據(jù)集。中國電信在數(shù)據(jù)發(fā)展上開展的算數(shù)融合工程,首批推出超120萬對(duì)文本和語義識(shí)別類通用大模型訓(xùn)練所必需的問答對(duì)數(shù)據(jù),主要面向客服問答場(chǎng)景,解決了大量中小型企業(yè)訓(xùn)練數(shù)據(jù)不足的難題。

尤其需要注意的是,息壤一體化智算服務(wù)平臺(tái)內(nèi)置的數(shù)據(jù)集,在數(shù)據(jù)來源上經(jīng)過了嚴(yán)格的審核,可以確保數(shù)據(jù)的準(zhǔn)確性與真實(shí)性,并且通過多維度的數(shù)據(jù)驗(yàn)證,確保了數(shù)據(jù)集的完整性與一致性。行業(yè)大模型開發(fā)者可以獲得高質(zhì)量的數(shù)據(jù)支持,并且在該平臺(tái)中直接將數(shù)據(jù)應(yīng)用到訓(xùn)練、推理任務(wù)中。化身千萬的數(shù)據(jù)集,就像齊天大圣的七十二變,可以帶來堪稱神奇的大模型訓(xùn)練效果。

3.金箍棒,打出最強(qiáng)訓(xùn)練。

面對(duì)開發(fā)者在大模型訓(xùn)練中的系列痛點(diǎn), 天翼云在北京、上海建成兩個(gè)萬卡規(guī)模的公共智算中心,并在其資源池上搭載了息壤一體化智算服務(wù)平臺(tái),使其成為國內(nèi)首個(gè)單集群萬卡國產(chǎn)化全功能預(yù)訓(xùn)練云服務(wù)平臺(tái),可支持目前業(yè)內(nèi)最大參數(shù)規(guī)模開源單體稠密模型Llama3 405B在內(nèi)的大模型訓(xùn)練。訓(xùn)練測(cè)試結(jié)果顯示,Llama3 405B模型集群有效計(jì)算效率MFU在國產(chǎn)化萬卡規(guī)模情況下達(dá)到43%,達(dá)到業(yè)界領(lǐng)先水平。

息壤一體化智算服務(wù)平臺(tái)具有全鏈路故障感知和恢復(fù)、全鏈路日志監(jiān)控和斷點(diǎn)續(xù)訓(xùn)等核心技術(shù),能夠?qū)崿F(xiàn)1分鐘檢測(cè)、5分鐘定位、1分鐘內(nèi)告警,本次平臺(tái)升級(jí)還增加了網(wǎng)絡(luò)I/O監(jiān)控,為訓(xùn)練穩(wěn)定性添加了保障。在斷點(diǎn)續(xù)訓(xùn)方面,在Llama2-70b模型萬卡規(guī)模測(cè)試場(chǎng)景下,在主機(jī)故障、NPU卡故障、進(jìn)程退出故障、網(wǎng)絡(luò)超時(shí)故障四大類具體場(chǎng)景下斷點(diǎn)續(xù)訓(xùn)測(cè)試平均秒級(jí)故障檢測(cè),分鐘級(jí)故障定位和自動(dòng)化處理,分鐘級(jí)訓(xùn)練恢復(fù),其能力達(dá)到行業(yè)前沿水平。此次平臺(tái)升級(jí)還新增了對(duì)芯片故障的優(yōu)雅容錯(cuò),能夠做到無需重調(diào)度直接修復(fù)節(jié)點(diǎn)故障。目前,智算服務(wù)平臺(tái)已經(jīng)應(yīng)用于大量用戶的訓(xùn)推場(chǎng)景,如深圳市智算中心、人工智能實(shí)驗(yàn)室等。

4、火眼金睛,勘破場(chǎng)景應(yīng)用。

面對(duì)不同行業(yè)、不同企業(yè)的多樣化大模型應(yīng)用場(chǎng)景,息壤一體化智算服務(wù)平臺(tái)做了深度的洞察,就像點(diǎn)亮了“火眼金睛”,看到不同行業(yè)與企業(yè)對(duì)大模型的真實(shí)期待。

無論是具備深厚專業(yè)背景的行業(yè)客戶,還是對(duì)大模型推訓(xùn)能力有嚴(yán)格要求的大模型廠商,都可以通過息壤一體化智算服務(wù)平臺(tái)獲得準(zhǔn)確的支持,可通過直接調(diào)用預(yù)置的大模型服務(wù),使得開發(fā)者能夠輕松地將先進(jìn)的AI技術(shù)集成到自己的業(yè)務(wù)中。

如今,AI取經(jīng)之路上行者不絕,息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力也為諸多“取經(jīng)人”提供了深層次的幫助。

比如說,中醫(yī)與大模型的結(jié)合,是近段時(shí)期的產(chǎn)業(yè)熱點(diǎn)話題。中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所與天翼云合作,共同探索AI+中醫(yī)藥應(yīng)用創(chuàng)新。在中醫(yī)垂類大模型的微調(diào)、應(yīng)用發(fā)布平臺(tái)等環(huán)節(jié)中,天翼云提供的息壤一體化智算服務(wù)平臺(tái)為中醫(yī)藥信息研究所提供了多樣化的算法支持與模型優(yōu)化工具,幫助大模型能夠更好地挖掘中醫(yī)藥數(shù)據(jù)的潛在價(jià)值,實(shí)現(xiàn)中醫(yī)瑰寶與AI技術(shù)的融合發(fā)展。

這些真實(shí)的大模型落地場(chǎng)景,證明了息壤一體化智算服務(wù)平臺(tái)為行業(yè)智能化帶來的有力推助。作為國家云的天翼云,正在通過智算服務(wù)踏碎AI難關(guān),助力行業(yè)大模型開發(fā)順利西行。

讓每一位“AI取經(jīng)人”都找到契合的產(chǎn)業(yè)助力,離不開圍繞智算平臺(tái)的生態(tài)建設(shè)?;谄脚_(tái)能力,天翼云聯(lián)合伙伴上線了魔樂(Modelers.cn)開發(fā)者社區(qū)。

魔樂開發(fā)者社區(qū)真實(shí)貼合了中國的產(chǎn)業(yè)智能化環(huán)境,以及中國AI開發(fā)者的需求。就像《黑神話:悟空》展示的中國文化底蘊(yùn)那樣,天翼云承載國家云之責(zé),不斷加速構(gòu)建滿足AI產(chǎn)業(yè)發(fā)展所需的智算社區(qū)。具體而言,社區(qū)具有三大特色:

1.極致易用的工具鏈。

魔樂開發(fā)者社區(qū)能夠提供高易用性的API,快速實(shí)現(xiàn)開發(fā)者和研究人員的創(chuàng)意,并且支持千款大模型一鍵式離線復(fù)現(xiàn),使能開發(fā)者快速搭建開發(fā)環(huán)境,構(gòu)建AI應(yīng)用。

2.中文優(yōu)質(zhì)AI資源。

魔樂開發(fā)者社區(qū)已經(jīng)擁有超過1000個(gè)大模型,構(gòu)建了5大專區(qū),能夠?yàn)殚_發(fā)者提供通義千問、chatGLM、百川、書生系列、星辰Telechat等主流中文大模型資源。

3.國產(chǎn)化算力使能。

面對(duì)國產(chǎn)化AI算力需求的發(fā)展,魔樂開發(fā)者社區(qū)還構(gòu)建了體驗(yàn)空間,提供限時(shí)免費(fèi)的國產(chǎn)化算力資源,支持MindSpeed、Accelerator等加速庫,應(yīng)對(duì)大模型時(shí)代分布式訓(xùn)練的挑戰(zhàn),顯著提升大模型訓(xùn)練效率。

面向著數(shù)據(jù)、訓(xùn)練、推理的重重AI難關(guān),天翼云選擇步步前行,關(guān)關(guān)踏破。

經(jīng)過不斷的精進(jìn)升級(jí),天翼云智算服務(wù)平臺(tái)已經(jīng)在技術(shù)能力、資源積累、生態(tài)構(gòu)建等方面展露出了極高的產(chǎn)業(yè)化水準(zhǔn)。伴隨各個(gè)領(lǐng)域的行業(yè)大模型開發(fā)者對(duì)智算服務(wù)平臺(tái)的深度應(yīng)用,產(chǎn)業(yè)智能化的路途正在變得愈發(fā)順?biāo)?,前途更加光明?/p>

踏智能路,選國家云。隨著天翼云的息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力的不斷升級(jí)完善,會(huì)讓每一位行業(yè)大模型開發(fā)者在AI世界中,都成為自己故事中的“取經(jīng)人”。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-09-09
天翼云,AI取經(jīng)路上的逐夢(mèng)人
天翼云,AI取經(jīng)路上的逐夢(mèng)人

長(zhǎng)按掃碼 閱讀全文