文 | 智能相對論
作者 | 陳泊丞
2019年,彼時的AI賽道還不像今天這么熱。
這一年,人工智能連續(xù)第三年出現(xiàn)在政府工作報告中,政策關鍵詞從“加快”“加強”轉變?yōu)椤吧罨?,開始進入行業(yè)需求快速增長的應用探索期。而華為也在這個階段完成了初步的戰(zhàn)略布局和自主技術儲備,向更深層次邁進??拼笥嶏w也前瞻性地聯(lián)合多家國內廠商圍繞根技術進行科研攻關,并希望通過一系列自主創(chuàng)新,提升AI領域的自主化水平,從而真正與國際科技巨頭們能在同一起跑線上進行競爭。相似的經(jīng)歷、一致的目標,讓科大訊飛和華為意識到對根技術的探索任重道遠,并開始尋求深度的合作。
本土科技廠商的雙向奔赴:“敢用-真用-會用-用好”步步深入
回顧訊飛星火大模型和華為昇騰的合作之路,科大訊飛副總裁、AI工程院院長潘青華梳理出了四個關鍵階段,即“敢用-真用-會用-用好”,雙方在每一個階段都遇到了大量的問題、顧慮,最終攜手克服困難,才把原生創(chuàng)新的路徑走通。在與昇騰合作之前,科大訊飛就已經(jīng)做了很多技術上的行動,比如自研深度學習并行訓練框架和訓推工具鏈,基于國內優(yōu)秀軟硬件基礎設施打造穩(wěn)定高效的大規(guī)模深度學習訓練平臺等等,但是在核心算力層面上始終沒有很好的國產(chǎn)化解決方案,算力資源成了本土科技廠商發(fā)展AI大模型的一個關鍵限制。在這種情況下,科大訊飛走出了“敢用”的第一步。
隨著對根技術需求的認識加深以及對昇騰AI平臺性能的了解,科大訊飛開始嘗試基于昇騰AI進行模型訓練和推理工作。昇騰以其高度專業(yè)的服務態(tài)度和服務能力,全力支持訊飛AI訓練移植優(yōu)化,包含語音識別、語音理解、機器翻譯等模型在昇騰算力資源上的移植適配。這讓科大訊飛與昇騰AI的合作繼續(xù)進入了“真用”階段,開始尋求發(fā)展中解決大模型訓練推理的核心難題。
以國內首個支持萬億參數(shù)大模型訓練的智算集群“飛星一號”正式上線為標志性節(jié)點,科大訊飛不僅在業(yè)界首創(chuàng)基于RoCE的大規(guī)模無損組網(wǎng),還與昇騰AI聯(lián)合解決500余次軟硬件問題,首次實現(xiàn)千億參數(shù)大模型訓練效率達到業(yè)界水平。在這個過程中,科大訊飛與昇騰AI共同攻堅克難,解決大規(guī)模集群訓練中保存斷點后性能“抖動”、性能“爬坡”等疑難雜癥。有了這些成功的探索與驗證,科大訊飛與昇騰AI的合作進入了以原生創(chuàng)新為主導的“會用”階段,雙方在根技術上的攻關取得顯著回饋。
基于昇騰硬件親和特性,科大訊飛對星火大模型的模型結構進行重新設計,不僅讓星火大模型訓練性能較之前提升10%,還創(chuàng)新實現(xiàn)了混合長序列并行算法,促使星火大模型在昇騰上的長序列性能提升了15%。今年6月,科大訊飛正式發(fā)布完全基于昇騰算力訓練的星火大模型V4.0,其中星火V4.0在國內外中英文12項主流測試集的8項中,實現(xiàn)了對GPT-4Turbo的超越,成功晉升為業(yè)界領先的通用大模型底座。
未來,科大訊飛將繼續(xù)思考如何進一步“用好”昇騰AI,面向更大規(guī)模集群和更大規(guī)模訓練任務,共同探索如何持續(xù)挖潛集群性能、大模型推理性能如何進一步提升等等一系列問題。
一路走來,步步深入,科大訊飛與昇騰AI從最初的接觸探索到后來的深入?yún)f(xié)同,再到原生創(chuàng)新的成功實踐,雙方以深度合作的姿態(tài),在AI原生創(chuàng)新之路上越走越堅定。
本土化技術創(chuàng)新完成了一次很好的驗證
本土化技術創(chuàng)新難在兩大方面,一是技術難做,沒有解題思路,二是項目難堅持,沒有持續(xù)解決問題的理念,往往就會無疾而終。這是一段長期的探索歷程,技術決定了起步,而理念決定了起步后的發(fā)展是否能長期。
一、技術與理念的雙向奔赴。
科大訊飛與昇騰AI的這場合作之所以能成功,不僅是技術層面的深入?yún)f(xié)同,還有理念層面的雙向奔赴。比如針對大規(guī)模集群訓練兩個月后“越訓越慢”的問題,科大訊飛與昇騰AI通過集合通信-驅動-內核的層層分析,最終發(fā)現(xiàn)操作系統(tǒng)內核問題,導致算子下發(fā)時間變長、訓練性能下降,才有了后續(xù)的解決方案。
二、互為反哺的價值共生。
此次合作中,業(yè)界看到的更多是科大訊飛基于昇騰AI完成了一系列成就,但與此同時,昇騰AI也在接受反哺??拼笥嶏w深入?yún)⑴c并助力昇騰持續(xù)完善面向大模型的軟件生態(tài),共同開發(fā)和優(yōu)化了基礎算子和通信算子共120多個,基于底層開放API接口也開發(fā)了自定義融合算子30多個。同時,雙方共同組建的聯(lián)合項目組還推動了昇騰工具50多項關鍵特性的開發(fā),促使Mindstudio工具不斷完善,也持續(xù)豐富了昇騰的大模型工具集。
好的合作關系一定是互相成就的,雙方在本次合作中收獲的巨大成果便是具象化呈現(xiàn),若要實現(xiàn)本土化技術創(chuàng)新,就應該在互為反哺的價值共生關系中去尋求答案。
三、惠及產(chǎn)業(yè)發(fā)展的生態(tài)成果。
科大訊飛和昇騰AI的這場合作,在惠及企業(yè)自身的同時,也在推動著中國AI產(chǎn)業(yè)的跨越發(fā)展。比如,雙方聯(lián)合打造的國內首個支持萬億參數(shù)規(guī)模大模型訓練的智算集群“飛星一號”,大幅提升我國在人工智能領域的行業(yè)競爭力。接下來雙方將繼續(xù)深入探索未來中國人工智能產(chǎn)業(yè)發(fā)展的關鍵問題,相信將有更多技術創(chuàng)新與生態(tài)成果,更廣泛地惠及千行萬業(yè)。
大模型原生創(chuàng)新時代開了個好頭
科大訊飛和昇騰AI的雙向奔赴為中國AI產(chǎn)業(yè)發(fā)展開了一個好頭。正如潘青華院長在演講中強調,“只有持續(xù)跑得快才能最終跑得贏?!敝袊鳤I產(chǎn)業(yè)發(fā)展需要持續(xù)跑得快。
現(xiàn)階段,“原生創(chuàng)新”概念經(jīng)常被行業(yè)所提及。但大部分的討論只停留在了應用原生創(chuàng)新之上,認為只要把AI應用孵化在技術平臺上,就是做到了原生創(chuàng)新,往往卻忽視了根技術的原生創(chuàng)新。
如果孵化到國外的技術平臺,做到了應用的原生創(chuàng)新,那確實是“跑得快”,但是能“持續(xù)”嗎?其中客觀存在的不穩(wěn)定性和高風險,或許會在未來的某天突然“暴雷”,給企業(yè)經(jīng)營和產(chǎn)業(yè)發(fā)展帶來不可挽回的損失。
而只有基于根技術的自主創(chuàng)新,放在自家的技術平臺上孵化、培育,那才有“持續(xù)跑得快、跑得穩(wěn)”,最終“跑得贏”,跑向一個真正的大模型原生創(chuàng)新時代??拼笥嶏w和昇騰AI就一直在為這樣的時代而努力。
基于訊飛星火醫(yī)療大模型平臺和昇騰AI基礎軟硬件,科大訊飛與華為聯(lián)合打造了一體化醫(yī)療健康私有化解決方案。同時,訊飛醫(yī)療還攜手華為,與四川大學華西醫(yī)院達成了三方戰(zhàn)略合作伙伴關系,共同圍繞創(chuàng)新醫(yī)療服務模式、改善就醫(yī)體驗、醫(yī)療大模型技術應用等重點領域展開深入合作。
這將是醫(yī)療大模型應用落地的一個里程碑,未來一個“AI為每個醫(yī)生打造診療助理,為每個居民打造健康助手的世界”或許很快就會到來。那么,站在社會民生的角度來看,大模型原生創(chuàng)新時代的到來,不僅僅是對產(chǎn)業(yè)發(fā)展有助益,更將是AI普惠社會民眾的開端。
據(jù)多家媒體統(tǒng)計,2024年上半年,在已公開的行業(yè)大模型中標信息中,科大訊飛的合同數(shù)量、合同金額均保持行業(yè)領先,行業(yè)場景逐步拓寬。今天,隨著AI賽道越來越熱,千行萬業(yè)都在向AI領域發(fā)起沖鋒,而產(chǎn)業(yè)經(jīng)濟的高質量發(fā)展需要持續(xù)跑得快、跑得穩(wěn),最終才能跑得贏。這一目標離不開本土企業(yè)對根技術的攻關以及對原生創(chuàng)新的堅持。
在訊飛星火與昇騰AI的雙向奔赴中,業(yè)界看到了一條從技術攻關到應用探索的完整路徑。以此為標桿,中國的AI產(chǎn)業(yè)又完成了一次探索驗證,將跨入一個更穩(wěn)定、堅實的發(fā)展新階段。
*本文圖片均來源于網(wǎng)絡
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。