5月15日,根據(jù)北京市生成式人工智能服務(wù)已備案信息公告,中國(guó)電信人工智能研究院(TeleAI)自主研發(fā)的星辰大模型已通過(guò)備案。今年2月星辰大模型已通過(guò) “境內(nèi)深度合成服務(wù)算法備案” ,“雙備案”標(biāo)志著星辰大模型可正式對(duì)外提供生成式人工智能服務(wù)。
TeleAI作為最早布局大模型的央企機(jī)構(gòu)之一,堅(jiān)持全鏈路完全自主研發(fā)創(chuàng)新,去年便發(fā)布了千億參數(shù)“星辰”語(yǔ)義大模型,性能處于國(guó)內(nèi)同級(jí)別參數(shù)模型的前列。同步構(gòu)建了語(yǔ)義、語(yǔ)音、視覺(jué)及多模態(tài)等全模態(tài)完備的大模型基礎(chǔ)框架,基于星辰大模型的各領(lǐng)域算法已獲國(guó)際頂會(huì)AI競(jìng)賽冠亞軍24項(xiàng)。TeleAI逐步形成涵蓋5大領(lǐng)域的前沿布局:1個(gè)智算云底座、1個(gè)通用大模型底座、1個(gè)數(shù)據(jù)底座、M個(gè)內(nèi)部大模型、N個(gè)行業(yè)大模型。
TeleAI積極通過(guò)開(kāi)源推動(dòng)大模型技術(shù)進(jìn)步和大模型國(guó)產(chǎn)化進(jìn)程。在中國(guó)電信CTO、院長(zhǎng)李學(xué)龍帶領(lǐng)下,加快研發(fā)創(chuàng)新,接連開(kāi)源7B、12B、52B參數(shù)規(guī)模大模型,吸引國(guó)內(nèi)外開(kāi)源社區(qū)開(kāi)發(fā)者廣泛討論和使用,開(kāi)源模型下載量過(guò)萬(wàn),積累超40W+用戶。
本次開(kāi)源的TeleChat-12B-V2(星辰12B-V2),采用3.7萬(wàn)億tokens高質(zhì)量中英文預(yù)訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,并在SFT數(shù)據(jù)部分,針對(duì)幻覺(jué)、邏輯推理方向數(shù)據(jù)進(jìn)行定向提升。在通用問(wèn)答能力上較之前版本提升5.5%,在多輪數(shù)學(xué)性能上提升40.3%。
同時(shí),進(jìn)一步開(kāi)源更大參數(shù)的語(yǔ)言模型TeleChat-52B(星辰52B),52B模型使用更高質(zhì)量的數(shù)據(jù)、更科學(xué)的數(shù)據(jù)配比,采用課程學(xué)習(xí)方式,在通用問(wèn)答能力上大幅超過(guò)12B模型,整體性能比肩甚至超過(guò)GPT 3.5-Turbo。本次除了開(kāi)源chat版本模型外,還開(kāi)源了基于Deepspeed的全參微調(diào)和Lora微調(diào)方法,供大模型技術(shù)研究者和需求開(kāi)發(fā)者進(jìn)行自主訓(xùn)練微調(diào)模型。據(jù)悉,中國(guó)電信人工智能研究院表示年內(nèi)預(yù)計(jì)將開(kāi)源千億級(jí)參數(shù)大模型,逐步構(gòu)建全尺寸開(kāi)源格局,通過(guò)更豐富的應(yīng)用場(chǎng)景、更廣泛的落地應(yīng)用、更繁榮的行業(yè)生態(tài),助力中國(guó)大模型技術(shù)進(jìn)步與落地應(yīng)用。
據(jù)悉,星辰大模型已廣泛應(yīng)用落地,賦能千行百業(yè)轉(zhuǎn)型升級(jí)。星辰語(yǔ)義大模型已落地某市民生訴求場(chǎng)景,為市民提供在線文本問(wèn)答服務(wù),提升政務(wù)服務(wù)能力,提高市民滿意度;語(yǔ)音大模型一體機(jī)落地某小學(xué)防霸凌項(xiàng)目,星辰語(yǔ)音大模型采用億級(jí)參數(shù)進(jìn)行推理,可在嘈雜環(huán)境下,實(shí)現(xiàn)報(bào)警關(guān)鍵詞的精準(zhǔn)識(shí)別預(yù)報(bào)警,智能應(yīng)對(duì)各種校園霸凌事件;星辰視覺(jué)大模型融入多源跨橫態(tài)信息,面向公安、縣鄉(xiāng)綜治、基層治理等公共安全管理單位,提供視頻圖像解析、聚檔、視頻語(yǔ)義檢索等能力,助力智慧城市建設(shè)。星辰多模態(tài)大模型累計(jì)研發(fā)15種文生圖、55種圖生圖能力,落地海報(bào)生成場(chǎng)景和卡券生成場(chǎng)景。
此外,中國(guó)電信憑借在各行業(yè)深耕多年的優(yōu)勢(shì)和經(jīng)驗(yàn),聯(lián)合頭部生態(tài)構(gòu)建了涵蓋教育、政務(wù)、應(yīng)急等20多個(gè)行業(yè)大模型,深入推動(dòng)大模型與各行各業(yè)的融合,切實(shí)賦能千行百業(yè)轉(zhuǎn)型升級(jí)。
星辰大模型通過(guò) “雙備案”后,將進(jìn)一步為客戶、生態(tài)伙伴、開(kāi)發(fā)者及個(gè)人用戶等提供前沿的AI能力,賦能千行百業(yè)變革的同時(shí)也提升個(gè)人工作效率和日常生活便利性,切實(shí)推進(jìn)國(guó)內(nèi)AI技術(shù)進(jìn)步及落地應(yīng)用,加速全社會(huì)邁向通用人工智能時(shí)代。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )