“未來十年是 AI 的黃金十年”,業(yè)已成為各界共識。無論是硅谷巨頭還是國內(nèi)的華為、騰訊、阿里,都把 AI 視作開啟下一個時代的鑰匙。
作為最為核心的 AI 技術(shù)之一,深度學習成為各企業(yè)進軍 AI 領域的突破口。 在經(jīng)歷了Caffe、Theano代表的淺層框架時代以及Tensorflow、PyTorch代表的通用框架時代,深度學習框架的發(fā)展,迎來了以 MindSpore 為代表的全場景 AI 計算框架的新時代。
MindSpore 是華為推出的深度學習框架,具備統(tǒng)一的模型訓練、推理和導出等接口,支持端、邊、云等不同場景下的靈活部署。自2020 年 3 月正式開源以來,MindSpore 已經(jīng)培育了一個十分活躍的技術(shù)社區(qū),軟件總下載量超130萬,Star 數(shù)量超1.6萬,PR數(shù)超5.16萬。
風口之上,如何將 AI 技術(shù)落地,才是關(guān)鍵。AI 落地,就是要擺脫概念化,就必須找到合適的場景。2021 年 9 月起,MindSpore 社區(qū)開展了“MindSpore 開源活動”,設計了很多基于實際場景需求的任務。
比如,在做圖像識別時,載入圖片之后,往往需要對圖片進行預處理,以保證圖像符合預訓練模型的需求,其中一項就是把圖像數(shù)據(jù)由 (H,W,C)的矩陣轉(zhuǎn)換為(C,H,W)。MindSpore 現(xiàn)有的轉(zhuǎn)換算子,只能輸入三通道數(shù)的圖片,Gitee @unseenme 僅用了幾天時間就實現(xiàn)了多通道圖像輸入。這很有必要。在常規(guī)圖像處理以外的領域,如醫(yī)學圖像處理,其包含圖像的通道數(shù)可能達到了1000,因為醫(yī)療圖像中每一層可以看成是一個切片,整張圖片包含很多的切片。
自“MindSpore 開源活動”啟動以來,已經(jīng)提交了數(shù)十個 PR,其中近一半已經(jīng)被合并。
其中一個 PR 與腦瘤識別有關(guān)。數(shù)據(jù)集是 2800 多張腦影像圖片,分為 no_tumor(無腫瘤)、glioma_tumor(膠質(zhì)瘤)、meningioma_tumor(腦膜瘤)、pituitary_tumor(垂體瘤)四類訓練集。由于圖片數(shù)量較少,且各類腦瘤對于非專業(yè)的醫(yī)學人士而言難以分辨,因此任務難度很高。不過,Gitee @liyu_sup 基于卷積神經(jīng)網(wǎng)絡以及深度殘差網(wǎng)絡,很快就建立了腦瘤識別的 baseline 模型,并且將代碼貢獻給了 MindSpore 社區(qū)。
事實上,隨著深度學習的快速發(fā)展,越來越多的研究者都在嘗試將深度學習技術(shù)引入到腫瘤檢測項目中。基于人工提取特征的檢測算法,不僅需要專業(yè)領域的知識 ,而且耗時費力,并且最后還不一定能提取高質(zhì)量特征,而利用深度學習建立模型則完美解決了這些問題。
MindSpore 合并的 PR,大部分能夠應用在實際的場景中,最大化地將個人智慧產(chǎn)生社會影響力,真正實現(xiàn)技術(shù)的落地。
在 AI 落地行業(yè)時,最大的挑戰(zhàn)是如何降低開發(fā)門檻,并提供泛化能力,解決小樣本、跨模態(tài)等關(guān)鍵技術(shù)。
因此,MindSpore 在不遺余力地引導更多開發(fā)者關(guān)注、學習 AI 技術(shù)。MindSpore 提供了詳細的教程,包括訓練、推理和端側(cè)設備使用三部分,開發(fā)者可以根據(jù)自身情況選擇不同階段進行學習。教程設置由易到難,步步深入,從深度學習的發(fā)展歷史,到MindSpore 的安裝及使用,到深度學習算法、自然語言處理、圖像識別等多種AI實戰(zhàn),再到MindSpore 的原理及創(chuàng)新算法均有涉及,甚至還會補充深度學習、機器學習基礎知識。
千里之行,始于足下。學習最有效的方式,就是與實踐相結(jié)合。這也是“MindSpore 開源活動”出現(xiàn)的原因。簡單來說,就是開發(fā)者先學習官方視頻課程,然后動手實踐任務,任務完成后經(jīng)由技術(shù)人員指導審核通過即可。
MindSpore 社區(qū)設置了初、中、高三個難度級別任務,包括文檔資料、語法規(guī)范、技術(shù)文章、框架 bug、API 補齊、模型開發(fā)、模型遷移、論文復現(xiàn)、算子開發(fā)、應用案例等 10 種任務類型。對開源新手來說,可以先做一些簡單的任務,比如在代碼中為函數(shù)添加注釋,將中文說明文檔翻譯成英文。
完成任務后,可獲得相應積分,憑借積分可兌換價值300元-4500元的獎品,并獲得開發(fā)者證書。此外,優(yōu)秀開發(fā)者更有機會成為 MindSpore 開源社區(qū) SIG 組組長,參與到 MindSpore 核心技術(shù)演進的討論。
“MindSpore 開源活動”將 MindSpore 學習過程與 MindSpore 開源實踐結(jié)合起來,一步步引導開發(fā)者進入深度學習領域,迅速擴展和鍛煉技術(shù)圖譜。此外,以開源的方式貢獻代碼,不是屬于某個人的,也不是某個公司的,而是屬于所有人的。
除了技術(shù)落地之外,人才稀缺也一直是 AI 技術(shù)進一步發(fā)展的掣肘。我國AI產(chǎn)業(yè)在短期內(nèi)實現(xiàn)高速增長同時,人才需求面臨巨大缺口,而且 AI 人才的培養(yǎng)明顯滯后。雖然越來越多高校已經(jīng)開設了深度學習、機器視覺等AI相關(guān)專業(yè),但招生規(guī)模仍然較小,畢業(yè)生數(shù)量遠遠無法滿足企業(yè)需求。
《人工智能產(chǎn)業(yè)人才發(fā)展報告(2019-2020年版)》指出,人工智能領域仍然存在人才儲備不足且培養(yǎng)機制不完善等問題,人才供需比嚴重不平衡,預計當前我國人工智能產(chǎn)業(yè)內(nèi)有效人才缺口達30萬。
正是看到這一點,華為早在 2018 年就宣布了沃土 AI開發(fā)者使能計劃。其中,面向高校和科研機構(gòu),計劃投入10億元人民幣用于AI人才培養(yǎng);在開發(fā)者方面,計劃三年培養(yǎng)100萬開發(fā)者。
此次的“MindSpore 開源活動”,也是官方人才培養(yǎng)計劃的一部分。也許,所謂的開源活動,不過是 MindSpore 拋出的一塊餌,希望能吸引更多的開發(fā)者參與進來,一起開創(chuàng)一個 AI 時代。
加入 MindSpore 開源社區(qū),邁向更廣闊領域。歡迎開發(fā)者到Gitee官方網(wǎng)站MindSpore 開源社區(qū)參與活動。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )