企業(yè)級機器學(xué)習(xí) 會成為下一個萬億級的新市場嗎?

科技云報道原創(chuàng)。

在哈利·波特的魔法世界中,分院帽是一頂磨得很舊,打著補丁,而且臟得要命的尖頂巫師。不過可別小看它,它可是充滿智能、會思想的魔法帽,能看出學(xué)生具備何種才能,從而將學(xué)生分到適合的學(xué)院。

如果現(xiàn)實世界存在分院帽的話,那么它應(yīng)該類似于機器學(xué)習(xí)的應(yīng)用程序,可以根據(jù)復(fù)雜的數(shù)據(jù)集自主地做出決策。

如今,機器學(xué)習(xí)正在推動數(shù)萬億規(guī)模的全球產(chǎn)業(yè),市場調(diào)查機構(gòu)Grand View Research最近發(fā)布的《機器學(xué)習(xí)市場報告2025》預(yù)計,到2025年,全球機器學(xué)習(xí)市場規(guī)模將達到967億美元。2019年-2025年的年復(fù)合增長率為43.8%,其中金融服務(wù),零售和汽車領(lǐng)域處于領(lǐng)先地位。如果機器學(xué)習(xí)有望創(chuàng)造更大規(guī)模的市場價值,那么問題來了:這些價值將在哪里產(chǎn)生呢?

從初創(chuàng)公司到科技巨頭 機器學(xué)習(xí)深度嵌入垂直場景

早在50年前,機器學(xué)習(xí)的概念就出現(xiàn)了。只是直到今天,隨著云計算的出現(xiàn),人工智能和機器學(xué)習(xí)才進入千千萬萬的企業(yè),不再局限于少數(shù)科技巨頭和硬核的研究機構(gòu)。云計算時代的到來,掃清了企業(yè)應(yīng)用人工智能和機器學(xué)習(xí)的障礙,而即便最保守的企業(yè)在當今都無法忽視人工智能的作用。根據(jù)IDC的數(shù)據(jù),當前40%的企業(yè)數(shù)字化轉(zhuǎn)型項目都會運用人工智能。

Facebook、Amazon、Apple、Netflix、Google等科技巨頭在機器學(xué)習(xí)方面的創(chuàng)新廣為人知,從新聞推送到推薦引擎不一而足。其實,這些科技巨頭在機器學(xué)習(xí)領(lǐng)域早已布局。比如Amazon就在這個領(lǐng)域已經(jīng)投入了20多年,其在線零售的個性化產(chǎn)品推薦、機器人倉儲中心、無人機送貨、Alexa語音助理、Amazon GO無人值守超市,都依靠人工智能和機器學(xué)習(xí)技術(shù)的支持。

但就更多場景而言,人工智能的應(yīng)用仍然較為局限。目前,制約人工智能廣泛應(yīng)用的因素有三個方面:一是掌握人工智能專業(yè)知識的人才不足;二是構(gòu)建和擴展人工智能的技術(shù)產(chǎn)品有難度;三是在生產(chǎn)經(jīng)營中部署人工智能應(yīng)用費時且成本高。最終導(dǎo)致缺乏低成本、易使用、可擴展的人工智能產(chǎn)品和服務(wù)。就機器學(xué)習(xí)而言,多數(shù)機器學(xué)習(xí)方法的性能在很大程度上依賴于過量的模型設(shè)計策略,這導(dǎo)致新手難以較快地掌握和應(yīng)用機器學(xué)習(xí)。

對此,Amazon SageMaker的出現(xiàn)幫助企業(yè)解決了這些挑戰(zhàn)。作為一個工具集,Amazon SageMaker提供了用于機器學(xué)習(xí)的所有組件,比如彈性筆記本、實驗管理、自動模型創(chuàng)建、調(diào)試與分析,以及模型概念漂移檢測等多元化工具和功能,貫穿整個機器學(xué)習(xí)的工作流程,從而以更少的努力、更低的成本、更快地將機器學(xué)習(xí)模型投入生產(chǎn)。

2021年5月11日,Amazon SageMaker以落地中國區(qū)域一周年為契機,進一步在中國區(qū)域落地多項人工智能與機器學(xué)習(xí)的新服務(wù)和功能,“希望通過將更多服務(wù)落地到中國區(qū)域,并堅持‘授人以魚不如授人以漁’,甚至更進一步‘扶上馬,送一程’的方式,幫助客戶更快應(yīng)用機器學(xué)習(xí)技術(shù),把機器學(xué)習(xí)的能力交到每一位構(gòu)建者手中,加速人工智能和機器學(xué)習(xí)的普惠?!眮嗰R遜云科技大中華區(qū)云服務(wù)產(chǎn)品管理總經(jīng)理顧凡表示。

亞馬遜云科技大中華區(qū)云服務(wù)產(chǎn)品管理總經(jīng)理顧凡

除了科技巨頭,全球一些初創(chuàng)型的公司也都在將機器學(xué)習(xí)與垂直領(lǐng)域相結(jié)合,最好的機器學(xué)習(xí)公司都有著清晰的垂直重點。他們甚至不會將自己定義為機器學(xué)習(xí)公司。比如在工業(yè)和物流領(lǐng)域,Covariant是一家結(jié)合了強化學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的初創(chuàng)公司,該公司讓機器人能夠管理大型倉庫設(shè)施中的物體;Interos應(yīng)用機器學(xué)習(xí)技術(shù)評估全球供應(yīng)鏈網(wǎng)絡(luò),幫助企業(yè)圍繞供應(yīng)商管理、業(yè)務(wù)連續(xù)性和風險做出關(guān)鍵決策。

在醫(yī)療領(lǐng)域,Athelas已將機器學(xué)習(xí)應(yīng)用于免疫監(jiān)測,通過收集病人白血球數(shù)量的數(shù)據(jù)幫助他們優(yōu)化藥物攝入。Curai利用機器學(xué)習(xí)技術(shù)來提高醫(yī)生推薦的效率和質(zhì)量,讓他們可以把更多的時間花在治療患者的工作上。Zebra和AIdoc通過訓(xùn)練數(shù)據(jù)集來更快地確定醫(yī)療狀況,從而提高了放射科醫(yī)生的工作能力。

然而,大規(guī)模部署機器學(xué)習(xí)模型也可能為企業(yè)帶來諸多挑戰(zhàn)。例如,規(guī)?;牟渴鹦枰獙崿F(xiàn)“數(shù)據(jù)-模型-成果”這一復(fù)雜且反復(fù)的端到端工作流程。而且,企業(yè)也需要提高自身治理能力,合理應(yīng)對模型部署可能帶給終端客戶服務(wù)的影響(如隱私問題),并著眼于數(shù)據(jù)應(yīng)用的合規(guī)性和安全性,以及該模型是否能轉(zhuǎn)化成為生產(chǎn)級模型等。

前途光明但道路曲折 機器學(xué)習(xí)模型仍面臨四大挑戰(zhàn)

據(jù)國外知名科技媒體VentureBeat報道,大約90%的機器學(xué)習(xí)模型從未投入生產(chǎn)。換句話說,機器學(xué)習(xí)只有10%能夠真正產(chǎn)出對公司有用的東西。盡管大家都相信,人工智能將成為下一次科技革命的中心,但人工智能的采用和部署尚未獲得長足的發(fā)展。目前來看,機器學(xué)習(xí)要想大規(guī)模應(yīng)用仍然還面臨比較大的挑戰(zhàn)。

挑戰(zhàn)一:數(shù)據(jù)獲取和訪問難度大

許多公司的IT系統(tǒng)都是高度筒倉化的,這意味著每個部門都有自己收集數(shù)據(jù)的方式、首選格式、存儲位置以及安全和隱私偏好。另一方面,機器學(xué)習(xí)經(jīng)常需要來自多個部門的數(shù)據(jù),筒倉化模式增加了清理和處理這些數(shù)據(jù)的難度。但在今天這個技術(shù)飛速變革的時代,企業(yè)將需要加快步伐,在整個過程中建立起統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)。

挑戰(zhàn)二:IT、數(shù)據(jù)科學(xué)和工程脫節(jié)

如果公司的目標是減少“數(shù)據(jù)筒倉”,就意味著各部門需要更多地相互溝通,調(diào)整各自的目標。但在許多公司中,IT部門和數(shù)據(jù)部門之間存在著根本性的分歧。IT傾向于優(yōu)先考慮讓事情正常運轉(zhuǎn)并保持穩(wěn)定,而數(shù)據(jù)專家則更喜歡進行一些嘗試性創(chuàng)造,這就會導(dǎo)致一些不穩(wěn)定情況發(fā)生,使雙方的溝通產(chǎn)生困難。此外,對于數(shù)據(jù)專家來說,與IT工程師的溝通也是一道障礙,因為IT工程師有時候可能無法了解數(shù)據(jù)專家所設(shè)想的所有細節(jié),或者可能會由于溝通錯誤而改變實現(xiàn)方式。

挑戰(zhàn)三:重復(fù)性工作多 應(yīng)用擴展較難

機器學(xué)習(xí)模型可能在小規(guī)模數(shù)據(jù)樣本的環(huán)境中工作得很好,但這并不意味著它在任何地方都可以工作得很好。首先,可能沒有處理更大數(shù)據(jù)集的硬件或云存儲空間可供使用。此外,在規(guī)模很大時,機器學(xué)習(xí)模型的模塊并不總是像規(guī)模較小時那么有效。另外,由于公司的筒倉結(jié)構(gòu),數(shù)據(jù)獲取可能也比較困難,這也是在組織之間統(tǒng)一數(shù)據(jù)結(jié)構(gòu)、鼓勵不同部門之間進行交流的另一個原因。

在部署機器學(xué)習(xí)模型的漫長道路上,超過25%的企業(yè)都存在重復(fù)工作。例如,軟件工程師可能會按數(shù)據(jù)專家的說法進行實現(xiàn),后者可能也會自己做一些工作。這不僅浪費時間和資源,而且在遇到任何錯誤時就不知道應(yīng)該向誰求助,這會導(dǎo)致額外的混亂。如果數(shù)據(jù)專家能夠?qū)崿F(xiàn)他們的模型,但對于職責如何劃分、如何明確分工,他們應(yīng)該與IT工程師溝通清楚,這樣就可以節(jié)省時間和資源。

挑戰(zhàn)四:不能跨語言且缺少框架支持

由于機器學(xué)習(xí)模型仍處于起步階段,不同的語言和框架仍有相當大的差距。有些模型開始時使用的是Python語言開始,中間切換到R語言,最后用的是Julia語言。有的則相反,或者完全使用其他語言。由于每種語言都有自己獨特的庫和依賴項,項目很快就變得很難跟蹤。此外,有些模型可能會使用Docker和Kubernetes進行容器化,并部署特定的API,其他模型則不會,這樣的例子不勝枚舉。為了彌補這種不足,像TFX、Mlflow和Kubeflow這樣的工具出現(xiàn)了。但這些工具仍處于起步階段,但到目前為止,這方面的專業(yè)人才還很少。

事實上,模仿人類的思維并不是機器學(xué)習(xí)的唯一目標,相反機器學(xué)習(xí)可以通過對大型數(shù)據(jù)集進行詳盡的分析來提高人類的智能水平,就像搜索引擎能夠通過組織Web來擴展人類的知識一樣。機器學(xué)習(xí)還可以匯總多個數(shù)據(jù)集的信息,探索模式,并為一些問題提出新的解決方案,從而在醫(yī)療、商業(yè)、交通等多個領(lǐng)域為人類提供新型服務(wù)。

機器學(xué)習(xí)技術(shù)必將推動企業(yè)機構(gòu)的變革,目前許多機器學(xué)習(xí)應(yīng)用已經(jīng)為企業(yè)機構(gòu)帶來了實際的業(yè)務(wù)成果。機器學(xué)習(xí)可以實現(xiàn)流程自動化、發(fā)現(xiàn)新洞察,從而幫助企業(yè)創(chuàng)造新產(chǎn)品或增強現(xiàn)有產(chǎn)品及服務(wù),從而提供更好的客戶體驗。

但企業(yè)機構(gòu)要想真正將機器學(xué)習(xí)應(yīng)用到實際業(yè)務(wù)場景之中,還需完成全方位運營轉(zhuǎn)型,具備建立和開發(fā)機器學(xué)習(xí)模型以及部署和運營整個模型的能力,從而全方位發(fā)掘機器學(xué)習(xí)的潛力。目前為止,大型企業(yè)孵化了最先進的技術(shù),但是真正的希望存在于下一波機器學(xué)習(xí)應(yīng)用程序和工具之中,將圍繞機器智能將哈利·波特式的幻想轉(zhuǎn)化為有形的社會價值。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2021-05-24
企業(yè)級機器學(xué)習(xí) 會成為下一個萬億級的新市場嗎?
企業(yè)級機器學(xué)習(xí) 會成為下一個萬億級的新市場嗎?

長按掃碼 閱讀全文