從試驗(yàn)品到產(chǎn)品:AutoML是如何一步步貼近產(chǎn)業(yè)應(yīng)用的?

原標(biāo)題:從試驗(yàn)品到產(chǎn)品:AutoML是如何一步步貼近產(chǎn)業(yè)應(yīng)用的?

今天AI在世界范圍內(nèi)的發(fā)展情況,可以用一路綠燈來(lái)形容。國(guó)家層面的高度重視與科技巨頭的全力投入齊頭并進(jìn),正讓AI如同開(kāi)了掛一般快速進(jìn)入產(chǎn)業(yè)場(chǎng)景。不知不覺(jué)間,工廠里開(kāi)始引入了計(jì)算機(jī)視覺(jué)解決方案,電話中與我們對(duì)話的客服變成了機(jī)器人。

如果說(shuō)在這樣綠燈全開(kāi)的情況下,還有什么在阻礙著AI產(chǎn)業(yè)化發(fā)展,恐怕就只有知識(shí)門(mén)檻帶來(lái)的AI人才缺失了。根據(jù)高盛推出的《全球人工智能產(chǎn)業(yè)分布報(bào)告》:2017年全球AI人才儲(chǔ)備中,中國(guó)只占5%左右。而這些人才大多只在科技企業(yè)間流動(dòng),對(duì)于傳統(tǒng)行業(yè)來(lái)說(shuō),大多都與AI人才無(wú)緣。而AI產(chǎn)業(yè)化的對(duì)象,恰恰也是這些傳統(tǒng)產(chǎn)業(yè)。如何幫助傳統(tǒng)產(chǎn)業(yè)突破人才桎梏,降低應(yīng)用AI技術(shù)的門(mén)檻,是AI產(chǎn)業(yè)化當(dāng)下重要目標(biāo)之一。

除了支持AI人才培養(yǎng)之外,我們也一直在嘗試從技術(shù)角度解決這一問(wèn)題,AutoML技術(shù)——自動(dòng)化機(jī)器學(xué)習(xí)就是解決方案之一。簡(jiǎn)單來(lái)說(shuō),AutoML的目標(biāo)是降低企業(yè)用戶、開(kāi)發(fā)者以及研究人員使用AI相關(guān)工具和框架的門(mén)檻,即使不懂如何搭建神經(jīng)網(wǎng)絡(luò)、不懂如何調(diào)參,也可以使用AutoML工具搭建出應(yīng)用級(jí)的機(jī)器學(xué)習(xí)模型。

除了谷歌、微軟、亞馬遜這些海外科技企業(yè)在AutoML中投入頗多以外,我們也能看到越來(lái)越多的中國(guó)企業(yè)加入了AutoML的隊(duì)伍。

從一場(chǎng)競(jìng)賽,到AI產(chǎn)業(yè)化的廣袤沃土

在今年亞太知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘會(huì)議(PAKDD)舉辦的AutoML比賽中,深蘭科技DeepBlueAI團(tuán)隊(duì)從46個(gè)國(guó)家(地區(qū))的隊(duì)伍中脫穎而出,擊敗了微軟亞洲研究院推出的MLintelligence獲得了第一名的成績(jī)。

這次DeepBlueAI最大的一個(gè)亮點(diǎn),就是將概念漂移的解決方案引入了AutoML中,所謂概念漂移,指的就是在機(jī)器學(xué)習(xí)中隨著時(shí)間推移,目標(biāo)變量以不可預(yù)見(jiàn)的方式發(fā)生著變化,導(dǎo)致未來(lái)數(shù)據(jù)分布與已有數(shù)據(jù)分布不一致。也就是說(shuō)在AutoML快速建立好機(jī)器學(xué)習(xí)模型后,模型的精度是可能隨著時(shí)間推移而下降的,這種情況顯然會(huì)影響現(xiàn)實(shí)場(chǎng)景中AutoML的應(yīng)用效率。


(Feedback phase排行榜)

DeepBlueAI團(tuán)隊(duì)給出的解決方案,是通過(guò)融合不同時(shí)期的數(shù)據(jù)以及結(jié)合DNN和LightGBM的訓(xùn)練,加上自適應(yīng)采樣來(lái)緩解類別不平衡,在一定時(shí)間間隔中讓模型重復(fù)訓(xùn)練,最終形成對(duì)概念漂移的自適應(yīng)。形成生命力更強(qiáng)、更具持續(xù)性的終生自動(dòng)化機(jī)器學(xué)習(xí)工具。

DeepBlueAI團(tuán)隊(duì)對(duì)于概念漂移問(wèn)題的解決,不僅僅在技術(shù)角度具有極高的突破性,在AutoML的產(chǎn)業(yè)應(yīng)用的道路中也給予了很大的推助力。

AutoML面向的對(duì)象,大多是對(duì)AI技術(shù)了解不多的企業(yè)應(yīng)用者。這一類應(yīng)用者顯然不會(huì)意識(shí)到AutoML中所存在的技術(shù)問(wèn)題,他們很可能會(huì)在應(yīng)用場(chǎng)景出現(xiàn)問(wèn)題時(shí)才發(fā)現(xiàn)模型精度產(chǎn)生了變化。DeepBlueAI團(tuán)隊(duì)的解決方案,極大增加了AutoML對(duì)于復(fù)雜場(chǎng)景的適應(yīng)性,讓AutoML可以進(jìn)入金融、營(yíng)銷、智能駕駛等等要求更豐富的場(chǎng)景之中,也因此進(jìn)一步降低了企業(yè)應(yīng)用AI的門(mén)檻。

可見(jiàn)DeepBlueAI并不是針對(duì)競(jìng)賽的一份試卷答案,而是真正把目標(biāo)投向了AI產(chǎn)業(yè)化的廣袤沃土。

當(dāng)AutoML從試驗(yàn)品走向商品

除了PAKDD的競(jìng)賽以外,很多科技企業(yè)也已經(jīng)推出了自己的AutoML平臺(tái)。例如谷歌推出的針對(duì)圖像識(shí)別的AutoML Vision,以及亞馬遜推出的Amazon SageMaker等等。從AI產(chǎn)業(yè)化的命題來(lái)說(shuō),擁有應(yīng)用環(huán)境自適應(yīng)能力的這套解決方案會(huì)對(duì)AutoML造成哪些改變?

首先,深蘭科技可以幫助AutoML真正的去解決更多產(chǎn)業(yè)問(wèn)題。

目前市面上的AutoML平臺(tái),大多只是試驗(yàn)性甚至偏娛樂(lè)化的,缺乏對(duì)于產(chǎn)業(yè)應(yīng)用場(chǎng)景的深入適配,通常只能讓開(kāi)發(fā)者利用模型開(kāi)發(fā)出一些諸如“寵物情緒識(shí)別”“桃子甜度識(shí)別”等等簡(jiǎn)單的模型。

DeepBlueAI團(tuán)隊(duì)意識(shí)到了模型精度的變化問(wèn)題,自然是站在了產(chǎn)業(yè)視角看待問(wèn)題,未來(lái)AutoML平臺(tái)也將從單純的開(kāi)發(fā)場(chǎng)景逐漸貼近產(chǎn)業(yè)場(chǎng)景,更關(guān)注模型精度、應(yīng)用環(huán)境等等現(xiàn)實(shí)問(wèn)題。

同時(shí),深蘭科技對(duì)AI基礎(chǔ)技術(shù)的全面投入可以幫助AutoML進(jìn)入更多產(chǎn)業(yè)領(lǐng)域。


除了深度學(xué)習(xí)框架開(kāi)發(fā)以外,深蘭科技對(duì)機(jī)器視覺(jué)、生物智能識(shí)別、智能駕駛等等領(lǐng)域都有所投入。針對(duì)各種AI技術(shù)在自動(dòng)化過(guò)程中,架構(gòu)組建上的細(xì)化差異都有更深入的理解,加之強(qiáng)大的算法應(yīng)用化能力,深蘭科技足以讓AutoML從一個(gè)面向開(kāi)發(fā)者的工具演變成真正商業(yè)化、甚至定制化的企業(yè)AI解決方案。

目前深蘭科技的AutoML技術(shù)已經(jīng)廣泛應(yīng)用在精準(zhǔn)營(yíng)銷、金融風(fēng)控、自動(dòng)駕駛、疾病預(yù)測(cè)等業(yè)務(wù)場(chǎng)景中,做出了接近甚至超過(guò)數(shù)據(jù)科學(xué)家的模型效果,決策精準(zhǔn)度超過(guò)人類專家數(shù)倍。

總的來(lái)說(shuō),建立在深蘭科技的綜合AI能力之上,AutoML正在從試驗(yàn)品走向產(chǎn)品,進(jìn)一步契合產(chǎn)業(yè)應(yīng)用的真實(shí)場(chǎng)景。

曙光之前:為什么中國(guó)AI需要腰部力量?

除了AutoML對(duì)于當(dāng)前AI產(chǎn)業(yè)化的意義之外,我們更想討論的,是深蘭科技這家企業(yè)在PAKDD取得成績(jī)更深層的意義。隨著中國(guó)AI在世界范圍的競(jìng)爭(zhēng)力不斷提升,中國(guó)團(tuán)隊(duì)在各種學(xué)術(shù)會(huì)議上取得好成績(jī)并不是什么新鮮的事情,為什么深蘭科技這家企業(yè)值得我們投入更多關(guān)注?

我們可以看到,深蘭科技身上有兩個(gè)明顯的標(biāo)簽,一個(gè)是 “中國(guó)自主研發(fā)”——深蘭科技與多家國(guó)內(nèi)外知名企業(yè)、高等院校以及盧森堡國(guó)家實(shí)驗(yàn)室合作,建立聯(lián)合實(shí)驗(yàn)室,一直在AI科研上有著諸多投入。另一個(gè)是“基礎(chǔ)研究+應(yīng)用開(kāi)發(fā)”——除了科研以外,深蘭科技已經(jīng)將技術(shù)輸入到智能駕駛、智能機(jī)器人、AI city等等九大應(yīng)用領(lǐng)域之中。

兩者結(jié)合起來(lái),就是典型的中國(guó)AI腰部力量。除了BAT這樣在頭部引領(lǐng)中國(guó)AI發(fā)展的巨頭,更多的是像深蘭科技這樣,將AI創(chuàng)新能力源源不斷地輸入到細(xì)節(jié)應(yīng)用場(chǎng)景之中。

腰部力量對(duì)于AutoML的掌握,對(duì)于今天我們的AI發(fā)展來(lái)說(shuō)至關(guān)重要。


近年來(lái)有一個(gè)流傳頗為廣泛的概念叫:AI民主化,指的是讓更多中小企業(yè)可以開(kāi)發(fā)出屬于自己的機(jī)器學(xué)習(xí)算法模型,而AutoML就是符合這一精神的產(chǎn)物之一。隨著AI民主化概念的普及和AutoML技術(shù)的日趨成熟,產(chǎn)業(yè)中大范圍應(yīng)用起AutoML工具已經(jīng)是一種必然。

但從谷歌AutoML的案例中也能發(fā)現(xiàn),伴隨算法模型訓(xùn)練工具捆綁銷售的,很可能還有計(jì)算芯片或云計(jì)算服務(wù)。一家企業(yè)選擇了一個(gè)AutoML平臺(tái),同時(shí)也意味著將自己的AI技術(shù)與平臺(tái)背后的企業(yè)相綁定。

這時(shí)中國(guó)AI腰部力量對(duì)于AutoML的參與就起了兩個(gè)至關(guān)重要的作用。

一方面,中國(guó)智造可以保證算法工具以及芯片硬件、云計(jì)算等等配套服務(wù)的自主可控。尤其很多企業(yè)的算法模型會(huì)涉及一些商業(yè)機(jī)密以及敏感數(shù)據(jù),如果將這些數(shù)據(jù)和模型部署到海外企業(yè)的云平臺(tái)中,多少會(huì)增加一些風(fēng)險(xiǎn)。

另一方面,腰部企業(yè)對(duì)AI產(chǎn)業(yè)化的參與,可以增強(qiáng)行業(yè)的多樣性,防止AI產(chǎn)業(yè)化被科技巨頭“壟斷”從而促使AI霸權(quán)主義的出現(xiàn)。產(chǎn)業(yè)在接入AI服務(wù)時(shí)可以擁有更多選擇,會(huì)促進(jìn)AI領(lǐng)域的發(fā)展活力,以良性競(jìng)爭(zhēng)的模式推動(dòng)巨頭與腰部企業(yè)一同為產(chǎn)業(yè)提供更優(yōu)質(zhì)的技術(shù)服務(wù)。

如今在AI賽道上狂奔的跑者們,無(wú)一不見(jiàn)到了AI產(chǎn)業(yè)化的黎明曙光。在抵達(dá)終點(diǎn)的過(guò)程中,腰部企業(yè)的存在如同一位聯(lián)結(jié)者,與頭部巨頭們并行向前的同時(shí),不斷招攬著路邊觀望的人,讓他們一同加入隊(duì)列,向AI的明天奔去。

AI產(chǎn)業(yè)化黎明的到來(lái),或許并不是一條分割兩個(gè)世界的終點(diǎn)線,而會(huì)降臨于讓更多人參與AI賽道的過(guò)程之中。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-04-20
從試驗(yàn)品到產(chǎn)品:AutoML是如何一步步貼近產(chǎn)業(yè)應(yīng)用的?
DeepBlueAI團(tuán)隊(duì)的解決方案,極大增加了AutoML對(duì)于復(fù)雜場(chǎng)景的適應(yīng)性,讓AutoML可以進(jìn)入金融、營(yíng)銷、智能駕駛等等要求更豐富的場(chǎng)景之中,也因此進(jìn)一步降低了企業(yè)應(yīng)用AI的門(mén)檻。

長(zhǎng)按掃碼 閱讀全文