云知聲- CMU 合作論文入選全球 AI 頂會(huì) NeurIPS 2020

近日,神經(jīng)信息處理系統(tǒng)大會(huì) NeurIPS 2020(Conference and Workshop on Neural Information Processing Systems)于線上舉行。在官方公布的論文入選名單中,云知聲與 CMU (卡內(nèi)基梅隆大學(xué))張坤教授團(tuán)隊(duì)等合作的針對(duì)機(jī)器學(xué)習(xí)典型的無監(jiān)督領(lǐng)域自適應(yīng)問題論文《Domain Adaptation As a Problem of Inference on Graphical Models》,憑借基于數(shù)據(jù)驅(qū)動(dòng)的圖模型框架解決方案的創(chuàng)新研究成功入選,彰顯了云知聲在人工智能與機(jī)器學(xué)習(xí)原創(chuàng)技術(shù)領(lǐng)域的持續(xù)創(chuàng)新能力。

云知聲- CMU 合作論文入選全球 AI 頂會(huì) NeurIPS 2020

近幾年,得益于越來越多真實(shí)場(chǎng)景數(shù)據(jù)和充足的算力,現(xiàn)有技術(shù)在領(lǐng)域匹配或者數(shù)據(jù)覆蓋到的場(chǎng)景效果表現(xiàn)不錯(cuò),但是在跨領(lǐng)域場(chǎng)景,尤其是目標(biāo)領(lǐng)域沒有標(biāo)注(無監(jiān)督)的情況下性能還有進(jìn)一步提升空間,如何利用無監(jiān)督領(lǐng)域自適應(yīng)技術(shù)解決跨領(lǐng)域場(chǎng)景問題是目前人工智能技術(shù)發(fā)展的熱點(diǎn)研究領(lǐng)域,也是未來人工智能技術(shù)實(shí)現(xiàn)跨代發(fā)展和更加智能化繞不過去的技術(shù)門檻。

在本論文中,針對(duì)目前機(jī)器學(xué)習(xí)典型的無監(jiān)督領(lǐng)域自適應(yīng)問題,提出了一種基于數(shù)據(jù)驅(qū)動(dòng)的圖模型框架下的解決方案。典型的無監(jiān)督領(lǐng)域自適應(yīng)問題是指利用源領(lǐng)域的數(shù)據(jù),如何在新的目標(biāo)領(lǐng)域準(zhǔn)確做出預(yù)測(cè)。一般來說,源和目標(biāo)領(lǐng)域之間的數(shù)據(jù)分布是不同的。我們假設(shè)不同領(lǐng)域的數(shù)據(jù)是獨(dú)立同分布的,為了利用已知源數(shù)據(jù)對(duì)目標(biāo)領(lǐng)域的數(shù)據(jù)分布進(jìn)行建模,引入隱變量 θ 表示領(lǐng)域相關(guān)的變化因子,同時(shí)利用增強(qiáng)有向無環(huán)圖(DAG)來描述領(lǐng)域之間聯(lián)合分布,通過將在目標(biāo)領(lǐng)域的預(yù)測(cè)問題轉(zhuǎn)化為增強(qiáng)圖模型框架下的貝葉斯推斷問題,實(shí)現(xiàn)基于數(shù)據(jù)自動(dòng)驅(qū)動(dòng)的無監(jiān)督領(lǐng)域自適應(yīng)。在模擬數(shù)據(jù)和三個(gè)真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果均表明利用圖模型解決無監(jiān)督領(lǐng)域自適應(yīng)問題的有效性。

云知聲- CMU 合作論文入選全球 AI 頂會(huì) NeurIPS 2020

本文提出的全自動(dòng)的端到端的無監(jiān)督領(lǐng)域自適應(yīng)技術(shù)方案除了為學(xué)術(shù)界提供新的研究思路外,對(duì)于工業(yè)界更具有重要的現(xiàn)實(shí)意義。在實(shí)際的應(yīng)用場(chǎng)景中,這些大量異構(gòu)未標(biāo)注的數(shù)據(jù)如果能夠通過此項(xiàng)技術(shù)得到有效利用,將會(huì)極大的提高目前人工智能技術(shù)的魯棒性和跨場(chǎng)景下的性能。

美國(guó)計(jì)算機(jī)科學(xué)家和哲學(xué)家 Judea Pearl(圖靈獎(jiǎng)獲得者、貝葉斯網(wǎng)絡(luò)之父)在社交網(wǎng)站上推薦本論文的研究成果,表示本文的基于因果思維的方案提供了有別于傳統(tǒng)機(jī)器學(xué)習(xí)方式的、新的、有保障的遷移學(xué)習(xí)方式。

云知聲- CMU 合作論文入選全球 AI 頂會(huì) NeurIPS 2020

NeurIPS 是人工智能、機(jī)器學(xué)習(xí)和計(jì)算神經(jīng)科學(xué)領(lǐng)域頂級(jí)學(xué)術(shù)會(huì)議之一,也是 CCF 推薦的A 類國(guó)際學(xué)術(shù)會(huì)議。本屆 NeurIPS 會(huì)議共收到投稿 9454 篇,創(chuàng)下投稿數(shù)量歷史新高。其中錄用論文 1900 篇,接收率約 20.1%,為歷年難度最高的一屆。作為學(xué)術(shù)界、工業(yè)界公認(rèn)的人工智能領(lǐng)域國(guó)際頂級(jí)會(huì)議的翹楚,NeurIPS 代表著當(dāng)今人工智能研究的最高水平和技術(shù)發(fā)展趨勢(shì),在谷歌發(fā)布的 2020 年最新版學(xué)術(shù)指標(biāo)(Google Scholar Metrics, GSM)榜單中, NeurIPS 在人工智能領(lǐng)域?qū)W術(shù)影響力排名全球第一。

此次入選 NeurIPS 論文集,是云知聲全棧和硬核技術(shù)的一次新突破,也是繼吳文俊人工智能科技進(jìn)步獎(jiǎng)、北京市科學(xué)技術(shù)進(jìn)步一等獎(jiǎng),CHIP2019 臨床術(shù)語(yǔ)標(biāo)準(zhǔn)化任務(wù)評(píng)測(cè)冠軍、CCKS 2020 醫(yī)療命名實(shí)體識(shí)別評(píng)測(cè)冠軍、BC 2020語(yǔ)音合成技術(shù)評(píng)測(cè)冠軍,以及多篇論文入選 NLP 國(guó)際頂會(huì) ACL、語(yǔ)音 AI 頂會(huì) InterSpeech 等諸多技術(shù)成果之后,在前沿技術(shù)上的又一次新突破。

人工智能底層技術(shù)方面的深厚積累,也將不斷促進(jìn)云知聲人工智能系統(tǒng)的“智力”提升,推動(dòng)其更好地應(yīng)用于智慧生活、智慧城市以及出行、教育、醫(yī)療等千行百業(yè),為用戶創(chuàng)造更好的智能體驗(yàn)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )