阿里AI模型刷新世界紀錄 閱讀理解能力測試全球領(lǐng)先

近日,在斯坦福等院校和機構(gòu)發(fā)起的“多輪對話型閱讀理解評測”(QuAC)上,阿里巴巴人工智能模型“TransBERT”擊敗全球?qū)κ郑粌H拿下了評測的桂冠,更刷新了該項測試的世界紀錄。這也意味著,以阿里巴巴AI為代表的機器閱讀理解能力,又往前邁進了一步。

QuAC(多輪對話型閱讀理解評測)由華盛頓大學、斯坦福大學和艾倫人工智能研究院等研究機構(gòu)聯(lián)合發(fā)起,與SQuAD(文本理解挑戰(zhàn)賽)、CoQA(對話型機器閱讀理解挑戰(zhàn)賽)并稱世界級閱讀理解評測競賽,吸引了全世界頂級科學家和技術(shù)團隊參與。本次競賽的難點在于,要求參賽的AI模型閱讀篇幅更長的多輪對話,題目中還有“指代”和“省略”,甚至還存在原文中沒有對應(yīng)答案的模糊問題,這就要求AI模型要有如同人類般“聯(lián)系上下文”的能力,高度考驗聯(lián)想和推測能力。

阿里巴巴智能服務(wù)事業(yè)部算法專家計峰介紹說,此次測試中出現(xiàn)了多次以“他”、“他們”進行的第三人稱指代,需要機器進行上下文的主動聯(lián)想,并作出綜合判斷;還有無法在原文中找到對應(yīng)答案的開放式問題,測試的是AI模型在基于文本的閱讀理解之外,調(diào)用日常儲備數(shù)據(jù)庫進行推想的能力,幾乎無限接近人類思考模式。

主辦方也認為,多輪對話型閱讀理解是目前人工智能對話領(lǐng)域復(fù)雜性最高、最考驗自然語言理解技術(shù)的,已經(jīng)接近人類日常交流的真實場景。

image001.png

圖:評測案例接近人類日常交流的真實場景,高度考驗AI模型的聯(lián)想和推測能力

憑借自主研發(fā)的“TransBERT”AI模型,阿里巴巴智能服務(wù)事業(yè)部、計算平臺事業(yè)部聯(lián)合浙江大學人工智能研究所,打敗國內(nèi)外競爭者,以三個指標總分144.1拔得頭籌,刷新了此測試的最高紀錄,其中兩項指標大幅超過第二名。

image003.jpg

圖:“TransBERT”AI模型以三個指標總分144.1拔得頭籌,兩項指標大幅超過第二名

AI技術(shù)面對多輪次對話,以及“指代”、“省略”、“模糊語義問題”等場景早已并非僅在測試環(huán)境中發(fā)生,在阿里巴巴平臺的客服機器人“阿里小蜜”的日常應(yīng)用中,此類較為復(fù)雜的閱讀理解場景早已成為AI機器人發(fā)揮實質(zhì)性作用的“賽場”。

在阿里巴巴早前公布的一段視頻中,阿里小蜜已經(jīng)能夠以文字和語音等形式,與消費者進行多輪次的復(fù)雜對話,問題覆蓋售前售后服務(wù)中,常見的打斷、指代、省略、轉(zhuǎn)換話題等現(xiàn)實情況。

這也是阿里巴巴AI技術(shù)顯著區(qū)別于學界競爭者的最大不同之處,阿里AI模型在阿里小蜜系列產(chǎn)品的長期實際應(yīng)用中得到完善和突破,其技術(shù)能力立足現(xiàn)實場景,注重與人類對話的真實互動體驗,因此能夠在QuAC這類測試中達到接近人類對話的水平。

image005.jpg

圖:阿里AI模型技術(shù)能力立足人工智能客服小蜜產(chǎn)品的現(xiàn)實服務(wù)場景

這并非阿里巴巴AI技術(shù)首次在機器閱讀領(lǐng)域打破世界紀錄。在斯坦福大學于2018年初發(fā)起的機器閱讀領(lǐng)域頂級賽事SQuAD(文本理解挑戰(zhàn)賽)上,阿里巴巴智能服務(wù)事業(yè)部就曾聯(lián)合阿里達摩院奪冠,實現(xiàn)了人工智能在閱讀能力上首次對人類的超越。2019年初,阿里小蜜憑借在物流、智能助理等功能方面的出色表現(xiàn),入選《麻省理工科技評論》“全球十大突破性技術(shù)”榜單,被認為是有望引領(lǐng)AI助手實現(xiàn)巨大進化的代表。

在人工智能的驅(qū)動下,客服行業(yè)也正在經(jīng)歷快速升級迭代。2018年,阿里小蜜全年對話輪次高達14億次,服務(wù)消費者約4.9億人次。而基于實際場景不斷完善的算法技術(shù),也讓以阿里小蜜為代表的智能客服正以前所未有的速度和智能能力解決消費者和商家的痛點,提升商業(yè)效率。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-07-02
阿里AI模型刷新世界紀錄 閱讀理解能力測試全球領(lǐng)先
近日,在斯坦福等院校和機構(gòu)發(fā)起的“多輪對話型閱讀理解評測”(QuAC)上,阿里巴巴人工智能模型“TransBERT”擊敗全球?qū)κ?,不僅拿下了評測的桂冠,更刷新了該項測試的世界紀錄。

長按掃碼 閱讀全文