10月12日,由追一科技主辦、南京大學(xué)計算機軟件新技術(shù)國家重點實驗室協(xié)辦的“首屆中文NL2SQL挑戰(zhàn)賽”總決賽答辯暨頒獎典禮在南京大學(xué)舉行。經(jīng)過最終決賽的5強選手隊伍現(xiàn)場分享答辯和現(xiàn)場評委考評,國防科技大學(xué)選手團隊奪得冠軍,國雙科技團隊獲得亞軍,觀安信息與妙盈科技聯(lián)合團隊獲得季軍,華南理工大學(xué)與佛羅里達大學(xué)的選手隊伍,以及浙江大學(xué)的團隊則獲得優(yōu)勝獎。
由眾多人工智能權(quán)威專家組成的評委團,包括中國移動研究院首席科學(xué)家馮俊蘭、復(fù)旦大學(xué)教授肖仰華、新加坡南洋理工大學(xué)副教授毛可智、南京大學(xué)教授俞揚、追一科技CTO劉云峰等產(chǎn)學(xué)研多方代表,在決賽現(xiàn)場對選手們的技術(shù)方案,進行了專業(yè)的分析點評,從而產(chǎn)生最終結(jié)果。
隨著NLP基礎(chǔ)能力發(fā)展,自然語言轉(zhuǎn)換可執(zhí)行的SQL語句,訪問數(shù)據(jù)庫等一系列復(fù)雜的人機交互正逐漸成為可能。此次大賽短短幾個月里,頂級選手模型方案準確率達到92%以上,刷新業(yè)界記錄。
追一科技CTO劉云峰
“此次挑戰(zhàn)賽參與規(guī)模、選手表現(xiàn)遠超預(yù)期,顯示出NL2SQL在學(xué)術(shù)和產(chǎn)業(yè)應(yīng)用上的潛力,數(shù)據(jù)庫的交互創(chuàng)新,正在受到越來越多關(guān)注。”追一科技聯(lián)合創(chuàng)始人兼CTO劉云峰表示,追一科技將與更多院校、企業(yè)界同仁攜手,共同推動中文NLP研究與應(yīng)用突破。
新一代數(shù)據(jù)庫交互
NL2SQL(自然語言轉(zhuǎn)結(jié)構(gòu)化查詢語句)作為新興的研究領(lǐng)域,在國外由SalesForce耶魯大學(xué)等發(fā)布了WikiSQL和Spider數(shù)據(jù)集,但在國內(nèi)市場,目前還處于起步階段。此次NL2SQL挑戰(zhàn)賽是國內(nèi)首次舉辦。
“大數(shù)據(jù)價值變現(xiàn)最大難題就是訪問門檻太高”,嘉賓評委代表、復(fù)旦大學(xué)教授肖仰華表示,利用自然語言訪問關(guān)系型數(shù)據(jù)庫里的數(shù)據(jù),一直是數(shù)據(jù)庫業(yè)內(nèi)夢想。太多的數(shù)據(jù)“沉睡”在關(guān)系表格里,使得這一愿望更變得日益迫切。
NL2SQL挑戰(zhàn)賽點評評委、復(fù)旦大學(xué)教授肖仰華
作為此次比賽的主辦方,追一科技聯(lián)合創(chuàng)始人兼CTO劉云峰也表示,追一在服務(wù)企業(yè)的過程中的發(fā)現(xiàn),很多企業(yè)的知識和數(shù)據(jù)都是以關(guān)系型數(shù)據(jù)庫的形式存儲,例如銀行用戶的消費記錄、基金公司的基金屬性、保險公司的保單記錄等等,如果想更好地利用,“亟需將自然語言轉(zhuǎn)換成可執(zhí)行的機器語言技術(shù)”。
劉云峰認為,NL2SQL正是非常好的技術(shù)實現(xiàn)路徑,“這也是追一科技發(fā)起比賽的原因。”
期間,追一科技發(fā)布了業(yè)內(nèi)首個大規(guī)模的中文數(shù)據(jù)集,包括4870張表格數(shù)據(jù)、近50000條標注數(shù)據(jù)以及相應(yīng)的SQL語句,并獲得很多學(xué)界專家、產(chǎn)業(yè)界伙伴的支持,通過“產(chǎn)學(xué)研”等多方聯(lián)動,希望提供一個平臺,來推動NL2SQL研究和應(yīng)用。
產(chǎn)學(xué)研參與
據(jù)了解,本次比賽吸引了海內(nèi)外1457支隊伍參與,包括院校、機構(gòu)和企業(yè)開發(fā)者。
其中,學(xué)生及科研人員占比48%,企業(yè)技術(shù)員工占比52%。學(xué)生參賽隊伍來自眾多知名院校,如北京大學(xué)、清華大學(xué)、復(fù)旦大學(xué)、上海交通大學(xué)、南京大學(xué)、浙江大學(xué)、中國科學(xué)技術(shù)大學(xué)、哈爾濱工業(yè)大學(xué)、西安交通大學(xué)等。以及來自海外CMU、墨爾本大學(xué)、新加坡國立大學(xué)等頂級院校參與。
企業(yè)界的開發(fā)愛好者,則成為比賽的另一只重要力量。來自中國移動、平安集團、搜狗、達闥科技、中興通訊、網(wǎng)宿科技、國雙科技、捷通華聲等眾多企業(yè)的技術(shù)人員,也成為參賽隊伍的重要力量。
院校與院校、企業(yè)與企業(yè)等聯(lián)合“組隊”挑戰(zhàn),成為比賽的一大亮點。比如5強中的華南理工與佛羅里達,上海觀安信息與妙盈科技等,均為聯(lián)合戰(zhàn)隊。
“眾人拾柴火焰高”,劉云峰表示,這次比賽也是搭建一個橋梁,讓學(xué)界、技術(shù)創(chuàng)業(yè)者、市場多方更好地聯(lián)動,“讓企業(yè)釘子找到‘錘子’,讓學(xué)術(shù)和技術(shù)創(chuàng)業(yè)者的錘子找到‘釘子’。”
作為高校嘉賓代表,南京大學(xué)人工智能創(chuàng)新研究院院長詹德川表示,除了選手的熱情和參與,更看重比賽的交流機會,“學(xué)界和產(chǎn)業(yè)界可以進行深入的交流。”他同時表示,產(chǎn)學(xué)研攜手,“AI的熱情不會進入冬天” 。此次活動中,南京大學(xué)計算機軟件新技術(shù)國家重點實驗室與追一科技合作,協(xié)辦比賽,助力產(chǎn)學(xué)研合作。
南京大學(xué)人工智能創(chuàng)新研究院院長詹德川
經(jīng)過多方努力,短短幾個月里,NL2SQL中文領(lǐng)域研究快速突破。
比賽初期,準確率尚為60%多,至8月份初賽結(jié)束時,榜上頭部分數(shù)已經(jīng)達到89%,接近WikiSQL成績。復(fù)賽結(jié)束時,選手最高成績達到92%,刷新業(yè)界記錄。并且,最終晉級決賽的5支隊伍,個個都在“90分”以上。
“最終選手的成績,完全超出了我們對于比賽的預(yù)期。”作為評委代表,肖仰華表示,實際上中文自然語言轉(zhuǎn)SQL的挑戰(zhàn)更大,選手們的成績,不但讓人驚喜,而且表現(xiàn)了深厚理論功底,對深度學(xué)習(xí)、自然語言處理思路和模型的嫻熟。
中國移動研究院首席科學(xué)家馮俊蘭
作為來自產(chǎn)業(yè)界的專家評委,馮俊蘭表示,NL2SQL是自然語言處理的一個非常重要的應(yīng)用領(lǐng)域,涉及到多個自然語言處理領(lǐng)域的核心問題,非常開心看到這么多高水平的隊伍參賽,并取得了非常好的成績,也看了產(chǎn)、學(xué)、研在這個方向上共同提升技術(shù)的熱情。
應(yīng)用前景
如火如荼比賽背后,NL2SQL應(yīng)用潛力,也受到了越來越多的矚目。
業(yè)內(nèi)人士表示, NL2SQL在銀行、保險、證券、電商、汽車、地產(chǎn)等數(shù)據(jù)富礦領(lǐng)域,有很大的應(yīng)用潛力,可以大大地降低數(shù)據(jù)庫訪問和使用門檻,提升人機交互體驗,并更好地挖掘數(shù)據(jù)價值。
“今天在AI與數(shù)據(jù)庫交互上,我們又一次看到了突破,新的想象空間。”對于此次比賽的舉行,創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)也表示,期待看到追一和更多NLP開發(fā)愛好者,不斷探索努力,推進NLP創(chuàng)新和普惠應(yīng)用。
“此次挑戰(zhàn)賽參與規(guī)模遠超預(yù)期,顯示出NL2SQL在學(xué)術(shù)和產(chǎn)業(yè)應(yīng)用上的潛力,數(shù)據(jù)庫的交互創(chuàng)新,正在受到越來越多關(guān)注。”追一科技聯(lián)合創(chuàng)始人兼CTO劉云峰博士表示,追一科技將與更多院校、企業(yè)界同仁攜手,共同推動中文NLP研究與應(yīng)用突破。
- 央視315聚焦啄木鳥維修亂象:亂收費遭投訴,黑貓投訴量破紀錄,消費者權(quán)益受威脅
- 嚴守品質(zhì)底線:大岸浪花品牌全面下架蝦仁,消費者權(quán)益保障新篇章
- 中國移動回應(yīng)315晚會投訴:正自查通信電話營銷亂象,承諾2025年還用戶清朗通訊環(huán)境
- 2025款G6與G9破繭而出,小鵬汽車科技平權(quán)新篇章,顛覆想象
- 優(yōu)音通信被315點名:積極配合調(diào)查,揭露問題真相,維護消費者權(quán)益
- 挪威科學(xué)家研發(fā)自修復(fù)電動汽車電池:續(xù)航、充電、壽命三提升,未來可期
- 啄木鳥承諾整改并推出六大措施:誠信經(jīng)營、價格透明化等
- "3·15"曝光問題迅速響應(yīng),市監(jiān)總局、工信部聯(lián)手查處,守護消費者權(quán)益!
- 海淀首推智能餐飲機器人標準:引領(lǐng)餐飲業(yè)革新,邁向智能化新時代
- 兌吧回應(yīng)央視3·15點名:痛定思痛,全面整改業(yè)務(wù)風(fēng)險,重塑信任
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。