2024 年10月,在信息檢索和數(shù)據(jù)挖掘的國(guó)際學(xué)術(shù)會(huì)議CIKM (International Conference on Information and Knowledge Management) 上,京東探索研究院院長(zhǎng)、京東科技人工智能業(yè)務(wù)負(fù)責(zé)人何曉冬博士發(fā)表的研究成果DSSM模型(基于點(diǎn)擊數(shù)據(jù)學(xué)習(xí)用于網(wǎng)絡(luò)搜索的深度結(jié)構(gòu)化語(yǔ)義模型:Learning deep structured semantic models for web search using clickthrough data)因?qū)?nèi)容推薦架構(gòu)產(chǎn)生重大影響并為產(chǎn)業(yè)帶來(lái)巨大的經(jīng)濟(jì)效益,榮獲 CIKM 2024年唯一的“最佳時(shí)間檢驗(yàn)獎(jiǎng)(Test of Time Award)”。
CIKM 由ACM SIGIR分會(huì)主辦,是信息檢索和數(shù)據(jù)挖掘領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議之一,因CIKM論文的研究成果經(jīng)常得到產(chǎn)業(yè)界的采納,所以CIKM也是少數(shù)受到學(xué)術(shù)界和產(chǎn)業(yè)界共同關(guān)注的活動(dòng),只有少數(shù)高質(zhì)量的論文能夠脫穎而出被錄用,2024年CIKM的錄用率僅為23%。每年的“最佳時(shí)間檢驗(yàn)獎(jiǎng)”更是彰顯了論文在學(xué)術(shù)和產(chǎn)業(yè)上的雙重價(jià)值——以在過(guò)去10年產(chǎn)生重大和持續(xù)影響為評(píng)選標(biāo)準(zhǔn)。
本次獲評(píng)的DSSM雙塔模型是各類(lèi)雙塔模型的開(kāi)山之作,奠定了召回和粗排階段的基礎(chǔ)架構(gòu),為后續(xù)眾多改進(jìn)型雙塔模型奠定了基礎(chǔ)。
DSSM雙塔模型最大的特點(diǎn)是,user 和 item 是獨(dú)立的兩個(gè)子網(wǎng)絡(luò),即分別使用相對(duì)獨(dú)立的兩個(gè)復(fù)雜網(wǎng)絡(luò)構(gòu)建用戶相關(guān)特征的 user embedding 和 item 相關(guān)特征的item embedding,因而被稱為雙塔模型。
DSSM模型不僅為內(nèi)容推薦系統(tǒng)的基礎(chǔ)模型和架構(gòu)奠定了堅(jiān)實(shí)的基礎(chǔ)——是深度語(yǔ)義學(xué)習(xí)方向最基礎(chǔ)的模型結(jié)構(gòu),解決了語(yǔ)義相似度計(jì)算的問(wèn)題。2016年,圖靈獎(jiǎng)得主Yoshua Bengio和Ian Goodfellow(GAN的發(fā)明者)、Aaron Courville三人共同編撰的深度學(xué)習(xí)領(lǐng)域奠基性教材《Deep Learning》(引用量3萬(wàn)余次)一書(shū)中就將本次獲評(píng)的DSSM模型視為基于內(nèi)容的推薦系統(tǒng)的基礎(chǔ)架構(gòu)。同時(shí),因?yàn)榧骖櫺阅芘c效率,DSSM 模型對(duì)產(chǎn)業(yè)界十分友好,在發(fā)布后的10年中得到了大量的應(yīng)用。
DSSM 深度語(yǔ)義匹配模型最早是應(yīng)用于 NLP 領(lǐng)域中計(jì)算語(yǔ)義相似度任務(wù)。語(yǔ)義匹配本身是一種排序問(wèn)題,和推薦場(chǎng)景不謀而合,所以 DSSM 模型被自然的引入到推薦領(lǐng)域中,如搜索引擎檢索、廣告相關(guān)性、問(wèn)答系統(tǒng)、機(jī)器翻譯等。過(guò)去10余年,深度學(xué)習(xí)技術(shù)的應(yīng)用極大地提升了互聯(lián)網(wǎng)搜索引擎的語(yǔ)義理解能力、信息檢索效率和用戶搜索體驗(yàn),使得搜索結(jié)果更加精準(zhǔn)、豐富和個(gè)性化。頭部搜索引擎,電商平臺(tái)的搜索、推薦和廣告業(yè)務(wù)中都大量采用了該技術(shù),產(chǎn)生了巨大的經(jīng)濟(jì)價(jià)值。
何曉冬博士曾表示,“在多年的技術(shù)落地實(shí)踐中,我們意識(shí)到,用AI來(lái)提升、賦能傳統(tǒng)實(shí)體行業(yè)才能最大化影響力和應(yīng)用價(jià)值,傳統(tǒng)實(shí)體行業(yè)的體量足夠大,提升1%就能創(chuàng)造巨大的應(yīng)用價(jià)值?!焙螘远┦吭诰〇|科技負(fù)責(zé)人工智能在產(chǎn)業(yè)上的落地應(yīng)用,近年來(lái)陸續(xù)與團(tuán)隊(duì)研發(fā)出了智能客服、數(shù)字人直播、智能外呼等多項(xiàng)專(zhuān)業(yè)可信賴的AI產(chǎn)品,在零售、物流、金融、政務(wù)文旅等領(lǐng)域獲得了廣泛應(yīng)用。據(jù)公開(kāi)消息,京東云言犀數(shù)字人已服務(wù)超5000家品牌,帶動(dòng)銷(xiāo)售額超百億;智能客服覆蓋了消費(fèi)者進(jìn)店后30多個(gè)關(guān)鍵環(huán)節(jié),可自動(dòng)化應(yīng)答售前、售中、售后全場(chǎng)景90%的服務(wù)咨詢,服務(wù)品牌商家數(shù)量超40萬(wàn);智能外呼與政務(wù)熱線緊密結(jié)合,助力大同、東莞、保定、蕪湖多地12345熱線實(shí)現(xiàn)數(shù)智升級(jí)……
技術(shù)創(chuàng)新是企業(yè)發(fā)展的重要驅(qū)動(dòng)力。不少技術(shù)人認(rèn)為,能否讓技術(shù)擁有廣袤的實(shí)踐場(chǎng)景,產(chǎn)生應(yīng)用價(jià)值,是考評(píng)是否加入該企業(yè)的終極門(mén)檻。以京東為例,京東創(chuàng)立20多年來(lái),持續(xù)投入供應(yīng)鏈基礎(chǔ)設(shè)施和技術(shù)創(chuàng)新應(yīng)用,為用戶帶去“多快好省”的極致體驗(yàn),也推動(dòng)品牌和商家實(shí)現(xiàn)降本增效,不僅擁有海量應(yīng)用場(chǎng)景,更積累了大量專(zhuān)業(yè)數(shù)據(jù)??梢哉f(shuō),技術(shù)與創(chuàng)新的基因早已植入京東的發(fā)展脈絡(luò)。這也是京東可以讓大量技術(shù)人在真實(shí)場(chǎng)景中充分發(fā)揮創(chuàng)造力,持續(xù)推出多項(xiàng)專(zhuān)業(yè)可信賴的AI等技術(shù)創(chuàng)新的重要原因。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美國(guó)無(wú)人機(jī)禁令升級(jí)?當(dāng)?shù)乜茖W(xué)家率先“喊疼”:我們離不開(kāi)大疆
- iQOO Neo10 Pro:性能特長(zhǎng)之外,亦有全能實(shí)力
- 自動(dòng)駕駛第一股的轉(zhuǎn)型迷途:圖森未來(lái)賭上了AIGC
- 明星熱劇、品牌種草、平臺(tái)資源,京東讓芬騰雙11的熱度“沸騰”了
- 一加 Ace 5 Pro明牌:游戲手機(jī)看它就夠了!
- 游戲體驗(yàn)天花板,一加 Ace 5 系列售價(jià) 2299 元起
- 16個(gè)月沒(méi)工資不敢離職,這些打工人“自費(fèi)上班”
- 怎樣利用微信小店“送禮”功能賺錢(qián)?
- 鴻蒙智行問(wèn)界M9,中國(guó)豪華車(chē)的龍門(mén)一躍
- 科技云報(bào)道:人工智能時(shí)代“三大件”:生成式AI、數(shù)據(jù)、云服務(wù)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。