近日,理光中國研究院(以下簡稱SRCB)在自然語言處理頂級會議Association of Computational Linguistics 2024(以下簡稱ACL)的官方比賽Social Media Mining for Health Research and Applications Workshop and Shared Tasks 2024(以下簡稱SMM4H)中獲得共享競賽任務(wù)提取和規(guī)范化英文推文中的藥物不良事件(ADEs)賽道的第一名,并受邀分享了技術(shù)方案。
全球聚焦,學(xué)界盛會
ACL是一個國際性學(xué)術(shù)組織,致力于推動計算語言學(xué)領(lǐng)域的研究、開發(fā)和應(yīng)用。每年一度的ACL大會,以其前沿的研究議題、權(quán)威的學(xué)術(shù)報告和廣泛的行業(yè)參與,吸引著全球?qū)W者和專業(yè)人士的目光,被譽為自然語言處理領(lǐng)域的風(fēng)向標。
SMM4H是一個專注于社交媒體數(shù)據(jù)挖掘在健康研究和應(yīng)用中的年會和競賽活動。今年第九屆SMM4H的主題為 "Large Language Models (LLMs) and Generalizability for Social Media NLP",聚焦于探索大語言模型(LLMs)在社交媒體自然語言處理(NLP)任務(wù)中的應(yīng)用及其泛化能力。在這個跨學(xué)科的平臺上,與會者共同探討如何有效運用最前沿的技術(shù)通過社交媒體數(shù)據(jù)洞察和解決現(xiàn)實世界中的健康問題。SMM4H不僅為參與者提供了一個展示研究成果、交流創(chuàng)新思想的舞臺,更為推動健康科學(xué)研究與實踐的進步貢獻了重要力量。
攻堅克難,再創(chuàng)佳績
SRCB在SMM4H 2024共享競賽任務(wù)中挑戰(zhàn)的課題是“提取和規(guī)范化英文推文中的藥物不良事件(ADEs)”,任務(wù)內(nèi)容是從嘈雜的社交媒體推文中精確提取出由藥物引發(fā)的不良反應(yīng),并將其映射為MedDRA詞典中的標準化醫(yī)學(xué)術(shù)語。MedDRA詞典(全稱Medical Dictionary for Regulatory Activities)是一個國際權(quán)威的標準化醫(yī)學(xué)術(shù)語集,用于幫助不同國家和地區(qū)的藥品監(jiān)管機構(gòu)、制藥公司、臨床研究人員以及醫(yī)療保健專業(yè)人員之間進行有效的溝通和數(shù)據(jù)交換。
*競賽任務(wù)描述
面對非結(jié)構(gòu)化數(shù)據(jù)的復(fù)雜性、噪音和背景信息的干擾、多義性問題以及數(shù)據(jù)稀疏性等多重任務(wù)挑戰(zhàn),理光團隊通過以下技術(shù)有效地提高了不良事件信息提取和術(shù)語規(guī)范化的性能:
1.提出了一個包含ADEs抽取、MedDRA術(shù)語檢索和MedDRA術(shù)語過濾模塊的體系架構(gòu),有效地緩解了傳統(tǒng)方法使用的流程所帶來的誤差傳播,提升了術(shù)語規(guī)范化的準確性。
2.創(chuàng)新性地提出了四種基于大語言模型的數(shù)據(jù)增強方法,充分發(fā)揮了大語言模型生成高質(zhì)量文本內(nèi)容的能力。
3.通過使用醫(yī)學(xué)領(lǐng)域訓(xùn)練樣本對文本嵌入模型進行微調(diào),顯著提高了MedDRA術(shù)語的召回率。
理光團隊提出的體系架構(gòu),通過分析社交媒體上的用戶反饋,能夠補充臨床試驗中未報告的藥物副作用信息,為藥物安全性評估提供了新的視角。實時監(jiān)測公共健康趨勢以及分析社交媒體數(shù)據(jù),能夠快速反映社會中某些藥物的使用情況和相關(guān)風(fēng)險,為公共衛(wèi)生決策提供了有力的數(shù)據(jù)支持。對于制藥公司和監(jiān)管機構(gòu)來說,這一系統(tǒng)提供了實時挖掘社交媒體上的ADEs信息的能力,有助于及早發(fā)現(xiàn)并應(yīng)對潛在的公共健康問題。
*理光中國研究院NLP團隊成員在ACL2024現(xiàn)場分享技術(shù)方案
我們秉持前瞻視野,持續(xù)保持對創(chuàng)新領(lǐng)域的敏銳嗅覺,探索前沿AI科技,在自然語言處理領(lǐng)域不斷進取, 與上下游合作伙伴合作共創(chuàng),推動AI技術(shù)在社會各個領(lǐng)域的創(chuàng)新與落地。
我們將持續(xù)引領(lǐng)技術(shù)進步與應(yīng)用拓展,攜手全球合作伙伴積極探索、不懈挑戰(zhàn),賦能更多行業(yè)邁向高效與可持續(xù)發(fā)展的未來。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )