經(jīng)過激烈的角逐,由深海技術(shù)科學太湖實驗室聯(lián)合無錫市委人才工作領(lǐng)導小組辦公室、無錫市科學技術(shù)局、華為技術(shù)有限公司共同主辦的首屆“船海數(shù)據(jù)智能應(yīng)用創(chuàng)新大賽”初賽晉級名單日前正式出爐?!八?水下典型目標識別”和“非結(jié)構(gòu)化數(shù)據(jù)壓縮與處理”兩個賽題方向分別選出了30組隊伍晉級決賽。
據(jù)大賽組委會介紹,自 4 月 12 日開賽以來,大賽受到了社會各界廣泛關(guān)注,兩個賽道參賽總?cè)藬?shù)超過了 1300 人。其中,“水面/水下典型目標識別”賽道競爭尤為激烈,351 支隊伍參賽,只有不到1成的隊伍成功晉級決賽。這和該賽道的出題內(nèi)容契合當下人工智能的熱門應(yīng)用緊密相關(guān)。
面向日益增長的智能化水上交通、海洋環(huán)境探測、水下探測等場景需求,提高水面/水下針對船只、漁網(wǎng)、浮標、漂浮物、礁石、水生物等典型目標的檢測識別能力成為船舶領(lǐng)域人工智能應(yīng)用亟需解決的難題。來自華中科技大學人工智能與自動化學院張鈞杰的團隊、南京理工大學博士沈飛團隊、浙江大學軟件學院人工智能專業(yè)許可團隊采用不同的技術(shù)手段,各顯其能,分別獲得該組初賽的前三名。初賽階段有努力、有收獲,面對決賽有期許、有奮進……三位選手敞開心扉,分享了他們的賽事所得。
張鈞杰:很享受邊打比賽邊學習的快樂!
張鈞杰是華中科技大學人工智能與自動化學院的研一學生。之前他曾參加過幾個和目標檢測相關(guān)的賽事,如城市紅綠燈視覺檢測與識別比賽、雨雪霧行駛場景下交通參與者視覺檢測與識別以及阿里天池的小樣本商標檢測挑戰(zhàn)賽。
張鈞杰對此次參賽感受比較深刻的有兩點:一是排行榜實時刷新,比賽更透明,也讓選手更有沖勁;二是“這次比賽因為有對速度的要求,所以對于顯卡的要求不是很高,用的baseline也是我比較熟悉的yolov5,這個比賽也非常具有實際意義,所以非常適合我們參加?!?/p>
對于初賽提交的方案,張鈞杰用中規(guī)中矩來形容。訓練階段用的都是一些常見的數(shù)據(jù)增強手段,然后對學習率、優(yōu)化器等參數(shù)進行精細調(diào)整。談到比賽過程中的難點,他表示:“賽題中對于FPS的要求是一個比較難的點,這要求我們在精度與速度之間進行平衡。如何保證速度達標的情況下仍然能夠展現(xiàn)出良好的性能是這個比賽的關(guān)鍵所在?!?/p>
在參加這次比賽的過程中張鈞杰看了很多相關(guān)的論文博客,從中學到了很多東西。比賽還創(chuàng)造了自己和其他參賽選手交流的機會。邊打比賽邊學習,自己能力得到了很大的提升,這種感覺很棒!他透露,進入復賽后,打算嘗試更多的數(shù)據(jù)增強手段,希望隊伍能取得好成績。
沈飛:“科研立項”是大賽最特殊的獎勵
南京理工大學智能媒體分析實驗室(IMAG)博士一年級學生沈飛的團隊是此次初賽的第二名。沈飛坦言,自己打比賽有兩三年了,像此次目標檢測類的比賽也打過很多次,所以對賽事很了解,并且也拿到過一些國際、國內(nèi)大賽的好名次。此次來打比賽,首要是因為賽事主辦方是太湖實驗室。比賽很透明,公平性好,而且影響力大。此外,這個比賽最特殊、也是吸引沈飛的地方就是“科研立項”——太湖實驗室給出了按照國家自然科學基金重大項目立項標準,為獲獎團隊在賽題方向提供不少于100萬元科研立項支持!
沈飛主攻人工智能目標檢測類方向。在比賽過程中,他們遇到了兩個比較大的挑戰(zhàn):首先是來自的數(shù)據(jù)挑戰(zhàn),如:背景復雜導致的目標物體虛化、光照和角度變化、樣本稀少不均衡、樣本標注誤差較大等問題。針對數(shù)據(jù)問題,團隊使用了豐富的數(shù)據(jù)增強技術(shù),包括傳統(tǒng)的圖像翻轉(zhuǎn)、對比度、飽和度調(diào)整擴充;使用了中值濾波進行噪聲抑制;使用了mixup混合圖像增加抗擬合性。此外在FPN階段還使用了之前科研的成果,即圖卷積來增強局部特征提取能力。
第二個挑戰(zhàn)是來自比賽限時30FPS,讓他們面臨速度和精度的平衡挑戰(zhàn)。對此,他表示,初賽的模型暫時能滿足要求,后續(xù)會考慮使用知識蒸餾,進行教師-學生網(wǎng)絡(luò)的學習;模型剪枝量化、TensorRT等技術(shù)進行模型加速。同時,他們在復賽時可能會考慮采用對抗生成網(wǎng)絡(luò)進行樣本擴充。通過截取訓練樣本中數(shù)目少的類別目標圖像,利用生成對抗網(wǎng)絡(luò)生成大量異構(gòu)的目標圖像并融合到背景圖像中作為訓練樣本,豐富目標信息。
許可:大賽給我指明了新的學習方向
浙江大學軟件學院人工智能專業(yè)研一學生許可和他的三名同學組成的團隊獲得了初賽的第三名。許可曾參加過諸如圖像分析類競賽,但是目標檢測類的還是首次。作為人工智能專業(yè)研究生,許可平時學的主要是傳統(tǒng)視覺優(yōu)化。此次參賽,團隊不僅沖著大賽誘人的獎金,也是想借著比賽實現(xiàn)從傳統(tǒng)方法到深度學習的跨越。
在初賽中,許可介紹說,團隊主要用的都是很成熟的技術(shù),其中有4點提分比較高點。首先是多尺度訓練和測試時增強(tta),這個比較常見,多尺度訓練能讓模型適應(yīng)不同尺寸的目標,而tta對于一張測試圖像,將不同尺度下所得到的bbox放在一起做nms,能夠有效提高mAP。然后是multi-lable,因為他們觀察到很多船只十分的模糊,人眼都無法分辯。還有就是merge-nms,對于置信度比較低的bbox,不直接刪除,而是通過iou對最終的bbox坐標進行加權(quán),這是針對數(shù)據(jù)集中bbox的標注不夠精確,并且計算量也不大。最后是Swa(模型參數(shù)平均), 能讓模型更具泛化性,有著ensemble的效果但不增加計算量。
許可坦言,初賽由于有比較多的代碼可以參考,所以任務(wù)實現(xiàn)起來問題并不是太大。進入復賽后,他們將從模型和數(shù)據(jù)增強兩方面做些提升。模型方面,可以通過加上attention模塊,或者把分類頭解耦,回歸和分類不再共享參數(shù);對于數(shù)據(jù)增強,初賽時并沒有找到比較好的數(shù)據(jù)增強方法。此外,復賽任務(wù)是視頻目標檢測,這一方面他們還需要多做些了解。
經(jīng)過短暫的休整,2022年7 月 16 日,船海數(shù)據(jù)智能應(yīng)用創(chuàng)新大賽決賽將正式啟動。在接下來的兩個月時間里,最終將從兩組各30個晉級隊中選出10個決賽入圍團隊。2022年9月底,決賽隊伍將經(jīng)過現(xiàn)場路演答辯,經(jīng)專家組評選出最終獲獎名單。屆時,還將邀請行業(yè)大咖面對面講座,與參賽選手進行學術(shù)交流?!俺踬悆H僅是決賽的一個門檻,名次和決賽結(jié)果并不能掛鉤!”面對決賽,不少選手已經(jīng)在準備放大招。在這場高手云集的頂級賽事里,頭腦風暴帶來的變數(shù)是常態(tài),讓我們期待選手們帶來更多驚喜的表現(xiàn)。
作為本次大賽的評委。華為機器視覺算法專家竇昊博士講到,航海創(chuàng)新大賽的賽題貼近真實船海場景的應(yīng)用需求,對關(guān)鍵船海目標進行識別和檢測,有助于無人船等船海技術(shù)的應(yīng)用和推廣。選手在初賽中各顯其能,產(chǎn)生出不少有亮點的解決方案,從理解數(shù)據(jù)、應(yīng)用數(shù)據(jù)、優(yōu)化模型、優(yōu)化效率等角度做出了很多創(chuàng)新。在即將開展的決賽中,選手將面對真實采集的視頻場景,挑戰(zhàn)雨霧、風浪、距離對成像的干擾,希望選手持續(xù)創(chuàng)新,克服真實場景難題,達成優(yōu)異的成績。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )