近年來,人工智能(AI)蓬勃發(fā)展,在計(jì)算機(jī)視覺、自然語言處理和機(jī)器翻譯等任務(wù)上,AI的準(zhǔn)確性甚至超過了人類。深度學(xué)習(xí)是AI領(lǐng)域目前研究的熱點(diǎn),深度學(xué)習(xí)與GIS融合能夠更高效地解決現(xiàn)實(shí)問題,比如在精準(zhǔn)農(nóng)業(yè)領(lǐng)域幫助提高農(nóng)作物產(chǎn)量、通過預(yù)測模型助力警務(wù)打擊犯罪等等,因此也創(chuàng)造了前所未有的巨大機(jī)遇,具有廣闊的應(yīng)用前景。
近日,新一代國產(chǎn)地理信息平臺(tái)GeoScene 2.1正式發(fā)布,在地理人工智能GeoAI方面實(shí)現(xiàn)了重大技術(shù)突破。GeoScene平臺(tái)和深度學(xué)習(xí)結(jié)合的重點(diǎn)目前主要在計(jì)算機(jī)視覺領(lǐng)域,可以實(shí)現(xiàn)基于衛(wèi)星遙感、航空航天、無人機(jī)圖像、激光雷達(dá)點(diǎn)云等的目標(biāo)識別和圖像分類任務(wù)。平臺(tái)提供端到端的深度學(xué)習(xí)解決方案,從樣本制作、到模型訓(xùn)練、推理分析以及結(jié)果后處理,提供了豐富的產(chǎn)品、工具、APIs,無論業(yè)務(wù)人員,還是數(shù)據(jù)科學(xué)家,亦或開發(fā)者,都能選擇合適趁手的“兵器”,體驗(yàn)深度學(xué)習(xí)的魅力,盡享智能化帶來的樂趣。
具體來看,GeoScene全流程的GeoAI支持樣本制作一鍵導(dǎo)出,提供即拿即用的樣本標(biāo)注工具和樣本導(dǎo)出工具,可將GIS數(shù)據(jù)導(dǎo)出為深度學(xué)習(xí)框架所支持的樣本;訓(xùn)練模型豐方面,內(nèi)置豐富的模型,如SSD、Unet、MaskRCNN、Deeplab、PointCNN等,無需切換環(huán)境即可訓(xùn)練;推理方面,提供多種推理工具,支持場景實(shí)現(xiàn),支持服務(wù)器端分布式推理及GPU推理;精度評估方面,通過使用深度學(xué)習(xí)工具將檢測到的目標(biāo)與地面真相數(shù)據(jù)進(jìn)行比較,計(jì)算深度學(xué)習(xí)模型的精度,如目標(biāo)檢測結(jié)果精度計(jì)算。
圖1 GeoScene全流程的GeoAI賦能敏捷應(yīng)用
2.1版本中,為了滿足更豐富的應(yīng)用場景需求,平臺(tái)也在不斷擴(kuò)展高質(zhì)量深度學(xué)習(xí)模型的類型、數(shù)量。目前內(nèi)置模型達(dá)到20余種,覆蓋了圖像分類、圖像翻譯、變化檢測、語義分割等應(yīng)用方向,新增支持道路提取、變化檢測、影像翻譯等深度學(xué)習(xí)算法模型,全方位賦能用戶業(yè)務(wù)應(yīng)用升級,使得驅(qū)動(dòng)數(shù)字化轉(zhuǎn)型的過程更加高效和智能化。
以道路提取為例,MultiTaskRoadExtractor模型是一個(gè)像素分類模型,與傳統(tǒng)的像素分類不同的是,此像素分類專門針對于道路。就像是模型名稱一樣,模型的另外一個(gè)特點(diǎn)是多任務(wù)。先來看一下模型結(jié)構(gòu):
圖2-1 MultiTaskRoadExtractor模型結(jié)構(gòu)
此模型結(jié)構(gòu)屬于編碼器解碼器結(jié)構(gòu),但是在解碼的時(shí)候,一部分用來生成語義掩膜,另一部分解碼器則去做了道路拓?fù)渑c道路連通性檢查。做的事情如圖2-2所示:
圖2-2 拓?fù)渑c道路連通性檢查
在圖2-2b中可以明顯的看到紅圈內(nèi)為道路斷點(diǎn),在拓?fù)渖吓c道路連通性上都有問題,所以通過檢查將語義分割掩膜完善,進(jìn)而完善模型。
再看下變化檢測,變化檢測是深度學(xué)習(xí)計(jì)算機(jī)視覺領(lǐng)域一個(gè)小方向,其所做的事情顧名思義,提取出兩幅不同時(shí)向變化的地方(如圖3-1)。一般來說,變化檢測根據(jù)場景以及人們的關(guān)注可以分為單類別變化以及多類別變化。單類別的常見場景如建筑物增減變化,多類別的常見場景如國情普查數(shù)據(jù)變化。
圖3-1:變化檢測
GeoScene中的變化檢測模型ChangeDetector來源于STANet(2020年5月發(fā)布),模型整體架構(gòu)如圖3-2所示:
圖3-2:STANet模型結(jié)構(gòu)
從模型結(jié)構(gòu)上可以很清晰的了解整個(gè)模型工作流重點(diǎn)。整體模型是一個(gè)類似Unet的編碼解碼過程,其中比較重要的是兩期影像先進(jìn)行特征圖提取后會(huì)經(jīng)過特定的注意力機(jī)制模塊。圖3-2中的I為輸入的兩期影像數(shù)據(jù),X為提取的特征圖,Z為經(jīng)過特定的注意力機(jī)制之后的特征圖,Metric Module為損失函數(shù),P為最終的語義圖。在特征圖提取時(shí)的backbone是ResNet家族,代表著可以選擇任意ResNet家族的backbone應(yīng)用于模型。此模型適用于單類別變化檢測,如建筑物增減、查違拆違等業(yè)務(wù)場景。
圖3-3:變化檢測實(shí)例
6月3日至4日,2021年易智瑞空間信息技術(shù)開發(fā)者大會(huì)將在北京舉行。屆時(shí),全新發(fā)布的GeoScene 2.1將重磅亮相,進(jìn)一步激發(fā)廣大開發(fā)者創(chuàng)新活力,為各行各業(yè)數(shù)字化轉(zhuǎn)型提供重要支撐。屆時(shí),大會(huì)將對GeoScene在GeoAI方面的最新進(jìn)展進(jìn)行深入解讀,并對新版本中提供的豐富AI模型進(jìn)行應(yīng)用展示。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )