“星環(huán)”有料 “圖”創(chuàng)未來

發(fā)現(xiàn)新冠病毒的傳播路徑?用圖數(shù)據(jù)庫!

識(shí)別金融欺詐,實(shí)現(xiàn)風(fēng)控處理?用圖數(shù)據(jù)庫!

個(gè)性化商品推薦,給買家更好的購(gòu)物體驗(yàn)?用圖數(shù)據(jù)庫!

“圖”,為什么這么熱?

圖數(shù)據(jù)庫,其實(shí)并不是什么新鮮事物。隨著大數(shù)據(jù)分析、人工智能等技術(shù)的快速普及,它已經(jīng)開始“飛入尋常百姓家”,在社交推薦、風(fēng)控領(lǐng)域、健康和醫(yī)療,乃至區(qū)塊鏈、公共安全等領(lǐng)域有了諸多成功的落地應(yīng)用。

近兩三年,圖數(shù)據(jù)庫市場(chǎng)一直處于持續(xù)升溫狀態(tài)。在先行一步的國(guó)外市場(chǎng),以Amazon Neptune、Microsoft Cosmos等為代表的傳統(tǒng)大廠,以及以Neo4j、TigerGraph等為代表的新興勢(shì)力,還有諸如JanusGraph、Dgraph、Redis Graph等開源產(chǎn)品,交相輝映。在國(guó)內(nèi),圖數(shù)據(jù)庫市場(chǎng)也是一派熱鬧景象,大廠有百度HugeGraph、華為GES、騰訊TGDB、阿里GDB、螞蟻GeaBase、字節(jié)跳動(dòng)ByteGraph等,還有星環(huán)科技StellarDB、創(chuàng)鄰科技GalaxyBase、歐若數(shù)網(wǎng)NebulaGraph等也是各具特色,整個(gè)市場(chǎng)競(jìng)爭(zhēng)日趨激烈。

圖數(shù)據(jù)庫市場(chǎng)的興盛,從宏觀的趨勢(shì)和政策層面看,與全球數(shù)字化轉(zhuǎn)型步伐的加快、大數(shù)據(jù)應(yīng)用蔚然成風(fēng),以及中國(guó)已將大數(shù)據(jù)作為一項(xiàng)核心戰(zhàn)略密切相關(guān)。尤其是在數(shù)據(jù)作為一種新型生產(chǎn)要素,寫入2020年4月10日發(fā)布的《中共中央國(guó)務(wù)院關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見》中,加快培育和完善數(shù)據(jù)要素市場(chǎng),實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng),成了當(dāng)前最緊迫的任務(wù)。從微觀的企業(yè)應(yīng)用層面看,越來越多的企業(yè)認(rèn)識(shí)到,數(shù)據(jù)是企業(yè)的戰(zhàn)略資產(chǎn),數(shù)據(jù)的分析、數(shù)據(jù)價(jià)值的挖掘成了決定企業(yè)未來成敗的關(guān)鍵。

當(dāng)前,圖數(shù)據(jù)庫技術(shù)已趨于成熟,并且逐步進(jìn)入了場(chǎng)景化落地階段。圖數(shù)據(jù)庫主要用于圖數(shù)據(jù)的存儲(chǔ)和聯(lián)機(jī)事務(wù)查詢,具備實(shí)時(shí)性。雖然圖數(shù)據(jù)庫可以存儲(chǔ)海量數(shù)據(jù),但并不適合直接用來進(jìn)行海量數(shù)據(jù)的分析計(jì)算。圖數(shù)據(jù)庫無法解決圖計(jì)算領(lǐng)域的所有問題,它是知識(shí)圖譜的基石。而知識(shí)圖譜的構(gòu)建和應(yīng)用,還要結(jié)合不同的圖計(jì)算技術(shù)。目前,知識(shí)圖譜已在搜索推薦、知識(shí)問答、投研分析等領(lǐng)域得到了廣泛使用。知識(shí)圖譜基于自然語言處理模型,將文本數(shù)據(jù)進(jìn)行提煉抽取后,存儲(chǔ)為圖數(shù)據(jù),如此一來,更易于做實(shí)體、關(guān)聯(lián)和圖信息的查詢與分析,以及知識(shí)的統(tǒng)一管理。

雖然人們對(duì)于圖數(shù)據(jù)庫、知識(shí)圖譜等概念和技術(shù)不再陌生,但先進(jìn)技術(shù)的大規(guī)模應(yīng)用總有一個(gè)過程。從整體來看,圖數(shù)據(jù)技術(shù)在行業(yè)應(yīng)用中落地還有一定難度,究其原因:第一,行業(yè)用戶對(duì)圖的概念還不夠熟悉,在技術(shù)選型時(shí)缺乏動(dòng)力和“主心骨”;第二,復(fù)雜的圖應(yīng)用靈活度較高,需要參與人員具有較豐富的算法和數(shù)據(jù)建模經(jīng)驗(yàn),而這正是很多用戶所欠缺的;第三,在面對(duì)不同的業(yè)務(wù)場(chǎng)景時(shí),用戶可能要做大量的業(yè)務(wù)場(chǎng)景梳理、數(shù)據(jù)清洗、標(biāo)注、NLP模型訓(xùn)練工作,有時(shí)還要做很多定制化的工作,復(fù)雜度和成本相對(duì)較高,從而造成了應(yīng)用的障礙。

俗話說,工欲善其事,必先利其器。面對(duì)應(yīng)用的挑戰(zhàn),行業(yè)用戶更迫切需要一個(gè)能力全面的圖數(shù)據(jù)解決方案。首先,它必須具有強(qiáng)大的圖查詢能力,支持快速返回點(diǎn)邊、路徑和子圖查詢;其次要具有強(qiáng)大的圖分析能力,支持運(yùn)行傳統(tǒng)圖算法;再次,還要具備可視化能力,支持展示圖查詢結(jié)果;最后,生態(tài)開放的能力也是不可或缺的,要支持多數(shù)據(jù)源接入和導(dǎo)出。

目前,在圖數(shù)據(jù)庫市場(chǎng)上,產(chǎn)品種類繁多,各廠商也是八仙過海,各顯神通。行業(yè)用戶在選擇時(shí),一定要結(jié)合自己的業(yè)務(wù)需求,選擇一個(gè)功能強(qiáng)大、簡(jiǎn)單易用且全面的解決方案。

從金融行業(yè)看“圖”如何落地?

金融行業(yè)是圖數(shù)據(jù)庫應(yīng)用的先鋒行業(yè),不僅從大型國(guó)有銀行到股份制銀行都普遍使用了企業(yè)級(jí)分布式圖數(shù)據(jù)庫和知識(shí)圖譜平臺(tái),而且從2021年開始,一些中小型的金融機(jī)構(gòu)也在積極探索和嘗試圖應(yīng)用的商業(yè)化路徑。究其原因,一方面,隨著圖數(shù)據(jù)技術(shù)越來越成熟,圖應(yīng)用的投入成本逐步走低;另一方面,從客戶的業(yè)務(wù)需求來看,處理復(fù)雜關(guān)聯(lián)關(guān)系的需求日趨旺盛,不斷創(chuàng)新的圖數(shù)據(jù)技術(shù)、分析手段,可以給客戶帶來明顯的業(yè)務(wù)價(jià)值和收益,同時(shí)還可以有效解決最為迫切的監(jiān)管與風(fēng)控需求。

從應(yīng)用需求的變化和發(fā)展來看,國(guó)內(nèi)金融行業(yè)知識(shí)圖譜最早是從監(jiān)管和大銀行發(fā)展起來的風(fēng)險(xiǎn)圖譜,如反洗錢、反欺詐圖譜應(yīng)用。這一類圖最初是同構(gòu)圖,整個(gè)圖譜Schema可以簡(jiǎn)化抽象成只包含一類實(shí)體和一類關(guān)系,處理起來相對(duì)簡(jiǎn)單。近些年來,隨著技術(shù)進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,包含多種實(shí)體或關(guān)系的異構(gòu)圖數(shù)據(jù)源漸成主流,包括工商數(shù)據(jù)、司法數(shù)據(jù)、供應(yīng)鏈數(shù)據(jù)、產(chǎn)業(yè)鏈數(shù)據(jù)、價(jià)值鏈數(shù)據(jù)、擔(dān)保鏈數(shù)據(jù),甚至是社交網(wǎng)絡(luò)數(shù)據(jù)等?;诖?,未來兩三年,知識(shí)圖譜的主戰(zhàn)場(chǎng)將集中在異構(gòu)知識(shí)圖譜上。

從成本上看,知識(shí)圖譜的應(yīng)用除包括圖數(shù)據(jù)源采購(gòu)的費(fèi)用以外,圖數(shù)據(jù)庫、知識(shí)圖譜PaaS和圖挖掘應(yīng)用是主要的成本構(gòu)成。也正因?yàn)槿绱?,以前,只有大型金融機(jī)構(gòu)才有資金和技術(shù)實(shí)力投入預(yù)研性質(zhì)的開發(fā)或者方案選型。未來,隨著能夠提供全棧知識(shí)圖譜解決方案的廠商逐快速崛起,圖應(yīng)用的商業(yè)化落地成本將隨之有效降低,圖應(yīng)用有可能在金融全行業(yè)中落地開花。

圖數(shù)據(jù)庫與傳統(tǒng)關(guān)系型數(shù)據(jù)庫最大的不同之處在于關(guān)系發(fā)現(xiàn)和關(guān)系查詢。傳統(tǒng)關(guān)系型數(shù)據(jù)庫需要多表關(guān)聯(lián),以及跨表查詢才能實(shí)現(xiàn)關(guān)系的計(jì)算。在復(fù)雜的圖查詢場(chǎng)景中,傳統(tǒng)關(guān)系型數(shù)據(jù)庫可能會(huì)出現(xiàn)嚴(yán)重的性能瓶頸,甚至出現(xiàn)算不出來的現(xiàn)象。而分布式圖數(shù)據(jù)庫可以支持超大規(guī)模萬億點(diǎn)邊計(jì)算存儲(chǔ)場(chǎng)景,基于原生圖存儲(chǔ)技術(shù),充分利用圖拓?fù)浣Y(jié)構(gòu)和數(shù)據(jù)索引,實(shí)現(xiàn)圖上模式挖掘和圖范式查找,效率、準(zhǔn)確性等都得到大幅度提升。

千億級(jí)大圖的查詢是一個(gè)業(yè)界公認(rèn)的難點(diǎn),而從另一個(gè)角度說,也是最好的突破口。當(dāng)初,星環(huán)科技堅(jiān)定地進(jìn)入圖數(shù)據(jù)庫領(lǐng)域,也是希望發(fā)揮自身的技術(shù)優(yōu)勢(shì),在圖數(shù)據(jù)庫領(lǐng)域闖出屬于自己的一片天地。星環(huán)科技從來不打無準(zhǔn)備之仗,其底氣在于,在異構(gòu)知識(shí)圖譜領(lǐng)域已經(jīng)擁有大量技術(shù)儲(chǔ)備,并且面向未來3~5年的技術(shù)發(fā)展,進(jìn)行了充分準(zhǔn)備。事實(shí)勝于雄辯,星環(huán)科技自研的分布式圖數(shù)據(jù)庫StellarDB不僅能夠支持萬億邊規(guī)模的圖數(shù)據(jù)存儲(chǔ),而且具有查詢速度快、分析能力強(qiáng)、穩(wěn)定性高等特點(diǎn),可以支持豐富的圖分析算法,性能表現(xiàn)十分優(yōu)異。

隨著StellarDB快速落地上線,客戶不僅可以穩(wěn)定地為上層業(yè)務(wù)提供查詢業(yè)務(wù),同時(shí)還可降低集群節(jié)點(diǎn)數(shù)量,以及數(shù)據(jù)導(dǎo)入成本。StellarDB具備完整的企業(yè)級(jí)功能,如用戶認(rèn)證、權(quán)限管理、數(shù)據(jù)熱備份、資源控制等,具備高性能的圖查詢能力,包含近20種常見圖算法。StellarDB與大數(shù)據(jù)系統(tǒng)緊密融合,可配合Hadoop、Spark、Kafka等大數(shù)據(jù)系統(tǒng)構(gòu)建復(fù)雜應(yīng)用。StellarDB支持SQL操作和圖數(shù)據(jù)查詢,可處理結(jié)構(gòu)化數(shù)據(jù)和圖數(shù)據(jù)。

星環(huán)科技以領(lǐng)先的圖數(shù)據(jù)技術(shù),為用戶打通了從底層的關(guān)系型數(shù)據(jù)庫、大數(shù)據(jù)平臺(tái),到中層的圖數(shù)據(jù)庫,再到上層知識(shí)圖譜應(yīng)用的全棧產(chǎn)品通路,實(shí)現(xiàn)了從最底層獨(dú)立的“點(diǎn)”分析到關(guān)系的“線”分析,再到事件的“面”分析,最終形成行業(yè)全面的“體”分析的全棧智能分析賦能。星環(huán)科技從點(diǎn)到面再到體的一站式分析工具,可以為用戶節(jié)省大量開發(fā)成本和基礎(chǔ)算力,并顯著提升分析性能。

如今,星環(huán)科技StellarDB已經(jīng)在金融等眾多行業(yè)得到了廣泛部署。比如,星環(huán)科技幫助監(jiān)管和頭部金融機(jī)構(gòu)打造了多個(gè)監(jiān)管、集團(tuán)派系知識(shí)圖譜,以及對(duì)公知識(shí)圖譜、零售知識(shí)圖譜等。

國(guó)產(chǎn)“圖”,底氣何來?

最近一兩年,國(guó)內(nèi)的用戶越來越傾向于選擇國(guó)內(nèi)廠商自主研發(fā)的企業(yè)級(jí)分布式圖數(shù)據(jù)庫和知識(shí)圖譜平臺(tái)。究其原因,可以歸納為以下兩個(gè)方面。

首先,中國(guó)的圖數(shù)據(jù)庫廠商在技術(shù)上并不遜于國(guó)外廠商,在某些技術(shù)細(xì)分領(lǐng)域甚至還超過了國(guó)外同類廠商。都說中國(guó)是天生的“大數(shù)據(jù)之國(guó)”,客戶眾多、數(shù)據(jù)量龐大、業(yè)務(wù)場(chǎng)景繁復(fù),尤其是在金融、社交等領(lǐng)域,時(shí)常會(huì)遇到超大規(guī)模數(shù)據(jù)計(jì)算的場(chǎng)景,圖計(jì)算的網(wǎng)絡(luò)規(guī)模不是普通圖數(shù)據(jù)庫所能承載和解決的。中國(guó)的圖數(shù)據(jù)庫廠商從一開始就要面對(duì)諸如超大規(guī)模、超高復(fù)雜性等的挑戰(zhàn),其解決方案百煉成鋼,能夠更好地滿足中國(guó)客戶的特殊需求。以星環(huán)科技為例,它立足自主研發(fā),可以支持萬億點(diǎn)邊圖計(jì)算場(chǎng)景,也因此贏得了眾多中國(guó)行業(yè)客戶的青睞。

星環(huán)科技的差異化優(yōu)勢(shì)突出體現(xiàn)在,能夠提供端到端的圖數(shù)據(jù)解決方案,包括基礎(chǔ)的大數(shù)據(jù)平臺(tái),以及可以高效運(yùn)行的圖數(shù)據(jù)庫、知識(shí)圖譜等產(chǎn)品。星環(huán)科技是同時(shí)具備圖數(shù)據(jù)庫(StellarDB)、知識(shí)圖譜平臺(tái)(Sophon KG)、圖挖掘應(yīng)用開發(fā)能力的企業(yè),其全棧能力可以助力企業(yè)用戶快速構(gòu)建知識(shí)圖譜應(yīng)用,有效降低圖應(yīng)用的門檻。

其次,出于行業(yè)監(jiān)管與合規(guī)的要求,自主可控的國(guó)產(chǎn)化產(chǎn)品可以避免用戶在技術(shù)應(yīng)用上被“卡脖子”,擁有更多的選擇,確保安全、可靠、可用。

“圖”的未來

未來,圖數(shù)據(jù)庫應(yīng)用將走向何方?

從技術(shù)上看,多模態(tài)異構(gòu)圖將是市場(chǎng)熱點(diǎn),而知識(shí)圖譜與自然語言處理的深度融合發(fā)展則是必然趨勢(shì)。另外,時(shí)序圖、空間圖應(yīng)用,圖神經(jīng)網(wǎng)絡(luò)也是未來的主要方向。

從應(yīng)用的角度看,未來圖應(yīng)用更需要完整的方法論和解決方案。其真正價(jià)值將體現(xiàn)在,利用圖的方法論圍繞諸如金融風(fēng)控、金融投研等領(lǐng)域的知識(shí)圖譜,構(gòu)建整體解決方案。從應(yīng)用趨勢(shì)來看,偏SaaS級(jí)的端到端解決方案能夠有效消除用戶的應(yīng)用痛點(diǎn)。對(duì)于圖數(shù)據(jù)庫廠商來說,擁有基于業(yè)務(wù)場(chǎng)景的know-how,也就是行業(yè)解決方案,才是在知識(shí)圖譜領(lǐng)域?qū)崿F(xiàn)破局的法寶。

可以預(yù)見,用戶會(huì)越來越傾向于選擇端到端的整體解決方案,而無需分別購(gòu)買圖數(shù)據(jù)庫、圖平臺(tái)和建模服務(wù),更無需擔(dān)心底層圖數(shù)據(jù)庫、中層圖建模平臺(tái)和上層圖挖掘應(yīng)用。對(duì)于圖應(yīng)用來說,大型機(jī)構(gòu)會(huì)有非常多的定制化需要,而中小型機(jī)構(gòu)則偏好標(biāo)準(zhǔn)化的解決方案。星環(huán)科技就是這樣一家針對(duì)知識(shí)挖掘應(yīng)用,擁有從

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )