知識中臺:企業(yè)數(shù)字化轉(zhuǎn)型的新階段

明略科技創(chuàng)始人、CEO 吳明輝

明略科技資深科學(xué)家 張杰

隨著信息化、網(wǎng)絡(luò)化、智能化的到來,通過互聯(lián)網(wǎng)、物聯(lián)網(wǎng)采集到的數(shù)據(jù)呈爆炸式增長,全世界步入了數(shù)字經(jīng)濟時代。在數(shù)字經(jīng)濟時代,數(shù)據(jù)已經(jīng)成為關(guān)鍵生產(chǎn)要素。近些年,隨著數(shù)據(jù)意識的覺醒,很多企業(yè)開始構(gòu)建數(shù)據(jù)倉庫、數(shù)據(jù)中臺,一些企業(yè)已經(jīng)具備了較好的數(shù)據(jù)基礎(chǔ)。

然而,數(shù)據(jù)本身并不產(chǎn)生知識,數(shù)據(jù)只是現(xiàn)實世界在虛擬空間中留下的痕跡。知識高于數(shù)據(jù),知識才更貼近事物本質(zhì)。在一個充滿不確定性的經(jīng)濟環(huán)境中,企業(yè)持續(xù)競爭優(yōu)勢的一個確定來源就是知識。在經(jīng)歷了信息化轉(zhuǎn)型、大數(shù)據(jù)時代、數(shù)據(jù)治理三個階段之后,或早或晚,任何組織最終都會走上利用數(shù)據(jù)創(chuàng)造新知識的道路。越來越多的企業(yè)開始意識到,創(chuàng)新力主要來源于自身擁有的知識資產(chǎn)的多少,其重要性超過數(shù)據(jù)資產(chǎn)甚至財務(wù)資產(chǎn)。知識成為企業(yè)核心資產(chǎn)和核心驅(qū)動力的時代已來臨,越來越多的企業(yè)管理者開始重視知識的管理運營。

在知識復(fù)雜度高的行業(yè)里,沒有不做知識管理的企業(yè)?,F(xiàn)階段,很多企業(yè)通過員工培訓(xùn)、文檔管理和數(shù)據(jù)管理來間接地管理知識,普遍缺乏更高效的知識管理系統(tǒng),面臨不少問題,比如,知識難留存,知識難挖掘,知識難管理,知識難傳承。

隨著知識工程、云計算等技術(shù)的快速發(fā)展,將知識作為一種資源進行整合,便于業(yè)務(wù)專家們基于任務(wù)以分布式協(xié)作的方式解決問題,成為實現(xiàn)知識的交流、共享和創(chuàng)新的途徑。知識中臺應(yīng)運而生,建設(shè)知識中臺最直觀的交付物是知識服務(wù)系統(tǒng)(Knowledge as a Service,KaaS)。

明略科技根據(jù)在營銷、金融、工業(yè)、零售等行業(yè)的數(shù)字化轉(zhuǎn)型實踐經(jīng)驗,撰寫了《知識中臺:數(shù)字化轉(zhuǎn)型中的認知技術(shù)》,目前已由電子工業(yè)出版社出版。書中提供了一套構(gòu)建知識中臺的方法論,其核心內(nèi)容可總結(jié)為兩類用戶、三類知識和六步建設(shè)法。

知識中臺:企業(yè)數(shù)字化轉(zhuǎn)型的新階段

兩類用戶包括知識官和知識工程師。知識官往往是企業(yè)內(nèi)的高級專家,負責(zé)定義全局概念體系和管理知識。知識工程師往往是業(yè)務(wù)一線的基層管理者,負責(zé)貢獻單條知識。

三類知識包括事實知識、原理知識和技能知識。以往的研究主要集中在事實知識上,原理知識多是按照技術(shù)路線區(qū)分,技能知識多是從管理學(xué)視角出發(fā),很少科技公司能夠給出IT方面的實現(xiàn)方案。

三類知識與兩類用戶的關(guān)系如圖1所示。

知識中臺:企業(yè)數(shù)字化轉(zhuǎn)型的新階段

圖1 兩類用戶與三類知識的關(guān)系

六步建設(shè)法,指從各類包含顯性知識和隱性知識的數(shù)據(jù)源中,抽取出陳述性知識和程序性知識,并做形式化表示,然后以多種方式提供知識服務(wù),最后促進已有知識的迭代和新知識的產(chǎn)生。

具體包括以下步驟:

第一步,知識建模。

為了有效組織領(lǐng)域內(nèi)業(yè)務(wù)活動中的幾類關(guān)鍵數(shù)據(jù),需要建立起知識的模型,定義出兩個概念體系。一個是類別體系,包含領(lǐng)域內(nèi)的類別、類別所包含的屬性及其約束、類別間的關(guān)系類型;另一個是任務(wù)體系,包含領(lǐng)域中要面對的場景、場景下的細分任務(wù)、處理任務(wù)所需考慮的判斷條件和工作流程等。有些領(lǐng)域在國家主管部委或行業(yè)聯(lián)盟組織的推動下建立了相應(yīng)的國標、行標,便于成員間的數(shù)據(jù)共享和流程標準化。

第二步,知識抽取。

知識抽取的目的是從數(shù)據(jù)源中抽取出知識片段,理解其語義后,做有序的組織和存儲。涉及的知識通常是明確定義的、事實性的信息,這些信息來自不同的數(shù)據(jù)源、具有不同的結(jié)構(gòu)。不同數(shù)據(jù)源的知識抽取方法各有不同:從結(jié)構(gòu)化數(shù)據(jù)中獲取知識的操作常被稱為映射(Mapping),需要編寫映射腳本,其難點在于復(fù)雜的關(guān)系表的處理,包括嵌套表、多列、外鍵關(guān)聯(lián)等。從半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中獲取知識的操作單元常被稱為包裝器(Wrapper),其難點在于包裝器的生成、更新和維護,其中從非結(jié)構(gòu)化文本中抽取知識時就是廣義上說的抽取器(Extractor),其中三個最重要的子任務(wù)是:實體識別、關(guān)系抽取和事件抽取。

第三步,知識管理。

廣義的知識管理被定義為“對知識、知識創(chuàng)造過程和知識的應(yīng)用進行規(guī)劃與管理的活動”。此處的狹義的知識管理作為知識中臺的一項系統(tǒng)功能是指,通過提供用戶交互接口對事實知識庫、原理知識列表、技能知識庫中的知識條目做體系化組織,如增刪改查、推薦、問答、訂閱分享等操作,并最終存儲于數(shù)據(jù)庫中。

第四步,知識計算。

三類知識除了供人類用戶使用,還應(yīng)該被計算機無歧義的調(diào)用執(zhí)行,為上層的應(yīng)用系統(tǒng)提供API接口調(diào)用。由于三類知識經(jīng)過體系化的整理,相當(dāng)于人工的建立起更多的結(jié)構(gòu)關(guān)聯(lián),拉近了相似知識片段間的語義距離,從而使其超越了字符串匹配式的語義計算方法,作為一項基礎(chǔ)服務(wù)進一步提升上層應(yīng)用系統(tǒng)的性能。

第五步,知識應(yīng)用。

知識在真實條件下經(jīng)過有效性和穩(wěn)定性驗證后,可在組織內(nèi)部進一步推廣應(yīng)用,應(yīng)用層常見的使用方式有兩種,一種是較為通用的技術(shù)型應(yīng)用,如可視化洞察、信息檢索、推薦系統(tǒng)、問答系統(tǒng)等;另一種是具有行業(yè)特色的解決方案型應(yīng)用,如金融反欺詐、快消品營銷、工業(yè)維保等。無論以何種形式服務(wù)于用戶或應(yīng)用層系統(tǒng),均需收集實際的應(yīng)用反饋結(jié)果,以用于上述步驟的更新優(yōu)化,從而形成閉環(huán)。

第六步,知識演化。

知識的有效應(yīng)用并不是終點,知識中臺帶來的一項額外的增值是促進知識的動態(tài)演化,形成良性循環(huán)。隨著內(nèi)外部新知識片段不斷加入到統(tǒng)一的知識體系中來,系統(tǒng)及時發(fā)現(xiàn)已有知識之間相似性、主動的推送給最有可能與之產(chǎn)生交互的人,從而對已有知識進行更新、促進新知識的應(yīng)用和啟發(fā)式創(chuàng)新。

知識中臺:企業(yè)數(shù)字化轉(zhuǎn)型的新階段

圖2 六步建設(shè)法

相較于數(shù)據(jù)管理、文檔管理的方式,知識中臺在許多方面將帶來更大價值。

通過知識表示技術(shù),使知識同時表示為人類語言和機器語言,可解釋性更強;通過知識抽取技術(shù),建立企業(yè)內(nèi)部全局統(tǒng)一視圖,便于全員達成概念共識;通過知識增強技術(shù),提升下游應(yīng)用的準確性,包括可視化洞察、信息檢索、推薦系統(tǒng)、任務(wù)型問答、具有行業(yè)特色的解決方案型應(yīng)用等。

放眼未來,數(shù)字化轉(zhuǎn)型要實現(xiàn)進一步突破,一個必經(jīng)階段就是在數(shù)字化基礎(chǔ)上搭建知識中臺。各類知識密集型行業(yè)均需建立自己的行業(yè)大腦,行業(yè)大腦將會成為企業(yè)在市場競爭中的戰(zhàn)略控制點,由企業(yè)自身運營維護,知識作為企業(yè)資產(chǎn)不斷地沉淀和更新。知識中臺將會成為數(shù)字化轉(zhuǎn)型中打通底層數(shù)據(jù)和上層應(yīng)用的關(guān)鍵組件,幫助企業(yè)解決知識難留存、難挖掘、難管理、難傳承的問題,為新經(jīng)濟環(huán)境下的市場競爭做戰(zhàn)略布局。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )