央行孫國峰:金融科技巨頭可能變數(shù)據(jù)寡頭,誰來監(jiān)管金融大數(shù)據(jù)亟需明確

導讀

伴隨互聯(lián)網(wǎng)金融發(fā)展起來的大數(shù)據(jù)、征信等概念,今天已經(jīng)被廣為人知。但與此同時,如何保護互聯(lián)網(wǎng)上的個人數(shù)據(jù)信息也成為亟待解決的問題。

中國金融四十人論壇(CF40)成員、央行金融研究所所長孫國峰近日撰文指出,大數(shù)據(jù)從互聯(lián)網(wǎng)應用場景向金融領(lǐng)域的轉(zhuǎn)移往往發(fā)生在一些金融科技企業(yè)的集團內(nèi)部,這個過程缺乏監(jiān)管和規(guī)范,可能會侵犯到用戶的知情權(quán)、選擇權(quán)和隱私權(quán),當前隱私數(shù)據(jù)保護的邊界不清晰。

當前,大數(shù)據(jù)在金融領(lǐng)域的應用主要包括大數(shù)據(jù)風控和大數(shù)據(jù)征信兩個方面。在發(fā)展過程中,金融大數(shù)據(jù)應用面臨的風險主要有四點。第一,一些金融科技巨頭憑借其在互聯(lián)網(wǎng)領(lǐng)域的固有優(yōu)勢,掌握了大量數(shù)據(jù),客觀上可能會產(chǎn)生數(shù)據(jù)寡頭的現(xiàn)象,可能會帶來數(shù)據(jù)壟斷。第二,政府和企業(yè)都面臨數(shù)據(jù)孤島難題。第三,由于相關(guān)的法律法規(guī)體系尚不健全,數(shù)據(jù)交易存在許多不規(guī)范的地方,甚至出現(xiàn)數(shù)據(jù)非法交易和盜取信息的現(xiàn)象。大數(shù)據(jù)來源復雜多樣加大了用戶隱私泄露的風險。

針對上述金融大數(shù)據(jù)應用中存在的諸多問題,孫國峰認為,要充分發(fā)揮政府和市場的力量,從個人信息保護立法、信息共享機制建設(shè)、市場自律等多方入手,為金融大數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展提供良好制度環(huán)境。

在制定個人信息保護的法律法規(guī)時,他認為,要系統(tǒng)考慮并解決以下問題:第一,可以在現(xiàn)有法律法規(guī)的基礎(chǔ)上,充分考慮大數(shù)據(jù)的實際發(fā)展,盡可能拓寬現(xiàn)有法律法規(guī)適用于大數(shù)據(jù)產(chǎn)業(yè)的業(yè)務規(guī)范的邊界;第二,要明確大數(shù)據(jù)的監(jiān)管機構(gòu),特別是金融大數(shù)據(jù)的監(jiān)管機構(gòu),界定其職能范圍并賦予其足夠的監(jiān)管權(quán)力;第三,要保護好大數(shù)據(jù)主體的權(quán)利,如數(shù)據(jù)主體的知情權(quán)、選擇權(quán)、訪問權(quán)、個人數(shù)據(jù)可攜權(quán)等;第四,要對數(shù)據(jù)控制者處理數(shù)據(jù)的行為邊界進行嚴格的界定,數(shù)據(jù)控制者必須依法合規(guī)地進行數(shù)據(jù)處理,規(guī)范從互聯(lián)網(wǎng)應用場景向金融領(lǐng)域的大數(shù)據(jù)轉(zhuǎn)移;第五,要對數(shù)據(jù)控制者等其他主體非法使用數(shù)據(jù)的相關(guān)行為進行明確的處罰規(guī)定等。

1、大數(shù)據(jù)在金融行業(yè)的應用

大數(shù)據(jù)指“無法在一定時間范圍內(nèi)用常規(guī)工具進行捕捉、管理和處理的巨量數(shù)據(jù)集合”。傳統(tǒng)的數(shù)據(jù)集合往往是基于特定目的收集的,隨著新興信息技術(shù)的發(fā)展,互聯(lián)網(wǎng)移動終端越來越融入到日常生活和經(jīng)濟行為之中,尤其是智能硬件和設(shè)備的普及,與出行、消費、娛樂、支付等相關(guān)的數(shù)據(jù)呈爆發(fā)式增長趨勢,互聯(lián)網(wǎng)企業(yè)積累了大量數(shù)據(jù)。這些數(shù)據(jù)從多個維度刻畫了經(jīng)濟主體的行為特征,從中可以挖掘出許多額外的信息和關(guān)聯(lián)邏輯。傳統(tǒng)的數(shù)據(jù)庫軟件工具和數(shù)據(jù)分析方法無法在短時間內(nèi)抓取、管理和處理大數(shù)據(jù),不僅僅因為其規(guī)模大,還在于其復雜性,傳統(tǒng)數(shù)據(jù)一般都是結(jié)構(gòu)化數(shù)據(jù),而大數(shù)據(jù)往往包含大量非結(jié)構(gòu)化數(shù)據(jù),包括圖片、視頻、語音、地理位置等,并且數(shù)據(jù)都在實時更新中,云平臺、云計算、機器學習等技術(shù)的突破使得對大數(shù)據(jù)的分析成為可能。金融行業(yè)由于天然具有數(shù)據(jù)量大的優(yōu)勢,成為大數(shù)據(jù)應用的重要領(lǐng)域,具體主要包括大數(shù)據(jù)風控和大數(shù)據(jù)征信兩大方面:

大數(shù)據(jù)風控

金融是經(jīng)營風險的行業(yè),風險控制能力是金融機構(gòu)的核心競爭力。金融機構(gòu)通過信用評分模型來定量計算貸款違約的可能性,確定違約的損失分布,以規(guī)避風險損失,并根據(jù)預測的風險水平進行利率定價。傳統(tǒng)的信用評分模型主要使用歷史借貸數(shù)據(jù)和財務數(shù)據(jù)來預測和判斷借款人的違約風險,采用傳統(tǒng)的統(tǒng)計方法進行分析,這種方法最大的缺陷就是無法對那些缺乏歷史借貸數(shù)據(jù)的借款人進行信用風險評估。在征信體系不完善的經(jīng)濟體中會存在信貸供給不足的現(xiàn)象。我國央行征信系統(tǒng)雖然覆蓋了8億多人,但只有3億多人具有信貸歷史,傳統(tǒng)的風控技術(shù)對這部分信貸歷史記錄空白的群體是無效的。即便在征信業(yè)高度發(fā)達的美國,美國個人消費信用評估公司(FICO)評分也被批評信用評價標準過于單一,評估結(jié)果具有片面性,在時間上表現(xiàn)出嚴重的滯后性。

大數(shù)據(jù)風控是基于互聯(lián)網(wǎng)大數(shù)據(jù),將數(shù)據(jù)挖掘、機器學習等大數(shù)據(jù)建模方法運用到貸前信用評審、反欺詐等風控管理環(huán)節(jié)。與傳統(tǒng)風控模型相比,大數(shù)據(jù)風控有三個基本特征:一是處理的數(shù)據(jù)種類多,更加多維度。大數(shù)據(jù)風控模型除了重視傳統(tǒng)的信貸變量之外,還納入了社交網(wǎng)絡信息等信息,為信貸記錄缺失的群體獲取基本金融服務提供了可能性。比如,ZsetFinance的數(shù)據(jù)來源非常廣泛,既包括傳統(tǒng)的信貸記錄等金融機構(gòu)搜集的結(jié)構(gòu)化數(shù)據(jù),也包括法律記錄、交易信息、電子商務、社交信息等非傳統(tǒng)的數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。二是關(guān)注行為數(shù)據(jù),而不僅僅是歷史財務數(shù)據(jù)。傳統(tǒng)的信用評分模型變量均與反映被評價主體債務狀況和資金延付狀況等資金活動相關(guān),但大數(shù)據(jù)信用評估更關(guān)注被評價主體的行為數(shù)據(jù),在互聯(lián)網(wǎng)大數(shù)據(jù)時代,電子商務、社交網(wǎng)絡和用戶的搜索行為等大數(shù)據(jù)都映射著經(jīng)濟主體的教育背景、工作經(jīng)歷、社交圈子,這些信息與信用水平可能存在某種聯(lián)系。大數(shù)據(jù)技術(shù)是在充分考察借款人借款行為背后的線索和線索間的關(guān)聯(lián)性基礎(chǔ)上進行數(shù)據(jù)分析,降低貸款違約率。三是模型的建立是不斷迭代和動態(tài)調(diào)整的結(jié)果。大數(shù)據(jù)風控模型的輸入端是成千上萬的原始數(shù)據(jù),然后基于機器學習等技術(shù)進行大數(shù)據(jù)挖掘,尋找數(shù)據(jù)間的關(guān)聯(lián)性,在關(guān)聯(lián)性基礎(chǔ)上將變量進行整合,轉(zhuǎn)換成測量指標,每一種指標反映借款人某一方面的特點,比如詐騙概率、信用風險、償還能力等。再將這些指標輸入不同的模型中,最后將模型結(jié)果按一定的權(quán)重加總,最終輸出的就是信用評分。在整個過程中,原始數(shù)據(jù)轉(zhuǎn)換成指標需要進行不斷的迭代,不同模型的權(quán)重值可以根據(jù)樣本進行動態(tài)調(diào)整。

越來越多的互聯(lián)網(wǎng)金融公司,特別是網(wǎng)絡借貸、互聯(lián)網(wǎng)消費金融等領(lǐng)域的公司開始利用大數(shù)據(jù)風控技術(shù)。2016年1月12日,美國的一家網(wǎng)貸平臺SOFI聲明不再將FICO評分納入信貸審批決策,另外一家為消費企業(yè)提供貸款的美國公司Kabbage則將亞馬遜、ebay等電子商務網(wǎng)站數(shù)據(jù)和Facebook、Twitter等社交網(wǎng)站數(shù)據(jù)納入風險評估模型之中,新興的互聯(lián)網(wǎng)金融公司ZestFinance聲稱一切數(shù)據(jù)皆信用。

大數(shù)據(jù)征信

風控與征信都是管理風險的活動,不同的是,風控一般是某一公司依靠企業(yè)自身的數(shù)據(jù)和資源進行風險管理,而征信是第三方機構(gòu)“依法收集、整理、保存、加工自然人、法人及其他組織的信用信息,并對外提供信用報告、信用評估、信用信息咨詢等服務,幫助客戶判斷、控制信用風險,進行信用管理的活動”。

傳統(tǒng)的基于信貸歷史數(shù)據(jù)的風控技術(shù)背后是社會征信體系的建設(shè)。美國是世界上征信業(yè)較為發(fā)達的國家之一,一個重要原因是美國信用卡產(chǎn)業(yè)非常發(fā)達。美國的征信體系主要由三類機構(gòu)組成,一是商業(yè)銀行和貸款機構(gòu),這些資金的貸出方在業(yè)務開展過程中積累了大量的關(guān)于客戶借款、還款和違約的歷史數(shù)據(jù),這些都屬于信用的強相關(guān)變量,這些機構(gòu)都會將這些信用歷史記錄傳給第二類機構(gòu),征信公司。美國有三家主要的征信公司,Experian、Equifax、TransUnion,主要負責搜集和儲存征信數(shù)據(jù),包括從地方法院收集公共記錄信息和貸款機構(gòu)收集逾期債務信息,并將數(shù)據(jù)進行清洗和處理后輸出標準化的數(shù)據(jù)產(chǎn)品,提供給銀行和其他金融機構(gòu),征信公司也會開發(fā)出一些信用評分產(chǎn)品。第三類機構(gòu)就是專注于信用評分的公司,最著名的是FICO評分,主要作用是根據(jù)征信公司的信用報告,找到變量與違約概率之間的關(guān)系,即構(gòu)建信用評價模型。銀行和其他金融機構(gòu)可以根據(jù)FICO評分進行放貸決策。

中國的征信機構(gòu)由中國人民銀行征信中心和其他民營征信機構(gòu)組成。在互聯(lián)網(wǎng)時代,大數(shù)據(jù)在征信行業(yè)的應用帶來了大數(shù)據(jù)征信,就是指通過采集個人或企業(yè)在互聯(lián)網(wǎng)交易、從事互聯(lián)網(wǎng)業(yè)務以及使用互聯(lián)網(wǎng)服務過程中留存下來的信息數(shù)據(jù),并結(jié)合線下渠道采集的相關(guān)信息,利用云計算等技術(shù)手段進行信用評估和評價的活動。

國內(nèi)從事大數(shù)據(jù)征信的機構(gòu)主要由四類:一是電商類平臺,將平臺上積累的用戶行為數(shù)據(jù)進行采集、整理和加工,并經(jīng)過深度挖掘和評估,為合作的金融機構(gòu)信貸審批提供風險定價服務;二是P2P網(wǎng)絡借貸類,通過自建客戶信用系統(tǒng),用于自身平臺撮合的投融資業(yè)務;三是以網(wǎng)絡金融征信系統(tǒng)、小額信貸行業(yè)信用信息共享服務平臺為代表的同業(yè)信息數(shù)據(jù)庫,通過采集P2P平臺借貸兩端客戶的個人基本信息、貸款申請及還款等信息,向加入該數(shù)據(jù)庫的P2P機構(gòu)提供查詢服務;四是互聯(lián)網(wǎng)大數(shù)據(jù)公司,通過收集、整理、保存來源于第三方的互聯(lián)網(wǎng)數(shù)據(jù),運用分析模型和信用評分技術(shù),形成符合客戶需要的征信報告、評級報告等產(chǎn)品,提供給第三方客戶。

大數(shù)據(jù)征信在我國有很大的發(fā)展?jié)摿?,一方面,中國的征信體系覆蓋面仍然有限。據(jù)波士頓咨詢公司測算,截至2015年底,中國個人征信的覆蓋率只有35%,與美國個人征信體系92%的覆蓋率相差甚遠。另一方面,中國的互聯(lián)網(wǎng)尤其是移動互聯(lián)網(wǎng)發(fā)展迅速,移動終端累積了海量的用戶行為數(shù)據(jù),這些網(wǎng)絡交易和社交平臺積累的數(shù)據(jù)為彌補信用記錄空白主體的信用評估數(shù)據(jù)非常重要。

從風控、征信等角度看,大數(shù)據(jù)在金融行業(yè)的應用前景廣闊,但在發(fā)展的過程中也需要注意到存在的風險。

2、金融大數(shù)據(jù)應用面臨的風險

金融科技巨頭可能產(chǎn)生數(shù)據(jù)壟斷

一些金融科技巨頭憑借其在互聯(lián)網(wǎng)領(lǐng)域的固有優(yōu)勢,掌握了大量數(shù)據(jù),客觀上可能會產(chǎn)生數(shù)據(jù)寡頭的現(xiàn)象,可能會帶來數(shù)據(jù)壟斷。一些機構(gòu)掌握了核心的信用數(shù)據(jù)資源,有的機構(gòu)掌握電商交易數(shù)據(jù)和金融數(shù)據(jù),有的機構(gòu)掌握集團的傳統(tǒng)金融機構(gòu)和互聯(lián)網(wǎng)金融平臺的金融數(shù)據(jù),有的機構(gòu)則依托大股東掌握大量線下交易數(shù)據(jù),還通過合作的方式掌握了合作企業(yè)的數(shù)據(jù)。由于缺乏分享的激勵機制,導致與征信的共享理念存在沖突。

存在數(shù)據(jù)孤島現(xiàn)象,數(shù)據(jù)融合困難

政府和企業(yè)都面臨數(shù)據(jù)孤島難題。大數(shù)據(jù)時代,數(shù)據(jù)已經(jīng)成為核心資源,企業(yè)出于保護商業(yè)機密或者節(jié)約數(shù)據(jù)整理成本的考慮而不愿意共享自身數(shù)據(jù),一些政府部門也缺乏數(shù)據(jù)公開的動力。數(shù)據(jù)孤島現(xiàn)象的存在,將導致大數(shù)據(jù)信用評估模型采用的數(shù)據(jù)維度和算法的不同,大數(shù)據(jù)征信模型的公信力和可比性容易遭到質(zhì)疑。

數(shù)據(jù)安全和個人隱私保護難度升級

目前,大數(shù)據(jù)的獲取大致有四種方法:自有平臺積累、通過交易或合作獲取、通過技術(shù)手段獲取、用戶自己提交的數(shù)據(jù)等。但是由于相關(guān)的法律法規(guī)體系尚不健全,數(shù)據(jù)交易存在許多不規(guī)范的地方,甚至出現(xiàn)數(shù)據(jù)非法交易和盜取信息的現(xiàn)象。大數(shù)據(jù)來源復雜多樣加大了用戶隱私泄露的風險,其一,我國金融大數(shù)據(jù)行業(yè)的發(fā)展乃至Fintech行業(yè)的發(fā)展,在很大程度上得益于互聯(lián)網(wǎng)應用場景的發(fā)展,而大數(shù)據(jù)從互聯(lián)網(wǎng)應用場景向金融領(lǐng)域的轉(zhuǎn)移往往發(fā)生在一些金融科技企業(yè)的集團內(nèi)部,這個過程缺乏監(jiān)管和規(guī)范,可能會侵犯到用戶的知情權(quán)、選擇權(quán)和隱私權(quán)。其二,應用數(shù)據(jù)存在多重交易和多方接入的可能性,隱私數(shù)據(jù)保護的邊界不清晰;其三,技術(shù)手段的加入,加大了信息獲取的隱蔽性,一旦出現(xiàn)隱私泄露糾紛,用戶將面臨取證難、訴訟難的問題;其四,大數(shù)據(jù)采集數(shù)據(jù)的標準不一,用戶的知情權(quán)、隱私權(quán)可能受到侵犯??梢?,在大數(shù)據(jù)環(huán)境下,個人數(shù)據(jù)應用的隱私保護是一個復雜的消費者權(quán)益保護問題,涉及到道德、法律、技術(shù)等諸多領(lǐng)域。

3、加強對金融大數(shù)據(jù)應用的監(jiān)管

針對金融大數(shù)據(jù)應用中存在的諸多問題,要充分發(fā)揮政府和市場的力量,從個人信息保護立法、信息共享機制建設(shè)、市場自律等多方入手,為金融大數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展提供良好制度環(huán)境。

建立并完善個人信息保護的法律制度體系

通過建立個人信息保護的法律制度體系,使大數(shù)據(jù)產(chǎn)業(yè)在數(shù)據(jù)采集、加工整合以及使用等多個環(huán)節(jié)能夠依法合規(guī)的發(fā)展。在制定個人信息保護的法律法規(guī)時,要系統(tǒng)考慮并解決以下問題:第一,可以在現(xiàn)有法律法規(guī)的基礎(chǔ)上,充分考慮大數(shù)據(jù)的實際發(fā)展,盡可能拓寬現(xiàn)有法律法規(guī)適用于大數(shù)據(jù)產(chǎn)業(yè)的業(yè)務規(guī)范的邊界;第二,要明確大數(shù)據(jù)的監(jiān)管機構(gòu),特別是金融大數(shù)據(jù)的監(jiān)管機構(gòu),界定其職能范圍并賦予其足夠的監(jiān)管權(quán)力;第三,要保護好大數(shù)據(jù)主體的權(quán)利,如數(shù)據(jù)主體的知情權(quán)、選擇權(quán)、訪問權(quán)、個人數(shù)據(jù)可攜權(quán)等;第四,要對數(shù)據(jù)控制者處理數(shù)據(jù)的行為邊界進行嚴格的界定,數(shù)據(jù)控制者必須依法合規(guī)地進行數(shù)據(jù)處理,規(guī)范從互聯(lián)網(wǎng)應用場景向金融領(lǐng)域的大數(shù)據(jù)轉(zhuǎn)移;第五,要對數(shù)據(jù)控制者等其他主體非法使用數(shù)據(jù)的相關(guān)行為進行明確的處罰規(guī)定等。

加快信息共享機制的建設(shè)

推動政府信息公開和行業(yè)之間的信息共享,打破數(shù)據(jù)壁壘,發(fā)揮大數(shù)據(jù)推動各個行業(yè)升級和轉(zhuǎn)型的作用,促進降低信息等多方面的成本,提高經(jīng)濟效率和社會福利。第一,進一步完善個人信息保護的法律法規(guī),以此避免信息共享帶來的數(shù)據(jù)安全和個人隱私泄露等問題。第二,打破數(shù)據(jù)壟斷,對大數(shù)據(jù)進行分級管理,將政府掌握的大數(shù)據(jù)界定為公共品,依法合規(guī)向社會開放分享;將機構(gòu)掌握的涉及到公共利益的大數(shù)據(jù)界定為準公共品,持有這類大數(shù)據(jù)的機構(gòu)必須在保護好個人隱私等條件下分享其數(shù)據(jù);主要涉及到商業(yè)利益的大數(shù)據(jù)界定為非公共品,對這類大數(shù)據(jù)也要推動其在合法使用的范圍內(nèi)進行交易。第三,還需要推動大數(shù)據(jù)標準化,使政府信息和不同行業(yè)之間的數(shù)據(jù)可以交互式使用,打破信息共享過程中面臨的技術(shù)壁壘。

發(fā)揮行業(yè)自律組織作用

行業(yè)自律組織可以在規(guī)范行業(yè)內(nèi)部大數(shù)據(jù)的使用等方面發(fā)揮作用。首先,行業(yè)自律組織可以積極制定大數(shù)據(jù)信息采集、使用標準,探索大數(shù)據(jù)信息數(shù)據(jù)庫的安全管理標準和異議處理機制,引導規(guī)范大數(shù)據(jù)產(chǎn)業(yè)發(fā)展,保護信息主體的權(quán)益。其次,行業(yè)自律組織有利于推動大數(shù)據(jù)標準化。標準真實的大數(shù)據(jù)是人工智能大數(shù)據(jù)分析的基礎(chǔ),行業(yè)自律組織可以積極牽頭或者配合監(jiān)管機構(gòu)制定大數(shù)據(jù)標準,并整合不同行業(yè)的大數(shù)據(jù)。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-09-20
央行孫國峰:金融科技巨頭可能變數(shù)據(jù)寡頭,誰來監(jiān)管金融大數(shù)據(jù)亟需明確
大數(shù)據(jù)從互聯(lián)網(wǎng)應用場景向金融領(lǐng)域的轉(zhuǎn)移往往發(fā)生在一些金融科技企業(yè)的集團內(nèi)部,這個過程缺乏監(jiān)管和規(guī)范。

長按掃碼 閱讀全文