《中國金融》雜志刊發(fā)云信達張兵撰文:提升數(shù)據(jù)管理能力是數(shù)字化轉型根本
時間:2020-05-12來源:未知 作者:acetouzi 點擊: 次以下為《中國金融》雜志刊發(fā)原文。
提升數(shù)據(jù)管理能力是數(shù)字化轉型根本
云信達公司創(chuàng)始人兼CEO張兵
在嚴峻的新冠疫情期間,國內(nèi)某知名的互聯(lián)網(wǎng)企業(yè)發(fā)生嚴重的“刪庫”事件,一夜之間蒸發(fā)12億港元的市值。盡管數(shù)據(jù)保護在金融業(yè)一直是最重要最基本的風險管理目標,但作為數(shù)據(jù)管理行業(yè)的一名老兵,筆者認為這個事件給所有行業(yè)的數(shù)字工作者以警示,數(shù)字化既是機遇也是挑戰(zhàn)。人民銀行提出的做好數(shù)據(jù)治理推動數(shù)字化轉型的規(guī)劃和部署,其中數(shù)據(jù)保護、數(shù)據(jù)治理和數(shù)字化業(yè)務轉型,這三者之間究竟是什么關系,是一個需要首先討論的課題。
做好數(shù)據(jù)治理迎接數(shù)字化時代到來
數(shù)據(jù)是企業(yè)最核心的IT資產(chǎn),數(shù)字化時代,數(shù)字化生存離開了數(shù)據(jù)一切都灰飛煙滅。近年來,各行各業(yè)在進行數(shù)字化轉型,無疑疫情會加速中國及世界的數(shù)字化轉型,使競爭更加白熱化。古語說,積小流成江海。金融業(yè)的數(shù)據(jù)資產(chǎn)是在長期業(yè)務發(fā)展過程中沉淀下來的,無論按照單位數(shù)據(jù)價值(Value per bit)還是數(shù)量,金融行業(yè)無疑排在前列。如何用好數(shù)據(jù)海洋,這一重要課題一直為金融業(yè)以及金融監(jiān)管者所關注。
在數(shù)據(jù)達到一定規(guī)模之后,金融業(yè)都會面臨全局數(shù)據(jù)治理的問題。在此之前,金融機構的數(shù)據(jù)是離散的,分布在多個信息系統(tǒng)內(nèi)部,形成人們經(jīng)常說的“數(shù)據(jù)孤島”,這是金融行業(yè)數(shù)據(jù)治理首先要面臨的課題,其實何嘗不是數(shù)字化時代的基礎課題,然而,現(xiàn)實中這個問題并沒有很好地得到解決,不少機構還沿用傳統(tǒng)的數(shù)據(jù)管理方式。
應用煙囪和數(shù)據(jù)孤島
就銀行內(nèi)部來說,數(shù)字化轉型首先開始于信息科技部門。組織內(nèi)部的業(yè)務部門和職能部門,一般形成垂直與橫向交叉的矩陣式架構,以業(yè)務為中心,而職能部門從業(yè)務單元抽離出來形成橫向管控和支撐。于是我們提出了橫跨信息科技部門和業(yè)務部門的數(shù)據(jù)管理職能,類似許多管理矩陣中存在的大量虛線匯報關系的虛擬組織,某些金融科技公司的數(shù)據(jù)管理職能目前普遍虛擬化或者干脆缺失。科技部門有數(shù)據(jù)庫管理員卻沒有“數(shù)據(jù)管理員”,這個現(xiàn)象和“數(shù)據(jù)孤島”互相作用,形成一個死循環(huán)。上述現(xiàn)象在人民銀行科技司李偉司長撰寫了一篇文章《做好數(shù)據(jù)治理推動數(shù)字化轉型》中被視為金融數(shù)據(jù)治理中所存在的障礙,該文中在金融業(yè)數(shù)據(jù)治理之“術”的開篇就提到了要做好頂層設計。數(shù)字化轉型前的金融科技部門,有應用(APP)開發(fā)者、系統(tǒng)管理員、數(shù)據(jù)庫管理員……這些職能和角色都是基于“顯性”IT資產(chǎn)——應用軟件、硬件設備、系統(tǒng)軟件而設立的。這些“前數(shù)字化”職能如何面對數(shù)字化時代的企業(yè)數(shù)據(jù)資產(chǎn)——生產(chǎn)和交易信息、客戶與合作伙伴信息、資產(chǎn)和位置信息、代碼、知識、算法、模型……離開了數(shù)據(jù)企業(yè)無法生存,就是說,數(shù)字化時代的金融科技公司的頂層設計應該轉向以數(shù)據(jù)為中心。
數(shù)據(jù)資產(chǎn) “邏輯集中”的誤區(qū)
既然數(shù)字化轉型需要把數(shù)據(jù)管理職能從業(yè)務單元中抽離出來,那么數(shù)據(jù)的管理范疇也需要從業(yè)務范疇中抽離出來。數(shù)據(jù)中臺和大數(shù)據(jù)都不是數(shù)據(jù)資產(chǎn)平臺,屬于典型的業(yè)務范疇,但是很容易成為認知誤區(qū),而這樣的誤區(qū)往往會直接導致數(shù)據(jù)治理走上彎路。
現(xiàn)實中被誤導的例子時有發(fā)生,比如自從阿里提出數(shù)據(jù)中臺的概念,一些金融企業(yè)跟風向往。如果說,數(shù)據(jù)中臺更偏重流程型業(yè)務,大數(shù)據(jù)更偏重分析型業(yè)務,那么,它們整合數(shù)據(jù)的業(yè)務目的顯然大于資產(chǎn)管理目的。大數(shù)據(jù)平臺和數(shù)據(jù)倉庫都是以決策支持為目的建造的,通過應用數(shù)學模型和算法,揭示數(shù)據(jù)在更大時空、更多維度、更廣泛主題所呈現(xiàn)的規(guī)律,用于輔助決策;基于算力和方法,高速處理海量數(shù)據(jù),直接驅動流程和業(yè)務。總之,大數(shù)據(jù)是面向復雜決策支持的數(shù)據(jù)業(yè)務平臺,為了適應業(yè)務模型和運算的方便,數(shù)據(jù)可能會變形或轉換,從而失去了原生性,導致數(shù)據(jù)的資產(chǎn)屬性喪失。
就是說在整個數(shù)據(jù)管理中,中臺不是萬能的,數(shù)據(jù)中臺的核心思想是將業(yè)務數(shù)據(jù)整合到一個分布式的數(shù)據(jù)服務平臺快速支撐業(yè)務創(chuàng)新、業(yè)務交叉和業(yè)務彈性。金融IT是典型的雙態(tài)IT架構(穩(wěn)態(tài)和敏態(tài)),顯然,如果將決定生死存續(xù)成熟穩(wěn)定的核心業(yè)務平臺拆掉,單靠裝入靈活的中臺是與銀行初衷與風控原則相悖的。中臺是典型的敏態(tài)架構,是金融企業(yè)的業(yè)務平臺之一。對一個敏捷業(yè)務平臺賦予數(shù)據(jù)資產(chǎn)管理職能顯然是小馬拉大車,而數(shù)字技術已提供了既能夠堅守銀行風險管理底線又同時支持靈活創(chuàng)新的兩全可能。
數(shù)據(jù)治理與數(shù)據(jù)保護的協(xié)同性
那么,我們有怎樣的數(shù)據(jù)治理工具呢?泛企業(yè)的數(shù)據(jù)資產(chǎn)發(fā)現(xiàn)和數(shù)據(jù)治理工具并不缺乏,它們將數(shù)據(jù)的管理范疇像“虛擬組織”那樣從業(yè)務范疇中抽象出來??墒俏覀冎榔髽I(yè)的數(shù)據(jù)每年以50%的速度增長,數(shù)據(jù)發(fā)現(xiàn)、分類、分級、變遷、使用等,會遇到諸多技術和管理問題。況且業(yè)務系統(tǒng)中的數(shù)據(jù)是動態(tài)變化的,治理一個變化中的對象需要對它進行持續(xù)的管控,管理和控制的邏輯疊加在業(yè)務系統(tǒng)上有時并不合適。于是,從業(yè)務系統(tǒng)中抽離數(shù)據(jù)資產(chǎn)自然而然成為科技部門的一個任務。抽離就是從業(yè)務系統(tǒng)中把數(shù)據(jù)復制出來,建立一個生產(chǎn)數(shù)據(jù)的“孿生數(shù)據(jù)”,一個處理業(yè)務邏輯和業(yè)務壓力,另一個處理管理邏輯和管理壓力。數(shù)據(jù)復制如同印刷術在IT的發(fā)展史上已經(jīng)存在了很多年。
根據(jù)IDC統(tǒng)計,一個中型企業(yè)內(nèi)出于各種目的產(chǎn)生的復制數(shù)據(jù)有8-10份之多,常見的有:備份、容災、歸檔、分析、審計、開發(fā)測試等。復制手段和工具多,復制下來的數(shù)據(jù)多,存放方式和地點多,已然成為一個管理難題。復制數(shù)據(jù)管理在數(shù)字化轉型的當口既是管理問題又是技術問題。復制數(shù)據(jù)有些是無條件、不得不做的,有些是有一定選擇性的。所以復制數(shù)據(jù)管理就從不得不做的領域發(fā)端,并成長起來。
數(shù)據(jù)保護是IT運維的日常業(yè)務,也就是數(shù)據(jù)備份。金融行業(yè)對數(shù)據(jù)備份有著嚴格的規(guī)矩與監(jiān)管,金融系統(tǒng)的原生數(shù)據(jù),包括數(shù)據(jù)發(fā)生邏輯變化的時間變量,全都被忠實地記錄在數(shù)據(jù)備份系統(tǒng)。最近發(fā)生刪庫事件的互聯(lián)公司居然沒有備份,這在金融企業(yè)是難以想象的。然而,備份系統(tǒng)的情況并不妙。據(jù)IDC 2018年的一項報告,全球70%的CIO對現(xiàn)有數(shù)據(jù)備份系統(tǒng)不滿意。現(xiàn)行的備份技術20年沒有升級,導致海量備份數(shù)據(jù)只在災難恢復時用一用,平時這份可以救命的數(shù)據(jù)淪為 “暗數(shù)據(jù)”。一方面,人們想要從業(yè)務系統(tǒng)抽離數(shù)據(jù)用于管理目的,另一方面,“暗數(shù)據(jù)”濫觴,這是一對巨大的矛盾。
為應對數(shù)字化轉型,全球知名的IT研究咨詢機構Gartner在2016年定義了一種 “復制數(shù)據(jù)管理”或“副本數(shù)據(jù)管理”的新技術——Copy Data Management,簡稱CDM。CDM首先是一種備份新技術,以“原格式”獲取生產(chǎn)數(shù)據(jù)各個時間序列的副本;其次,CDM是一個副本數(shù)據(jù)管理平臺,備份數(shù)據(jù)能夠被管理和使用,不再是暗數(shù)據(jù)。CDM統(tǒng)一了復制數(shù)據(jù)的過程,統(tǒng)一了副本數(shù)據(jù)的管理,統(tǒng)一了副本數(shù)據(jù)的流轉和使用。CDM管理著生產(chǎn)數(shù)據(jù)的新鮮副本的總集,并且是“原生的”,具備天然的資產(chǎn)屬性。在多個國家,備份數(shù)據(jù)的這個屬性被用來作為客觀證據(jù)。這使得CDM成為一個從業(yè)務系統(tǒng)中抽離的數(shù)據(jù)資產(chǎn)集散地,一個副本數(shù)據(jù)資源中心。
副本數(shù)據(jù)成為管理范疇的焦點也僅僅是數(shù)據(jù)治理得到重視之后,那么,數(shù)據(jù)保護和數(shù)據(jù)治理究竟是怎樣的關系?數(shù)據(jù)保護是傳統(tǒng)IT運維的范疇,數(shù)據(jù)治理然是資產(chǎn)與合規(guī)管理的范疇。數(shù)字化轉型就是要打破部門之間的藩籬,讓數(shù)據(jù)成為最活躍的生產(chǎn)要素,副本數(shù)據(jù)管理自然上升為推動數(shù)字化轉型的跨界“生物”。
副本數(shù)據(jù)的價值和運用
盤活數(shù)據(jù)資產(chǎn)的前提條件是健全治理體系。人民銀行提出了三點:一是做好數(shù)據(jù)資產(chǎn)管理,二是做好數(shù)據(jù)分級管理,三是做好數(shù)據(jù)共享管理。
金融業(yè)的數(shù)據(jù)治理是一個動、靜結合的體系,靜態(tài)能力包括數(shù)據(jù)資產(chǎn)的建檔、分級、分類、關聯(lián)、確權、定價,等等;動態(tài)能力包括數(shù)據(jù)檢索、審計,數(shù)據(jù)流通、共享、交換管理,去標簽化(脫敏),加密,等等。數(shù)據(jù)治理平臺做完三件事可以建立消費數(shù)據(jù)的基礎,首先建立元數(shù)據(jù)管理,也就是描述數(shù)據(jù)的數(shù)據(jù);其次提供便捷的數(shù)據(jù)資產(chǎn)檢索、定位;然后建立數(shù)據(jù)輸出到企業(yè)內(nèi)部、外部的標準。
副本數(shù)據(jù)是數(shù)據(jù)保護的結果,繼而成為了數(shù)據(jù)治理的對象,治理之后又返身進入數(shù)據(jù)消費的環(huán)節(jié)。剛才提到IDC統(tǒng)計過企業(yè)內(nèi)部基于各種目的產(chǎn)生多份副本數(shù)據(jù)(復制數(shù)據(jù)),有了副本數(shù)據(jù)資源中心之后,既可以減少復制的動作,數(shù)據(jù)消費的出口也可以很方便地扎口管理。隨機舉幾個業(yè)務場景的例子:一是CDM可以成為數(shù)據(jù)倉庫之前的ODS,大數(shù)據(jù)之前的數(shù)據(jù)湖,CDM即數(shù)據(jù)湖;二是固化數(shù)據(jù)用于審計目的;三是CDM給DevOps(開發(fā)運維一體化)賦能。
三位一體的數(shù)據(jù)“底盤”
副本數(shù)據(jù)管理誕生于運維,因資產(chǎn)屬性成為治理對象,因為是活躍的生產(chǎn)要素直接進入驅動數(shù)字化業(yè)務的環(huán)節(jié),運維、治理和流通環(huán)環(huán)相扣,既是一個完整的跨界循環(huán),又是一個有機的整體。下圖描繪了副本數(shù)據(jù)管理的三位一體特征,已經(jīng)大大超出了Gartner早期的定義。
三位一體的數(shù)據(jù)底盤
數(shù)據(jù)管理固然是金融業(yè)數(shù)字化轉型的重大課題,不過眼下數(shù)據(jù)保護、數(shù)據(jù)治理和數(shù)據(jù)流通還存在不少相互制約現(xiàn)象,導致創(chuàng)新和轉型步履維艱。比如:互聯(lián)企業(yè)既有支付創(chuàng)新也有刪庫事件,共享經(jīng)濟隱含著隱私數(shù)據(jù)外泄等違法隱患……科技進步使得數(shù)據(jù)這一生產(chǎn)要素變得更加活躍也更加危險,創(chuàng)新必須在風險可以管控的前提下,這就給風險管理提出了新的課題。副本數(shù)據(jù)平臺是一個理想的抓手,副本數(shù)據(jù)是企業(yè)可管理、可操作的資產(chǎn)對象,圍繞副本數(shù)據(jù)平臺可以把數(shù)據(jù)保護、數(shù)據(jù)治理和數(shù)據(jù)流通放在一個整體的框架內(nèi)統(tǒng)一考慮。聚焦副本數(shù)據(jù)建立數(shù)字化底盤,不斷豐富和完善相關的技術體系、管理規(guī)范和行業(yè)生態(tài),可以加速各項數(shù)字化舉措的落地。
副本數(shù)據(jù)管理的三位一體架構除了應用于企業(yè)內(nèi)部,監(jiān)管單位、分支機構和外部合作伙伴的數(shù)據(jù)上收或共享也變得更簡便、可靠。隨著5G的建設,多云數(shù)據(jù)管理可以加速金融云的構建,符合行業(yè)標準的跨企業(yè)的數(shù)據(jù)共享、交換也變得更加可行。當然,有了這個“底座”,還需要行業(yè)數(shù)據(jù)治理規(guī)范、數(shù)據(jù)主權立法、數(shù)據(jù)流通的相應標準制訂等等的同時跟進,才能真正建立起數(shù)據(jù)治理的生態(tài)環(huán)境,完成金融業(yè)的數(shù)字化轉型,從而才能真正成為推動數(shù)字化經(jīng)濟的主要力量。