隨著互聯(lián)網(wǎng)的普及和信息技術(shù)的發(fā)展,數(shù)據(jù)開始成為各行各業(yè)發(fā)展的重要資產(chǎn)。如何對(duì)大量的數(shù)據(jù)進(jìn)行有效的處理分析成了必須面對(duì)的問題,“數(shù)據(jù)治理”的概念應(yīng)運(yùn)而生。
一、數(shù)據(jù)治理的概念
數(shù)據(jù)治理(DataGovernance),百度百科對(duì)其的解釋是:數(shù)據(jù)治理是是組織中涉及數(shù)據(jù)使用的一整套管理行為。由企業(yè)數(shù)據(jù)治理部門發(fā)起并推行,關(guān)于如何制定和實(shí)施針對(duì)整個(gè)企業(yè)內(nèi)部數(shù)據(jù)的商業(yè)應(yīng)用和技術(shù)管理的一系列政策和流程。美國全球數(shù)據(jù)管理協(xié)會(huì)認(rèn)為:數(shù)據(jù)治理是對(duì)數(shù)據(jù)資產(chǎn)管理行使權(quán)利和控制的活動(dòng)的集合。桑尼爾·索雷斯提出:數(shù)據(jù)治理是廣義信息治理計(jì)劃的一部分,即制定與大數(shù)據(jù)有關(guān)的數(shù)據(jù)優(yōu)化、隱私保護(hù)與數(shù)據(jù)變現(xiàn)的政策。
二、數(shù)據(jù)治理包含內(nèi)容
數(shù)據(jù)治理是一套持續(xù)改善管理機(jī)制,通常包括了數(shù)據(jù)架構(gòu)組織、數(shù)據(jù)模型、政策及體系制定、技術(shù)工具、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量、影響度分析、作業(yè)流程、監(jiān)督及考核等內(nèi)容。從技術(shù)角度來看,數(shù)據(jù)治理涉及的IT技術(shù)主題包括元數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)集成、主數(shù)據(jù)、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)交換、生命周期、數(shù)據(jù)安全多產(chǎn)品組成的一整套解決方案。
元數(shù)據(jù):采集匯總企業(yè)系統(tǒng)數(shù)據(jù)屬性的信息,幫助各行各業(yè)用戶獲得更好的數(shù)據(jù)洞察力。
數(shù)據(jù)標(biāo)準(zhǔn):對(duì)分散在各系統(tǒng)中的數(shù)據(jù)提供一套統(tǒng)一的數(shù)據(jù)命名、數(shù)據(jù)定義、數(shù)據(jù)類型、賦值規(guī)則等的定義基準(zhǔn),并通過標(biāo)準(zhǔn)評(píng)估確保數(shù)據(jù)在復(fù)雜數(shù)據(jù)環(huán)境中維持企業(yè)數(shù)據(jù)模型的一致性、規(guī)范性。
數(shù)據(jù)質(zhì)量:有效識(shí)別各類數(shù)據(jù)質(zhì)量問題,建立數(shù)據(jù)監(jiān)管,形成數(shù)據(jù)質(zhì)量管理體系,監(jiān)控并揭示數(shù)據(jù)質(zhì)量問題,提供問題明細(xì)查詢和質(zhì)量改進(jìn)建議。
數(shù)據(jù)集成:可對(duì)數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、整合、模型管理等處理工作。既可以用于問題數(shù)據(jù)的修正,也可以用于為數(shù)據(jù)應(yīng)用提供可靠的數(shù)據(jù)模型。
主數(shù)據(jù):幫助企業(yè)創(chuàng)建并維護(hù)內(nèi)部共享數(shù)據(jù)的單一視圖,從而提高數(shù)據(jù)質(zhì)量,統(tǒng)一商業(yè)實(shí)體定義,簡化改進(jìn)商業(yè)流程并提高業(yè)務(wù)的響應(yīng)速度。
數(shù)據(jù)資產(chǎn):匯集企業(yè)所有能夠產(chǎn)生價(jià)值的數(shù)據(jù)資源,為用戶提供資產(chǎn)視圖,快速了解企業(yè)資產(chǎn),發(fā)現(xiàn)不良資產(chǎn),為管理員提供決策依據(jù),提升數(shù)據(jù)資產(chǎn)的價(jià)值。
數(shù)據(jù)交換:用于實(shí)現(xiàn)不同機(jī)構(gòu)不同系統(tǒng)之間進(jìn)行數(shù)據(jù)或者文件的傳輸和共享,提高信息資源的利用率。
數(shù)據(jù)安全:提供數(shù)據(jù)加密、脫敏、模糊化處理、賬號(hào)監(jiān)控等各種數(shù)據(jù)安全策略,確保數(shù)據(jù)在使用過程中有恰當(dāng)?shù)恼J(rèn)證、授權(quán)、訪問和審計(jì)等措施。
生命周期:管理數(shù)據(jù)生命周期,建立數(shù)據(jù)自動(dòng)歸檔和銷毀,全面監(jiān)控展現(xiàn)數(shù)據(jù)的生命過程。
數(shù)據(jù)治理涵蓋數(shù)據(jù)的整個(gè)生命周期,既包括數(shù)據(jù)的收集、傳輸和存儲(chǔ),也包括數(shù)據(jù)的處理、應(yīng)用和消亡。因此,換個(gè)角度來說,數(shù)據(jù)治理的范疇不僅僅包括數(shù)據(jù)本身,還包括加工處理數(shù)據(jù)的算法和數(shù)據(jù)分析結(jié)果的智能化應(yīng)用。數(shù)據(jù)治理不僅涵蓋數(shù)據(jù)的數(shù)字化、網(wǎng)絡(luò)化和智能化三個(gè)階段,還包括每個(gè)階段涉及的政策、技術(shù)和產(chǎn)業(yè)等多個(gè)方面。數(shù)據(jù)治理的重點(diǎn)包括統(tǒng)一的標(biāo)識(shí)空間、清晰的權(quán)屬確認(rèn)、可控的使用授權(quán)、完善的隱私保護(hù)、明確的交易規(guī)則,以及支撐上述治理要求的倫理規(guī)則、技術(shù)和系統(tǒng)平臺(tái)等。
做好數(shù)據(jù)治理,盤活數(shù)據(jù)要素,是發(fā)展數(shù)字經(jīng)濟(jì)的關(guān)鍵核心。