第二章:數據治理的邊界在哪里

0 評論 833 瀏覽 0 收藏 9 分鐘

在數字化轉型的浪潮中,數據治理已成為企業不可忽視的核心議題。然而,面對這一龐然大物,許多企業和數據管理者往往感到無從下手。本文深入探討了數據治理的邊界問題,分析了數據生產者、數據加工者和數據消費者三個參與方的角色與責任,以及數據治理的兩種邊界范圍。

面對數據治理,不知道其他人什么感受,我的感受好像面對一個龐然大物,無從下手。似乎有很多的事情需要做,但是具體做哪些?先做什么,再做什么?有沒有牽一發而動全身的那個關鍵節點?如何能夠做到有階段性產出?怎么順利進行推進?等等,似乎問題比答案要多。

如果說第一個需要達成共識的,目前,個人認為,數據治理的第一步是確定要治理的邊界。

一、數據的三個參與方

如果按照數據流向,數據一共有數據生產者、數據加工者、數據消費者,這三個參與方。

數據生產者就是產生數據的業務系統。數據加工者,就是進行清洗、建模、加工的數據部門,一般是數據中臺部門。數據消費者,就是最終使用清洗、加工好數據的部門,可以是業務部門,也可以是分析部門。

二、數據治理的兩種邊界范圍

這里所說的確定數據治理的邊界,是要確定,僅針對數據加工者所涉及的范圍進行治理,還是也要包括數據生產者所涉及的范圍。

換句話說,是僅僅對業務系統產生數據后,導入到數據中臺的數據進行治理,即入湖后的治理。還是對業務系統產生數據時,在導入數據中臺之前就開始治理,即入湖前的治理。

從名字上來說,要進行企業級的數據治理,那么我們當然既要入湖前的治理,又要入湖后的治理了。但是實例情況是這兩種治理在難度上、流程的、溝通范圍程度等等差別還是挺大的。都說數據像水流,這種入湖前的數據治理,就像一條河的下游,要求河上游進行治理,可想而知難度了。

第一種,入湖后的數據治理,主要是數據中臺(假設是數據中臺進行牽頭)為主,其他業務部門輔助。第二種包含入湖前的數據治理,卻是真正的全公司都需要進行系統適配、改造了。華為據說已經達成了,入湖前和入湖后的治理,在業務系統上線發布前,都必須符合數據治理的一些標準,質量要求,如果不符合不允許系統上線。

如果在數據治理項目初期就說,我需要進行入湖前和入湖后的全局數據治理,我需要全公司的配合改造,大概率是不會成功的。這時候經常會聽到“數據治理是一把手工程”,但是個人感覺,一把手怎么支持,支持什么。真要無腦支持影響了業務系統誰負責。畢竟,數據治理 在目前來看還是屬于錦上添花階段。

而且,目前的感覺,一個明確的、可成功的路徑似乎并不是完全清晰的。

當然,這并不是說不需要領導的支持,領導的支持在數據治理過程,個人認為算是一個天時的條件(后續還會說到地利、人和)。而是說明確路徑之后,才能讓領導支持,讓領導給人、給錢、給時間,并要控制好預期。

大部分時候支持都是有條件的,需要先看到成功的希望,才能得到支持。

三、是否做入湖前的數據治理

那就完全不進行入湖前的數據治理了嗎?倒也不是。而是說在開始的時候,只做入湖后的數據治理,之后通過問題驅動,通過場景驅動來逐漸的滲透到入湖前的數據治理,來影響業務,實現全局數據治理。

問題驅動好理解,就是哪天發現哪個數據出現不一致了,口徑無法統一,值沒有辦法對齊,原因是因為某個系統數據經常有異常,這個時候,就可以通過這個問題來驅動業務進行導入數據中臺前的數據治理,也就是對業務系統進行數據治理。通過錯誤數據,來倒逼源頭系統的數據質量改善。

當然,這個過程都需要有工具監控,有工具支撐。能夠讓業務系統使用工具靈活的配置相關的監控規則。而不是人工進行操作,后續也沒有辦法進行效果統計。這個就涉及到工具準備了。而且在工具之上還需要有政策規范,通過工具來落地。還要有對應的組織人力,能夠響應負責這件事情。

另一個,就是通過場景驅動。通過一個比較重要的場景,公司內部一直有對不齊的口徑,相同的指標,你說這個值,我說這個值?;蛘呤顷P鍵主數據信息,就是不能跨系統拉通,如:人員、地址等等。這個時候,通過一個場景,來協調不同組織的人,按照同一個規范,使用工具進行口徑的統一。如將公司內不同系統的地址數據統一,將公司內不同系統采集的人員建立ECIF打通一致。

這種場景驅動的治理,每一個都會是一個比較大的系統工程。像上面說的ECIF就是一套獨立的系統來做用戶主數據的打通。

采用這種逐步改進的形式來影響業務,實現將入湖前的系統數據治理的目標。

而且,先進行入湖后的數據治理,也有一個原因,通過入湖后的治理這個動作,來增加數據中臺部門和業務的溝通交流,以及信任。能夠讓業務知道,正在做的事情是一件什么事情,從行動層面影響業務,而不是讓業務覺得這件事情可做可不做,甚至有抵觸情緒。

四、總結

本章主要說了下,個人理解的數據治理時,需要第一個確認的問題:數據治理的邊界問題。在開始的時候,主要針對入湖后的數據進行治理,而后不斷通過,問題驅動、場景驅動的方式進行入湖前的治理,從而實現全局的治理。

確認了數據治理的邊界之后,在繼續介紹數據治理內容之前,我們先說一下數據管理和數據治理的區別。通過確定這兩個概念的不同含義,進而更好的理解數據治理是個概念。

本文由人人都是產品經理作者【數據小吏】,微信公眾號:【數據小吏】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!