構建數據中臺:提高企業數據價值的關鍵
不同部分的崗位,都面臨著需要拿數據的時候,即便拿到了數據,但又常常出錯,若出現這樣的場景,說明需要該改造一下你們的數據平臺了。本文總結了如何搭建高效的數據平臺的步驟,希望對你有所幫助。
引言
作為產品經理,你剛上線一個功能,想讓研發幫你把數據拉出來進行分析,卻被告知需要排期。
作為數據研發,每天有查不完的數據和寫不完的表,工作能力沒有任何提升。
作為數據分析師,你每天被業務的老大催著要各種報表和看板。
作為業務部門,你需要的數據遲遲拿不到,即使拿到了也經常出現錯誤。
在公司,你是否有遇到過這樣的場景?如果有,說明是時候該改造一下你們的數據平臺了。
一、什么是數據中臺
那什么又是數據中臺呢?數據中臺顧名思義就是把數據進行統一管理的平臺。它是把公司所有的數據,包括業務運行產生的數據、用戶的行為數據、以及外部第三方的數據,進行統一的、規范的、完整的、準確的采集、存儲、加工、管理,并且為前臺業務提供數據服務的平臺??梢园阉斫鉃閭}庫的貨架,而數據就是貨架上的貨物,被分門別類的擺放在貨架之上。
二、數據中臺的價值
那它又有什么價值呢?第一,打通數據孤島,一般企業都會有多條業務線,不同業務線數據存儲在不同數據庫。
第二,降低數據開發成本,數據中臺的可拓展性強和維護成本低。
第三,數據統一規范管理后,數據的準確性和時效性都會得到極大的提升。
第四,數據資產得到沉淀,可發揮的價值和潛力無限。如用戶畫像、標簽體系、個性化推薦、趨勢預測等等。
三、數據中臺構建的步驟
如果你們公司要準備搭建數據中臺,又該如何下手呢?首先我們需要知道數據中臺由哪幾個部門組成,通常我們會說數據中臺是負責數據的“采、存、管、用”,即數據的采集、存儲、管理和應用。
- 數據采集:分為實時采集和離線采集,將各個來源的數據同步到數倉中。一般的數據源有業務數據庫、第三方API數據以及外部采集的非結構數據。
- 數據存儲:數據同步導入會存儲到HDFS,Hive、Flink、Spark等計算引擎任務讀取HDFS中的數據計算后再將計算結果寫入HDFS。
- 數據管理:分為元數據管理和數據模型管理,元數據可以理解為各個數據表的原子字段,數據模型是在數據建模過程中,通過既定的數據模型管理制度,實現對數據模型的增刪改查管理,同時遵循數據標準化與數據統一性的要求,確保數據質量。
- 數據應用:常見的數據應用有BI報表平臺、用戶畫像(標簽體系)、數字化營銷(包含推薦、搜索)等等。
其次,作為產品經理應如何開展工作。
第一步:先明確目前公司的數據現狀,存在哪些問題?是時效性低還是數據準確性低?或者又是業務量日益增長,當下數據應用為業務賦能有限?根據當前的問題確定這次數據中臺建設的目標。
第二步:調研公司目前的業務范圍,涉及到哪些數據范圍?可以根據業務類型進行分類,劃分成相對獨立的數據模塊,如流量域、交易域、商品域等。一般是以源系統為切入點,從常用的系統入手如CRM系統、ERP系統、訂單系統等,通過對各系統的數據梳理,完成總體結構的劃分。
第三步:尋找數據規則來源,很多系統沒有標準的數據文檔,就只能去找系統的負責人、產品經理或者開發人員對接,詢問相關的數據規則正確性。另一方面,還需要在這個過程中明確數據服務的相關業務方,以便同步數據規則與業務邏輯的一致性。
第四步:進行數據邏輯的規劃,這是數據體系的核心內容,也是數據建模的主要內容,需要通過數據模型完成各數據主題與數據表之間的關系設計。
一般主流數據建模的方法有兩種。
一種是E-R建模,即實體、屬性、關系三元組建模,常用于OLTP數據庫建模,缺點是需要全面梳理公司所有業務和數據,周期長,人員要求高;
另一種是緯度建模,是面向分析場景而生,主要用于數據倉庫構建喝OLAP引擎底層數據模型,優點不需要完整的梳理業務流程和數據,實施周期根據數據主題邊界而定,容易快速實現demo。
第五步:完善數據信息,確定數據范圍和邏輯模型之后,還需要明確數據字典中個數據的基礎定義、統計口徑與業務定義,從而讓數據字典成為標準的執行文檔。
四、數據中臺的行業應用
金融行業:
- 風控:數據中臺打通不同業務系統的數據,可以提高風控的準確性和效率。通過多維數據的分析,可以對用戶的風險水平和信用評估進行更加準確和全面的判斷和預測。
- 個性化推薦:數據中臺可以通過建立用戶畫像,對用戶進行多維度的分析和挖掘,為用戶推薦更加符合其需求和偏好的產品和服務,提高用戶的滿意度和忠誠度。
- 營銷推廣:通過數據中臺的用戶畫像和多維數據分析,可以對用戶進行精準的營銷推廣,提高銷售轉化率和用戶參與度。同事,通過數據的分析和挖掘,可以為營銷活動提供數據支持和準確的預測分析。
- 產品設計:通過分析和挖掘用戶行為數據,可以對金融產品的市場需求和受眾進行深入理解,優化產品設計和功能設置,提升產品品質和用戶體驗。
- 決策支持:數據中臺可以提供有效的數據支持和多維數據分析,幫助企業后盾決策和業務轉型。同時,也可以通過數據挖掘和分析,發掘新的商業機會和創新點,推動企業在數字化領域的發展和競爭優勢的提升。
泛零售行業:
- 供應鏈管理:數據中臺通過打通采購、運營、銷售等系統的數據,進行數字化的供應鏈管理,實現從數據采集、匯聚、清洗、調度到數據質量管理的全流程工具化和平臺化。
- 綜合分析:數據中臺可實現跨業務域、跨渠道、跨產品、跨區域的綜合分析,幫助企業全面了解用戶需求和消費行為,通過數字媒介開展業務和觸點布局,進行精細化運營。
- 用戶畫像:數據中臺可以通過多維度數據采集,捕獲用戶行為,建立精準的用戶畫像,幫助企業更好地了解用戶需求,提供個性化的產品和服務,提升用戶體驗。
- 決策支持:數據中臺通過實時數據采集和分析,為企業提供決策支持,幫助企業優化業務流程、產品設計和服務體驗,提高運營效率。
- 營銷推廣:數據中臺可以對用戶行為進行大數據分析,進行精準的營銷推廣,提高銷售轉化率和用戶滿意度。
政務行業:
- 智慧城市建設:數據中臺通過收集和整合城市內部各種數據,如地圖信息、公共設施、交通狀態、氣象信息等,建立城市的綜合性管理平臺,實現城市的數字化和智能化管理。
- 社保與醫療:數據中臺可以幫助政府和相關部門實現社保和醫療數據的收集和整合,提高社保和醫療服務的覆蓋性和質量,減少數據碎片化和防止信息孤島的出現。
- 公共安全:數據中臺可以通過整合公安部門、消防部門、衛生部門等部門的數據,提高公共安全的監測和管控能力,減少事故發生率和提高事故應急處理效率。
- 政策制定:數據中臺可以為政府決策部門提供準確的數據支持,幫助政府更好地了解公眾需求和社會狀況,提供科學的決策依據,提高政策實施的有效性和精準度。
- 環境保護:數據中臺通過統計和分析環境相關數據,如氣象、氣體排放等數據,幫助環保部門和政府監控城市環境的變化和污染狀況,實現環境保護工作的精細化管理。
五、數據中臺的發展趨勢
趨勢一:云原生
技術與業務共同驅動數據中臺走向云原生,但很多所謂的“云原生”仍是對傳統單體架構的改造,實現資源完全彈性擴展仍有待提高。存算分離是大數據低成本落地的保障,并將是真正云原生的顯著特征。數據中臺中的重要組件將遵循存算分離架構,云原生技術具有天然的對象體系、容器化編排、CI/CD、跨云多域數據治理等特性,可以滿足企業客戶對數據安全、合規數據合作技術等需求,推動數據中臺走向云原生。
趨勢二:數智融合
數智融合是構建數據治理和AI開發的統一底座,讓數據和人工智能相互作用。其中,Data for AI 通過對元數據統一管理,打通數據分析與AI模型引擎,實現基于一份數據多模分析,提升數據驅動決策的準確性和可信性;AI for Data 將人工智能算法模型的能力植入到數據治理,實現自動發現數據管理的規則。這種數據與AI的結合方式能夠有效提升數據治理的智能化水平,并降低數據治理門檻。
趨勢三:泛中臺化
5G時代的到來,人工智能、物聯網等創新技術不斷發展。隨著多設備接入、多系統數據融合互聯互通,形成新的數據孤 島,對企業的智能用數發起新的挑戰。
值此時刻,數據中臺的理念體系逐漸完善,相關產品、規范以及標準也趨向統一, 落地經驗也得到積累,大數據項目紛紛與數據中臺結合,數據中臺開始從概念熱點向項目起點轉變。隨著企業對中臺認知 的增強,業務場景需求的解決方案/產品也趨于“中臺化”: IoT中臺、算法中臺、研發中臺、組織中臺、AI中臺等中臺 產品體系不斷豐富。
以IoT中臺為例,是相對數據中臺層次更上的抽象和高級,包含了采集平臺、通信中臺和數據中臺的 全部特性,支持除數據分析、處理、交易等抽象業務服務外的采集和通信能力,相對數據中臺更加貼合企業業務場景,為 未來智慧城市建設提供更加深入和精細化的基礎能力。
數據中臺是一個非常龐大的系統,每一個部分單獨拿出來講都可以講很多,而這遍文章只是拋磚引玉,是對過去學習到的關于數據中臺知識的簡單總結,對于想要知道數據中臺大概是什么、解決什么問題有個整體的初步了解,關于數據建模、數據指標體系建設、數倉搭建、BI可視化等后面可以再詳細展開寫一寫。
本文由 @Glee smile 原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
有沒有書和資料推薦呢
辛苦你了
各種數據涉及不同專業不同領域,如果真的要建立一個統一的數據中臺也是一個很大的挑戰
是的,幾個人的力量是不夠的
怎么搜不到你的公眾號啦
Glee的雜貨鋪