產品分析 | 數據資產目錄競品分析

1 評論 3821 瀏覽 43 收藏 11 分鐘

怎么建設數據資產目錄產品?或許我們可以看看這篇競品分析,從而幫助自己理清思路。這篇文章里,作者便分析了市場上主流的包含數據資產目錄的產品,并梳理了一份競品分析,一起來看看,或許會對你有所幫助。

一、分析背景和目的

分析市場上主流的包含數據資產目錄的產品,重新整理一篇競品分析以供參考和學習。

二、版本信息

三、名詞解釋

四、需求背景

1. 產品現狀

  1. 建設了數據資產目錄,但是偏技術向,比較難用,細節流程上欠考慮。
  2. 元數據的采集不夠靈活。
  3. 元數據管理難用,數據的審批欠考慮。

2. 用戶調研

1)業務人員:有個數據分析需求,他們想要的是快速的查找相關數據,確定該數據就是自己要使用的。

2)數據開發

  • 想快速知道數據影響鏈路,評估修改的影響范圍;數據錯誤,快速根據數據鏈路進行排查。
  • 想了解哪些數據查看次數最多,哪些數據根本無人問津,哪些是重復建設的數據,指導數據開發對模型的調整。

3)領導:查看數據目錄,了解數倉里有哪些數據,有多少數據,數倉建設的怎么樣。

3. 競品選擇和分析

網易EasyData:https://study.sf.163.com/documents/read/EasyDataBook/easydmap.md

華為DataArt Studio:https://support.huaweicloud.com/usermanual-dataartsstudio/dataartsstudio_01_0804.html

阿里DataWorks:https://help.aliyun.com/zh/dataworks/user-guide/overview-10?spm=a2c4g.11186623.0.0.62b276162FMOXv

不同廠商的數據資產目錄展示的數據實體都不一樣,除了基礎的表,字段外,其他可根據實際需求情況確定。

數據資產目錄產品定位偏向:

  1. 產品賣點主要是,元數據可以通過其他系統直接采集。華為和阿里的數據資產目錄產品定位主要是偏向這種形式,也是因為售賣配套的數據開發工具,數據資產目錄是一個附屬的產品。
  2. 產品定位更偏企業內部使用,主要靠手動維護以及自動采集部分元數據。網易的EasyData中的數據資產目錄產品定位更偏向這個,在元數據使用和治理上做的更好。

對于我們來說,沒有其他更多的系統做支撐。所以主要是對網易的EasyData進行產品分析和參考,且EasyData的功能和流程更符合業務使用邏輯。

五、需求說明

1. 業務架構圖

2. 業務流程圖

3. 產品信息架構

4. 產品路線圖

5. 需求清單

6. 用例圖

六、功能詳細說明

1. 配置管理

1)元數據模型配置

① 功能說明:對于需要采集的數據資產實體,進行元數據模型定義,包括技術元數據模型,業務元數據模型,管理元數據模型等等,根據實際需求和情況可寫死,可做頁面配置化。對于表來說,不同層級的表可以元數據有所差距,元數據模型可以只定義一套,屬性可以定義為非必填。

② 功能結構

2)自定義目錄配置

① 功能說明:自定義目錄配置可用于用戶根據具體的業務理解和需求,對數據資產進行自定義分類。

② 功能結構

2. 元數據管理

實現靈活的元數據的采集。

1)元數據采集

功能說明:元數據采集以手動采集為主,自動采集為輔,對數據倉庫、數據庫等存儲系統進行元數據采集。

2)采集元數據主要流程(自動/手動)

3)采集任務管理功能結構

當元數據采集任務未指定采集范圍時,默認采集該數據連接下的所有數據表/文件。采集任務運行完成后,如果該數據連接下有新增數據表/文件,則需再次運行元數據采集任務,才能采集到新增數據表/文件的元數據。

4)采集任務配置流程

網易EasyData元數據自動采集內容(圖內信息肯定不全,可作參考):

5)說明

  1. 手動添加元數據后,可配置采集任務。周期性或手動更新相關元數據(數據源類型、數據源、表物理名稱都一致的視為同一數據資產)。
  2. 由上圖可見,在沒有對接數據開發工具的情況下,可自動采集的元數據信息基礎且有限,大部分元數據還得靠手動維護。
  3. 選擇自動采集的元數據時,須保證機器自動采集的內容準確性。

3. 元數據治理流程(以網易EasyData為例)

治理流程和組織架構密不可分,審批流程貫穿治理流程。對于組織架構不完整的企業,可直接略過草稿狀態。有點過于麻煩了。

數據資產狀態圖:

發布后才可以在資產目錄中查詢到,上線下線的版本均為同一版本,修改/治理后會生產新的版本,用來覆蓋已發布/已下線版本

4. 數據目錄

功能說明:元數據模型是數據目錄的數據基建,數據目錄圍繞元數據基建,和業務場景做一系列的功能。

功能結構圖:

5. 數據血緣

功能說明:對數據上下游鏈路圖形化展示。

  • 血緣視圖種類:關系視圖,列表視圖。
  • 血緣種類:表級血緣、字段級血緣(字段級血緣:EasyData字段血緣僅支持列表視圖,且僅支持展示一張表,猜測是在實際業務中,字段血緣用圖形化加載緩慢或會出現卡死,列表式可快速加載且使用不會卡頓)。
  • 影響通知:變更影響通知到下游所有鏈路相關人員。

功能結構圖:

6. 我的資產

1)我的訂閱

訂閱后,將會接收訂閱資產元數據變動信息。

2)我的收藏

其他補充

  1. 數據標準一定要建設在數據資產目錄前。
  2. 組織的建設,很大程度上決定數據資產維護的準確性和權威性。

本文由 @清小墨 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 請問老師元數據和資產是1對1,還是1對多呢?

    來自四川 回復