數據運營篇 | 開啟使用數據的第一步—找到數據
這篇文章是關于數據運營的深入探討,特別強調了在數據使用過程中“找到數據”的重要性。作者詳細介紹了數據地圖、數據目錄和數據資產平臺等工具,這些工具的目標是展示數據平臺已經加工好的數據,以便有數據需求的人能夠輕松地找到并使用這些數據。
找數據對于數據使用這來說,是開啟數據使用的第一步,如果連數據都找不到談何使用。數據地圖、數據目錄、甚至于數據資產平臺等等。其實目標就是一件事情,展示數據平臺已經加工好的數據,能夠讓有數據需求的人,完成使用數據第一步–找數據。
這里的數據地圖和數據管理篇中檔我們討論元數據的時候,我們在討論什么 中介紹的元數據本質是一樣的。但是展示形式上可以更加靈活些?;蛘哒f一個是面向研發的,一個是面向業務應用的。
在元數據篇中,界面一般按照所屬的數據源展示為樹狀結構。
在數據地圖中,一般有一個首頁,首頁一個搜索框,在搜索列表中,詳情頁有各個不同的tab。
首頁
首頁的主要就是一個搜索能力,用戶輸入想搜索的內容,模糊匹配后顯示模糊匹配的列表內容。這里的列表均是表的內容。
如果是增強版本的話,通過這個搜索能夠將數據資產的的數據服務API、報表、大屏、甚至文章等等均進行搜索查詢。這塊可以在資產搜索 中再說明。
詳情頁面
搜索完之后,點擊某一個具體的字段,可以顯示搜索的詳情。
詳情頁面其實就是針對表的各個維度的描述,有哪些維度也是隨著使用不斷深入的。通常我們可以添加的維度有:基本信息、字段 、 數據預覽、分區信息、數據稽核、數據血緣、更新信息、加工任務、評價等等。
基本信息
基本信息包括表的英文名稱、中文名稱、表的描述、創建時間、負責人、等等基本的信息。
以及這個元數據屬于什么數據倉庫分層,屬于什么業務領域的。這些信息是在數據管理篇中2、表層面的規劃 中進行的設置。
字段
以列表的形式展示表里面的字段、字段的類型、以及字段的描述信息。其中字段描述信息是否豐富、全面也是數據是否全面的一個重要維度。
數據預覽
不需要查詢數據,提供一下數據預覽能力,把表里面的數據是什么樣子,能夠更加直觀的給數據消費者以用戶體驗。
這里有一個問題是如果是直接查詢數據的話,需要選擇查詢數據的時候使用的資源。如果是提前保存數據的話,保存的多少,使用什么存儲,是否進行更新就需要有一個方案了。
分區信息
如果是大數據存儲如HIVE等。如果是分區表,需要列出來分區信息,都有哪些分區字段,最新分區是什么。每個分區是什么時候更新寫入數據的。
數據稽核
這個信息其實更多的是一個數據探查的過程,相當于提前把一些字段的特征給總結出來不需要用戶手動寫SQL進行總結。如果字段的最大值、最小值、平均值。如果是枚舉字段的話,有多少個枚舉值,每個值數多少。如果數數值類型的話,數值類型的字段分布是什么樣的等等,這些信息。
這些信息是一個表的一個計算的結果,就會涉及到一個范圍的問題。以及什么時候來進行計算。使用什么資源來進行計算。這些想清楚了,這個功能才能更好的實現。
數據血緣
數據血緣可以理解為是在任務治理篇中的端到端的任務血緣鏈路 的精簡版本,這里僅僅展示表與表之前的上下游關系。用戶作為影響分析, 數據溯源。展示形式上仍舊以圖的形式進行展示。
更新信息
每個表都需要進行更新,進行字段增加,進行字段類型變更,字段刪除等等。這里就可以記錄表的整個的變更信息。
加工任務
將對應的加工任務在界面上顯示出來,直觀的體現是由哪個任務加工生成的此表。
評價
評價的功能就比較靈活了??梢允枪俜降脑u價,如數據熱度、數據可信度—這個可信度就可以是面向OLAP的數據指標使用 中提到的,如果是統一的指標了,就保證是一致的,添加一個官方標簽表明已經是。
也可以是用戶為主的,提這張表的意見,新增什么字段、數據準確性怎么樣等等信息。從而建立一個信息收集、反饋的渠道。
生成的數據服務
如果是基于表生成的數據服務API,直接顯示對應的API,如果是基于SQL的也可以體現下,此表在哪個數據服務API邏輯中。
本文由人人都是產品經理作者【數據小吏】,微信公眾號:【數據小吏】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!