如何通過業務過程,對指標管理體系進行設計?

11 評論 18948 瀏覽 80 收藏 11 分鐘

本文重點介紹了如何根據業務過程來定義原子指標,根據原子指標和修飾詞的結合來定義相關派生指標,同時做好指標的規范命名。

指標作為業務和數據的結合,是數據統計的基礎,也是量化業務效果的依據。如何避免指標統計使用過程中出現的指標名稱混亂,指標不唯一?同時做好數據有序地和有結構地分類組織和存儲,避免底層數據的重復建設,數據統計來源的不唯一?

本文重點介紹了如何根據業務過程來定義原子指標,根據原子指標和修飾詞的結合來定義相關派生指標,同時做好指標的規范命名。

1. 背景介紹

指標是指將業務單元細分后量化的度量值,它使得業務目標可描述、可度量、可拆解。而指標體系的搭建是最為重要的,將直接影響「產生→處理→存儲→計算→應用」的全流程。而在實際的使用過程中出現了以下問題:

  1. 對于同一業務場景,各部門會用不同的指標來衡量;
  2. 對于同一指標的計算,不同的時間點去統計,統計來源和方式會有差異。

具體來說,要做到以下幾點:

  1. 規范維度和量度命名,確保唯一性,命名規則要盡量做到明確、通用、易懂;
  2. 對確認維度或量度,統一計算口徑,避免歧義;
  3. 涵蓋盡可能多的核心維度和量度,以此為基礎推動數據建設,確保指標字典里覆蓋的維度都可區分,指標都可統計;
  4. 基于指標字典,將核心維度和量度注入元數據中心,接入指標提取工具,后續實現不需要寫sql即可完成自助查詢及分析需求,搭建數據自助分析的基礎。

因此要提供標準化的、共享的、數據服務能力,降低數據互通成本,釋放計算、存儲、人力等資源,以消除業務和技術之痛。

數據體系架構如下:

  1. 業務板塊:如果業務產品比較多,且彼此之間的指標或者重疊性比較少的,可單獨分開。
  2. 規范定義:設計出一套數據規范的命名體系。
  3. 模型設計:以維度建模理論為基礎,基于維度建??偩€架構,構建一致性的維度和事實。

指標管理體系設計

數據體系架構

2. 指標的規范定義

指標的規范定義,以維度建模作為理論基礎,構建總線矩陣,劃分和定義數據域、業務過程、維度、度量/原子指標、修飾類型、修飾詞、時間周期、派生指標等。

指標管理體系設計

指標的規范定義

(1)數據域

指面向業務分析,將業務過程或者維度進行抽象的集合。其中,業務過程可以概括為一個個不拆分的行為事件,在業務過程之下,可以定義指標;維度,是度量的環境,如買家下單事件,買家是維度。為了保障整個體系的生命力,數據域是需要抽象提煉,并且長期維護更新的,但不輕易變動。

(2)業務過程

指企業的業務活動事件,如,下單、支付、退款都是業務過程。其中,業務過程不可拆分。

(3)時間周期

用來明確統計的時間范圍或者時間點,如最近30天、自然周、截止當日等。

(4)修飾類型

是對修飾詞的一種抽象劃分。修飾類型從屬于某個業務域,如日志域的訪問終端類型涵蓋無線端、PC端等修飾詞。

(5)修飾詞

指的是統計維度以外指標的業務場景限定抽象,修飾詞屬于一種修飾類型,如在日志域的訪問終端類型下,有修飾詞無線端、PC端等。

(6)度量/原子指標

原子指標和度量含義相同,基于某一業務事件行為下的度量,是業務定義中不可再拆分的指標,具有明確業務含義的名稱,如支付金額。

(7)維度

維度是度量的環境,用來反映業務的一類屬性,這類屬性的集合構成一個維度,也可以稱為實體對象。維度屬于一個數據域,如地理維度(其中包括國家、地區、省市等)、時間維度(其中包括年、季、月、周、日等級別內容)。

(8)維度屬性

維度屬性隸屬于一個維度,如地理維度里面的國家名稱、國家ID、省份名稱等都屬于維度屬性。

(9)派生指標

派生指標=1個原子指標+多個修飾詞(可選)+時間周期??梢岳斫鉃樵又笜藰I務統計范圍的圈定。如原子指標:支付金額,最近1天海外買家支付金額則為派生指標。

指標管理體系設計

派生指標又分以下三種類型:

事務型指標:是指對業務活動進行衡量的指標。例如,新增注冊會員數、訂單支付金額,這類指標需要維護原子指標以及修飾詞,在此基礎上創建派生指標。

存量型指標:是指對實體對象(如商品、會員)某些狀態的統計,例如商品總數、注冊會員總數,這類指標需要維護原子指標以及修飾詞,在此基礎上創建派生指標,對應的時間周期一般為“歷史截止當前某個時間”。

復合型指標:是在事務性指標和存量型指標的基礎上復合成的。例如,瀏覽UV-下單買家數轉化率。

復合型指標的規則:

  • 比率型:創建原子指標,如CTR、瀏覽UV-下單買家數轉化率、滿意率等。例如,“最近1天店鋪首頁CTR”,原子指標為“CTR”,時間周期為“最近1天”,修飾類型為“頁面類型”,修飾詞為“店鋪首頁”。
  • 比例型:創建原子指標,如百分比、占比。例如,“最近1天無線支付金額占比”,原子指標為“支付金額占比”,修飾類型為“終端類型”,修飾詞為“無線”。
  • 變化量型:不創建原子指標,增加修飾詞,在此基礎上創建派生指標。例如,“最近1天訂單支付金額上1天變化量”,原子指標為“訂單支付金額”, 時間周期為“最近1天”,修飾類型為“統計方法”,修飾詞為“上1天變化量”。
  • 變化率型:創建原子指標,例如,“最近7天海外買家支付金額上7天變化率”,原子指標為“支付金額變化率”,修飾類型為“買家地域”,修飾詞為“海外買家”。
  • 統計型(均值、分位數等):不創建原子指標,增加修飾詞,在此基礎上創建派生指標;在修飾類型“統計方法”下增加修飾詞,如人均、日均、行業平均等。例如,“自然月日均UV”,原子指標為 “UV”,修飾類型為“統計方法”,修飾詞為“日均”。

3. 指標管理的功能實現

為了實現指標管理,需考慮的底層信息:

指標管理體系設計

指標管理功能設計

部分前臺界面展示:

指標管理體系設計

原子指標功能界面

指標管理體系設計

派生指標功能界面

4. 數據的使用框架

在對指標進行規范定義與管理的基礎上,可以此推動底層事實表以及維表的建設,保證數據統計的數據源唯一以及計算口徑統一。同時,通過指標和修飾詞的結合,便于業務人員進行自助分析與使用數據,降低數據獲取的效率,從而產生有價值的結論,輔助決策,充分發揮數據的價值。

指標管理體系設計

數據分析使用框架

總結

本文總結了如何基于業務來劃分業務過程,從而涉及對應的原子指標,在與維度結合的基礎上創建派生指標,建設成規范統一的數據指標體系。以此推動數據統計來源的唯一性,并接入指標提取工具,后續業務完成自助查詢及分析需求,搭建數據自助分析的基礎。

本書部分內容根據阿里巴巴數據技術以及產品部的《大數據之路 阿里巴巴大數據實踐》讀書筆記而展開,歡迎大家一起交流。

 

本文由 @?時之沙 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 請問有對應的產品可以參考嗎

    來自廣東 回復
  2. 能不能給提供兩個指標列表、指標添加頁面,以及維度、修飾的分類列表啊 ;
    另外還有 多個指標之間有參數依賴關系的如何處理???

    來自北京 回復
    1. 意思是,指標A的出參 作為 指標B的入參這種如何整合到一個指標中,還是需要單一指標調用處理?

      來自北京 回復
    2. 整合到一個指標中;
      另外一個問題是一個原子指標是不是只能有一個時間維度 ?
      因為看原子指標的時間周期自行設定,如果有多個時間的話,其實我是不知道對哪個時間進行統計的 ,但是如果只有一個時間的話有一種情景該如何解決: 近30天內注冊 7天內激活的用戶,這種數據應該就無法滿足了把

      來自北京 回復
  3. 你好!對派生指標的部分時間周期不是很理解?!白罱?0天”這種,很好理解,是站在當前往前推30天,不需要指定是哪一天的前30天。但是對于像這種:自然月、自然周,比如:自然月支付金額,這種派生指標在使用的時候,需要再指定具體哪個自然月嗎?

    來自山東 回復
  4. 數據域是什么 還是不太理解 可以直接對應到事實表嗎 舉例中的“日志域” 感覺又不是個事實

    來自北京 回復
  5. 你好,關于指標體系的相關資料或書籍有推薦學習的嗎?

    回復
    1. 《大數據之路 阿里巴巴大數據實踐》,可以先讀一下這本

      回復
  6. 你好,剛好最近在也看指標體系相關的,有幾個問題想咨詢下:
    1. 文中的數據源具體是什么? 單張hive表 還是 ?
    2. 原子指標和數據源的關系,原子指標就是數據源中的具體字段么?還是說可以加上聚合函數?

    來自河北 回復
    1. 1、數據源是指底層的事實表,是經過處理后的單張表。
      2、在指標管理中做到可追溯查詢該指標來自于哪一表,方便數據研發人員后期重復開發計算。聚合函數你指的是求和或計數吧,這個屬于指標的計算說明。
      不知道有沒有解決你的疑問

      回復