指標管理必知的真相:訂單事實表里沒有原子指標

1 評論 1805 瀏覽 7 收藏 11 分鐘

原子指標在工作業務中會用上,對于原子指標內容,大家對它理解多少呢?下面這篇文章是筆者整理分享的關于指標管理中原子指標的相關內容,大家一起來看看吧!

上篇文章「一個問題鑒定指標管理真實力:訂單表里有原子指標嗎?」寫完以后,分享到一個群里,有同行回復:有,比如訂單金額。

看到回復,我腦子突然就斷電了,好像對誒!確實是有原子指標叫訂單金額的。果然,哪怕推導過依然會經常忘記,我當時是咋推導出來的呢?跟我一起來看看~

一、先看一些材料

阿里的數據團隊基于電商的海量大數據,在國內構建頂級的數據系統,也輸出了很多數據理論和規范,他們產出OneData指標理論體系,也可以說是業界公認的標準體系了。以下兩段內容以及圖片都來源于阿里云dataworks-智能建模/原子指標

指標是衡量業務特征的統計數值,用于體現企業某一業務活動的業務狀況。指標通常分為原子指標和派生指標,與指標相關的參數還包括修飾詞和時間周期。派生指標則是由原子指標 + 時間周期 + 一個或多個修飾詞組成。

原子指標用于明確業務的統計口徑和計算邏輯,是基于用戶的業務活動(即業務過程)創建的,用于統計業務活動中某一業務狀況的數值。例如,用戶的業務活動為購買,則原子指標就可以指定為支付金額。

下面這張非常經典的圖估計你也看過,也是來源于阿里數據團隊的書:《阿里巴巴·大數據實踐之路》,被很多數據領域的文章和書籍所引用。

第一次看這張圖,我很震撼。因為當時對指標體系的認知很模糊,相當于給我當時錯亂的腦子梳理出來一個非常清晰的邏輯。

但其實,有一些東西深究下去,發現自己不理解。比如,維度為什么指向屬性?是維度表里屬性字段的意義嗎?那什么是度量,度量和指標是一個意思嗎?數據域是什么?如何劃分?劃分的標準是什么?

但后來,我發現很多書、文章都是基于這套理論系統來展開的,有的甚至把原子指標、派生指標這套體系大講特講,但始終沒把蠢蠢的我講懂、講服。

其實,這些問題縈繞在腦子里,需要結合實際數據慢慢去去理解,甚至是需要自己依照這個圖的結果自行給出合理的解釋,才能說服自己(就這樣吧,別糾結了吧)。好吧,但既然大家都這么說,那我也就隨大流吧。但始終我還是覺得沒懂,不太舒服,直到我捋清楚了。

二、為啥沒有原子指標

接下來,我說說為啥訂單事實表里沒有原子指標。以下,我們結合數據倉庫的知識一起來看幾個點(包含我的個人理解)。

第一,指標定義。指標是對事實的數字化度量。

第二,原子指標特點。原子指標是最細粒度、不可拆分的指標。

第三,派生指標的定義。派生指標 = 一個或多個修飾詞 + 時間周期 + 原子指標(有的公司也叫衍生指標,不管叫啥定義都差不多,有的公司定義是這樣:衍生指標 = 維度+時間周期+業務限定+原子指標)。

第四,事實表的特點。事實表,包含維度屬性字段和事實字段。如果有疑問,可以看《數據倉庫工具箱·維度建模權威指南》里對事實表的定義。也可以看各個數據產品中數據建模的功能模塊,在創建事實表時,字段會分不同的類型,維度 or 指標 or 事實。

可以參考官方文檔:華為云數據治理中心 DataArts Studio> 用戶指南> 數據架構組件> 模型設計> 維度建模> 新建事實表。

也可以參考:有數數據開發及管理平臺用戶手冊 V6.5.0 Update /離線用戶手冊/模型設計中心使用指南/外部數據源建表演示。

當然,你依然可以參考:大數據開發治理平臺 DataWorks 操作指南/數據建模 DataWorks智能數據建模/維度建模/可視化建模/創建邏輯模型:明細表

不過需要補充說明,阿里的dataworks這款產品里,維度和粒度很容易把人繞暈(關聯粒度,也就是關聯維度)。

有了這四個前提,很明顯看到:訂單事實表得有維度,而原子指標沒有維度。故而,訂單事實表沒有原子指標。

那表里面有啥指標呢?表里有數,所有的數對應的都是衍生指標,或者派生指標(或者復合指標),都是具有非常明確業務含義的指標。正如這篇「文章襯衫的價格是九磅十五便士,那么你應該選…」提到的:一個美麗小胖黑孩(皮膚黝黑),買了一個中國的純棉襯衫,襯衫的價格是九磅十五便士。

單純說「訂單價格」這個指標,是沒有任何業務含義的,在具體的業務場景里的解釋一個具體的數字才有實際意義。就好像,平臺打廣告給咱們說:誒呀,雙十一襯衫跳水價啦!但是呢,你喜歡的特定品牌的、M碼的、黑色經典款的襯衫價格沒降,結果你沒下單,系統也沒訂單生成。

就算咱們把這個訂單金額的指標定義出來了,有啥真實意義呢?沒數哇,分析啥?要解釋啥?啥也沒有,洗洗睡了。聊抽象的東西,可以聊,但是分析一個真實發生了的、一個具體的什么樣的人、買了一件具體的什么樣的襯衫價格多少,才有意義。

三、不爭了,而且我知道你懂,請讓我再說一句

到這里,問題的爭論就結束了,咱也不掰扯概念了。不管認不認可答案,只要知道:衍生/派生指標由修飾詞/維度/時間周期/原子指標組成,你肯定也知道指標該怎么管。原子指標,只不過定義了數該怎么算,從哪算。

除了原子指標以外,其他構成派生指標的其他元素,是叫做修飾詞、維度、業務限定,都無所謂了。

再多的前綴,也都是修飾,形容詞。「原子」這個詞語在我們中文語義里,是不能再細拆的,而當我們加形容詞,描述的粒度反而越來越細,這個結果跟對詞語的理解是完全相反的,很容易給人帶來錯誤的感覺。

任何的形容詞,都是對原子指標的細致解釋。最終,我們反過來看。與其叫做原子指標,不如換種說法叫詞根指標。比如:近1天線上渠道訂單金額、近1天線上渠道會員訂單金額、近1天上午時段線上渠道高級會員訂單金額。

當我們徹底搞明白了指標的定義,有了自己的理解,哪怕真實的工作中業務復雜,有成千上萬的指標,我們也不會怕了,一眼就能識別出來。希望看完文章的你,不用再為概念糾結了,也不會被別人輕易地唬住了,也能一眼識別對方是在不懂裝懂,還是真的OneData大師~

-end-

接下來,我們可以看看指標具體怎么管,指標管理系統如何構建,會碰到哪些問題,而這,是一個復雜的系統性工程。以上~感興趣的話,記得點贊、收藏,如果還有問題,記得留言喔,這樣我才有繼續寫的熱情,我們下回見!

-推薦閱讀-

一文幫你更好地理解指標

四千字全面解析數據產品經理必知概念:標簽、維度、指標

專欄作家

Lee,公眾號:數據產品小lee,人人都是產品經理專欄作家。關注直播、短視頻和文娛領域、擅長數據架構、CDP及數據治理相關工作。

本文原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 文章開頭提到的“訂單金額”是一個特殊的派生指標,這個派生指標的時間周期和修飾詞是空。那如果非要把它看做一個原子指標的話,那原子指標的限定詞就是空,空就代表無常、有無限可能,所以才說原子指標既是不可再分的,又是拿來進一步細分的。

    來自安徽 回復