一個問題鑒定指標管理真實力:訂單表里有原子指標嗎?
描述業務時,我們常常會用到相關指標,那么什么是原子指標?本文對原子指標進行了詳細的介紹,希望對你有所幫助。
開局一道題,請回答:訂單事實表里,有原子指標嗎?
如果你是數據產品、數據研發,或者是數據崗位的面試官,我建議可以收藏這個題,也好好看這篇,這是我在多家公司花了上百萬成本、實操結合思考才稍微想明白的問題,建議先點贊收藏。
市面上很多文章和案例講如何構建指標體系、如何管理指標、如何構建指標管理系統。很多CDP、用戶畫像、OneData的文章,也都會講到指標。泛泛而談的很多,都說指標厲害,但指標到底怎么定義,怎么管,怎么建,怎么用,講得不透徹。尤其是定義這塊,很多文章復制粘貼、給出一個冠冕堂皇定義就完事了。
就好像,有人告訴你屠龍寶刀厲害,大俠用屠龍寶刀的故事有很多版本,但是,這寶刀到底怎么厲害,比如怎么鍛造出來,大俠究竟怎么用的,沒多少細講的,也很簡單嘛,這東西不熱血還挺枯燥,一點都不爽,沒多少人聽。
但真的大俠怎么能不懂這些細節呢,大家天賦都差不多,細節才決定成敗呀。
剛開始學指標時,見過很多講大道理的書,但講細節的不多,特此來寫一篇。
01 問題定位三板斧
我先給你提供搞懂指標的三板斧:what、why、how。
首先,What。
想回答清楚標題里的問題「訂單表里有原子指標嗎?」,需要給出或者找出原子指標的定義。而且,從名詞分類來說,原子指標是指標的一種,那么,還得解釋指標和事實表的關系。
其次,Why。
有了指標的基礎定義,還需要解釋,為什么要分出來原子指標、衍生/派生指標?并且還可以衍生出一個問題:這些指標之間的關系是什么。
最后,How。
既然都講清楚了定義和原因,那么人們該如何管理指標,目標用戶該又該如何使用指標呢。不然絕妙的指標定義、方法論最終沒法如期運轉起來,也只是個漂亮的理論花瓶。
那么,我們一起來探索下。
02 什么是指標,什么是原子指標
指標用于描述業務的情景,用于對業務當中的事實進行度量。比如,某人買酸奶,一天之內買了幾次,買了幾盒,這些酸奶一共花了多少錢,這些就是指標。
更多指標的案例,請聰明的你舉一反三~
原子指標,則是被定義出來描述最小顆粒度業務的數據。很多文章里都說,原子也就是不可再分的。
但正是這個所謂的「不可再分」會帶來非常多的理解層面的干擾。因為真實的情況恰好相反,原子指標就是用來拆分的,我們需要逆向理解。
還記得數倉分層里面講到的粒度嗎?數倉分層能減少重復計算,為啥能減少?如何減少?這篇文章包懂!
人,是最小的個體計量單位,0.5個活人的說法,在客觀世界是不存在的,或者說不太符合多數場景的認知邏輯。人不能細分了,但,數可以細分呀!0.25個人、0.125個人、0.0625個人,都是可以寫出來的。算人效的時候,就可以這么算。一個頂倆,那么,所謂的倆,可不就是0.5個。
有個形容消費高的笑話:sh月入兩萬不如狗,那么一狗就是2萬,半狗就是1萬。還有網友得知某鄭姓明星一年收入后,用0.5s = xxx萬來調侃。
只要是增加維度,數就是可以繼續細分的。很簡單,增加是或否的前綴,就可以再把數往下細分。比如,5年級的人數是200人,5年級3班的人數是40人,5年級3班2組的人數是10人,5年級3班2組第一排的人數是1人,5年級3班2組倒數第一排的人數也是1人。
03 到底什么原子指標?
原子指標不是數,而是對數的定義和解釋。接下來,我們以一群人去餐廳吃飯為例,來解釋原子指標。
1、原子指標,定義統計的粒度
比如,餐廳要統計人數,前文說道,最小粒度就是個。當我們去拼桌的時候,不存在說什么半個人、1/4個人來拼桌吧,都不是個人了,我們還咋統計?大家都爭當先進個人,意思是:當個先進的人。記住,統計要定義最小的單位和粒度。
2、原子指標,定義統計的目標
當人們靜靜地坐在餐桌前,人數不會變。那餐廳是要統計有多少人來吃飯、有多少碗筷,還是統計上了多少菜、動了多少次筷子、咀嚼了多少次呢?
而且,人會動,時間會往前走,在特定的時間范圍里,一個人可以進行很多次活動,比如,吃飯的次數,吃一餐飯,吃飯人次就加一。餐廳不僅僅要關注人數,也要關注人次。一個人一天吃一頓,一天吃三頓,備餐完全不同。
3、原子指標,定義統計的方法
當我們吃了一次飯,這個事實發生了,哪怕隨著時間推移,吃飯次數這個統計數字,永遠也不會磨滅,也永遠都不會減少了,時間范圍里的總吃飯人數、吃飯人次是可以通過累加得到的。
光看一個數,是不夠的,就比如,吃飯次數,萬一某個神人真的很能吃,一個人一天吃100次,結果吃飯的人數不變,但是吃飯人次增加了不少。
這個荒唐的案例只是想告訴你,數據或者數字,只是對某個事實從某個視角的出發進行的度量。我們要綜合評定。
剛剛說到的,【人均吃飯次數】等于【吃飯總人次】除以【吃飯總人數】,也就是統計的方法。
4、原子指標,定義了統計的約束邏輯
一段時間內同一個人吃三餐飯,統計時間內,吃飯的人沒增加,人數不變。但吃飯的人次增加了,吃飯人次增加。不要光想著做加法,事實世界很多數字是能夠減少的,加減之間,邏輯要對得上。
比如,我們吃飯買單,那么賬戶余額就減少了,餐廳賬戶余額就增加了。我方定義是支出,對方定義是收入,兩者對得上,才是正常的交易。
專欄作家
Lee,公眾號:數據產品小lee,人人都是產品經理專欄作家。關注直播、短視頻和文娛領域、擅長數據架構、CDP及數據治理相關工作。
本文原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
德謨克利特探討了物質結構的問題,提出了原子論的思想。然而原子指標的概念與原子論是不同的。在數據分析中,原子指標通常是用來構建更復雜指標(派生指標)的基礎,通過與其他維度(如時間、地點、類別等)的結合,形成具有特定統計周期和業務限定條件的復合指標。原子指標的核心功能是對指標的聚合邏輯進行定義,它們是不可再分的,因為它們已經是最小的可度量單元了。這些指標通?;跇I務過程的度量值來設定,確保統計口徑和計算邏輯的明確性?!霸又笜瞬皇菙?,而是對數的定義和解釋?!?/p>