一文幫你更好地理解指標(biāo)
編輯導(dǎo)讀:產(chǎn)品每天在使用,數(shù)據(jù)在不斷增長,我們需要對產(chǎn)品的表現(xiàn)進(jìn)行量化,建立一個精良的指標(biāo)體系,以幫助我們做出科學(xué)的決策。如何搭建指標(biāo)體系呢?本文作者從自身工作經(jīng)驗出發(fā),對此展開了五個維度的分析,一起來看一下吧。
隨著市場競爭進(jìn)入白熱化,越來越多的公司由原來的增長黑客轉(zhuǎn)變?yōu)榫?xì)化運營,不管是增長還是留存,我們都需要對產(chǎn)品的表現(xiàn)進(jìn)行量化。
數(shù)據(jù)指標(biāo),就是量化信息的別名,科學(xué)的決策離不開構(gòu)建精良的指標(biāo)體系。
本文重點從技術(shù)視角,給大家介紹指標(biāo)的定義和實現(xiàn)。文中會有部分簡單的 SQL 示例,文末會給到一些實用的參考資料。
01 一個例子講清楚指標(biāo)的定義
小明看到自己喜歡喝的一款高端酸奶標(biāo)價 8 元,他連忙拿了一瓶去買單。結(jié)果店員告訴他,本次活動第一瓶是原價,第二瓶才是 8 塊的半價 。
上面的例子中,單純一個數(shù)字,是沒有意義的,必須要相應(yīng)的解釋,人們才能理解?!百I滿兩瓶,第二瓶酸奶的單價是 8 塊”,這才是真正完整的指標(biāo)。
用一個簡單的公式給出指標(biāo)的定義:
指標(biāo) = 數(shù)字 + 解釋
其中解釋包含兩方面:業(yè)務(wù)上的解釋;技術(shù)上的解釋。
業(yè)務(wù)解釋通常是圖文,意在給指標(biāo)使用者解釋指標(biāo)從何處來,怎么算。
技術(shù)解釋通常是用程序語言定義的計算邏輯,比如用 SQL 語句定義人數(shù)為 count(user_id),均價為 avg(price) 。
其實理解了元數(shù)據(jù),就能理解指標(biāo),大家可以參考文末的元數(shù)據(jù)文章。
02? 如何設(shè)定合理的指標(biāo)
互聯(lián)網(wǎng)發(fā)展到現(xiàn)在,很多行業(yè)或公司都有了成熟的指標(biāo)體系,而最初構(gòu)建指標(biāo)體系,都要圍繞關(guān)鍵指標(biāo)(北極星指標(biāo))展開。
社交類產(chǎn)品,關(guān)鍵指標(biāo)是 DAU ,因為社交產(chǎn)品的核心是希望更多人能更頻繁地用它溝通交流。
電商類產(chǎn)品,關(guān)鍵指標(biāo)是 GMV ,因為電商平臺希望能承載更多的線上交易。
視頻類產(chǎn)品,關(guān)鍵指標(biāo)是用戶觀看時長,因為這類產(chǎn)品的目的就是為了幫助用戶殺時間。
不同行業(yè),業(yè)務(wù)不同,核心關(guān)鍵指標(biāo)也不同。
而不同之中有相同之處:關(guān)鍵指標(biāo)都能反映產(chǎn)品表現(xiàn),且能衡量產(chǎn)品的直接或間接商業(yè)價值。
指標(biāo)體系的構(gòu)建,要基于業(yè)務(wù)展開,尤其是核心業(yè)務(wù)。基于核心業(yè)務(wù)流程,進(jìn)行層層拆解,逐漸構(gòu)建起企業(yè)的業(yè)務(wù)指標(biāo)體系。
拿電商行業(yè)的 AARRR 漏斗模型舉例,每個業(yè)務(wù)階段,都會有相應(yīng)的北極星指標(biāo)。
想要構(gòu)建科學(xué)的指標(biāo)體系,必須花時間深入了解公司、部門的關(guān)鍵業(yè)務(wù)。通常來說,經(jīng)營性業(yè)務(wù)指標(biāo)是業(yè)務(wù)型產(chǎn)品經(jīng)理重點關(guān)注對象。
不過,公司對人才的綜合能力要求越來越高, T 型人才的說法廣為流傳,產(chǎn)品經(jīng)理也被越來越多地要求具備數(shù)據(jù)分析能力,所以了解下指標(biāo)的管理與實現(xiàn),對我們會有很大的增益。
03 指標(biāo)該怎么管,要解決哪些問題
公司業(yè)務(wù)多,則指標(biāo)多,如此多的指標(biāo),怎么管才好呢?
起初,很多公司會用 Excel 管理,構(gòu)建一本“指標(biāo)字典”,如果不明白某個指標(biāo)什么意思,就去翻翻字典。畢竟,先上車后補票,讓業(yè)務(wù)跑起來最重要。
公司業(yè)務(wù)發(fā)展好,人更多了,離線 Excel 文檔不便于多人協(xié)同的問題就暴露了,在線文檔出現(xiàn)后,離線文檔逐漸被替代。
也有的公司也會用腦圖來管理指標(biāo),不過這一類的工具,都算作是在線文檔。但文檔內(nèi)容還是差不多,大體如下:
因為數(shù)據(jù)通常都是存在關(guān)系型數(shù)據(jù)庫中的,所以定義指標(biāo)時,也需要技術(shù)人員基于業(yè)務(wù)的數(shù)據(jù)模型給出技術(shù)口徑,即指標(biāo)的計算方式。
統(tǒng)一的指標(biāo)共享文檔,解決了指標(biāo)業(yè)務(wù)口徑一致性的問題,但還有 2 個問題沒有解決:
- 業(yè)務(wù)口徑和技術(shù)口徑的關(guān)聯(lián)
- 技術(shù)口徑的復(fù)用性
先說第一個問題。假設(shè)系統(tǒng)中有一張用于記錄用戶登錄的記錄表,其結(jié)構(gòu)如下:
起初,每日活躍用戶定義為每天登錄的用戶數(shù),日活用戶數(shù)的取數(shù)SQL表達(dá)式為:
業(yè)務(wù)發(fā)展一段時間,日活指標(biāo)的定義修改為“每日停留時長達(dá)到 1 個小時的用戶”。業(yè)務(wù)定義變了,技術(shù)定義也要隨之變動也會變動。假定有另一張用戶行為記錄表,結(jié)構(gòu)如下:
那么日活用戶數(shù)的取數(shù)的SQL表達(dá)式為:
而作為產(chǎn)品的運營者,我們監(jiān)測用戶活躍度,往往還會得到更細(xì)的數(shù)據(jù),比如近 1 天活躍用戶數(shù)、近 7 天活躍用戶數(shù)、近 14 天活躍用戶數(shù)。
每一個業(yè)務(wù)口徑都對應(yīng)著特定的分析條件,業(yè)務(wù)口徑可有修改其中的分析條件組合方式,所以會對應(yīng)很多種具體的技術(shù)邏輯(比如 SQL 語句)。
而且,當(dāng)指標(biāo)的業(yè)務(wù)口徑變化時,技術(shù)定義為了保證數(shù)據(jù)的準(zhǔn)確性,也要隨之變更。如果每一種組合都寫定一個邏輯,那么工作量是浩大的。
為了降低技術(shù)對業(yè)務(wù)支撐的難度,聰明的工程師們就想出了辦法:對指標(biāo)進(jìn)行分層管理。
04 指標(biāo),具體如何分層
如果你看過指標(biāo)管理的文章或書籍,或者體驗過指標(biāo)管理系統(tǒng),那你肯定這個結(jié)論:指標(biāo)要分層,通常分 2-3 層。
按照阿里的分法,指標(biāo)有兩層:原子指標(biāo)(有一個小中間層:衍生原子指標(biāo))、派生指標(biāo)。按照華為的分法有三層,分別是:原子指標(biāo)、衍生指標(biāo)、復(fù)合指標(biāo)。
當(dāng)我們接觸一個新東西, 我們通常最先會看到演進(jìn)的最終結(jié)果。如果我們忽視演進(jìn)過程不去探究,會有一個問題,我們回答不清楚為什么是這樣。
上文其實已經(jīng)給出了指標(biāo)分層管理的背景,那指標(biāo)到底為什么要分層?
答案就是為了方便復(fù)用和重新組合。
事實表中有三種字段:事實屬性字段、度量字段、維度字段。
原子指標(biāo)的來源有三種:
- 對事實表中的屬性字段進(jìn)行計數(shù),比如count、count(distinct)
- 對事實表中的維度字段進(jìn)行計數(shù),比如count、count(distinct)
- 對度量字段進(jìn)行聚合操作,比如求和、求平均值等
原子指標(biāo) +? 時間限定 + 業(yè)務(wù)限定(修飾詞) = 衍生指標(biāo)
第一節(jié)中,我們知道指標(biāo)是由數(shù)值和解釋組成。假設(shè)我們知道了一個數(shù)值的業(yè)務(wù)含義,接下來,我們就會關(guān)心這個數(shù)值從何而來,以及數(shù)值是怎么計算得出的。
而原子指標(biāo),就承擔(dān)了這樣的角色。原子指標(biāo)定義了數(shù)值從哪里取得,如何計算。比如活躍人數(shù),是從用戶登錄表根據(jù)對 user_id 進(jìn)行計數(shù)而得來。也就是上面表格里面的 count (user_id)。
為了識別和區(qū)分,我們會對事物進(jìn)行歸類。比如性別:男/女,時代:當(dāng)代/近現(xiàn)代/古代,地區(qū):國內(nèi)/國外。
這些區(qū)分事物的“東西”,我們稱其為維度。維度還可以拆得更細(xì),且不同維度之間是可以組合的。
阿里對派生指標(biāo)的定義為:
衍生/派生指標(biāo) = 原子指標(biāo) + 時間周期 + 修飾詞
其中的時間周期,我們也可以理解為時間維度,因為大多數(shù)時候,我們業(yè)務(wù)分析上都是用的離散的時間值,比如近 1 天、近 3 天、截止當(dāng)前等。
修飾詞,可以理解為不同的維度,或者是維度中特定某個值。比如地區(qū)維度,且維度值為北京。
抽象的東西,通過例子來理解:
近 1 個月北京市的活躍用戶數(shù) = 活躍用戶數(shù)(原子指標(biāo)) + 近 1 個月(時間周期) + 北京市(修飾詞)
將原子指標(biāo)、時間周期、修飾詞、維度等分別定義出來,就好像樂高積木,工程師將最細(xì)粒度的標(biāo)準(zhǔn)化零件構(gòu)建出來,并且設(shè)定好零件之間的組合規(guī)則,用戶可以根絕自身業(yè)務(wù)需求進(jìn)行組合,組合完成后,系統(tǒng)自動生成對應(yīng)的 SQL 語句。
一方面減少了重復(fù)勞動,另一方面,對某個原子指標(biāo)進(jìn)行改動的時候,其他依賴該原子指標(biāo)的衍生指標(biāo)對應(yīng)的邏輯系統(tǒng)也會自動更新。
05 建設(shè)指標(biāo)管理系統(tǒng)的認(rèn)知層次
如果你同為數(shù)據(jù)平臺的產(chǎn)品經(jīng)理,也要為公司建設(shè)指標(biāo)管理系統(tǒng),可以從如下三個層次進(jìn)行認(rèn)知突破。
第 1 層次:
掌握一些常識概念,了解基礎(chǔ)流程。
通過查閱各個競品,知道原子指標(biāo)、派生指標(biāo)、復(fù)合指標(biāo)、業(yè)務(wù)限定等基礎(chǔ)概念,大概知道指標(biāo)的需要哪些屬性(要是要做系統(tǒng),可以先照貓畫虎)。
第 2 層次:
明白數(shù)倉分層,以及指標(biāo)體系。
對數(shù)據(jù)倉庫(維度建模、分層)、業(yè)務(wù)數(shù)據(jù)庫(范式建模尤其是 3NF)、數(shù)據(jù)庫基礎(chǔ)(聚合函數(shù)和group by)、元數(shù)據(jù)等有一定的理解。
第 3 層次:
深入業(yè)務(wù),服務(wù)業(yè)務(wù),優(yōu)化業(yè)務(wù)。
深入了解業(yè)務(wù),知道業(yè)務(wù)方關(guān)心哪些核心指標(biāo),核心指標(biāo)建設(shè)的優(yōu)先級、怎么管、怎么運營,指標(biāo)如何幫助業(yè)務(wù)部門解決問題。畢竟,數(shù)據(jù)價值最終要在業(yè)務(wù)上體現(xiàn)~
06 寫在最后
本人作為數(shù)據(jù)平臺產(chǎn)品經(jīng)理,現(xiàn)在重點參與部分是數(shù)據(jù)中臺的指標(biāo)系統(tǒng)建設(shè),對于業(yè)務(wù)方的指標(biāo)需求認(rèn)知還有許多不足之處。
從我的視角出發(fā),給有不同需求的小伙伴一些建議。
如果你是業(yè)務(wù)型產(chǎn)品(前臺),平時要負(fù)責(zé)產(chǎn)品的規(guī)則和玩法設(shè)計,需要觀測產(chǎn)品的各項用戶指標(biāo),那你應(yīng)該側(cè)重掌握業(yè)務(wù)邏輯,定義運營指標(biāo),并拆解出業(yè)務(wù)指標(biāo)體系。
如果你是平臺型產(chǎn)品(中后臺),要更多考慮是為業(yè)務(wù)賦能,降本增效。建議你熟悉掌握相關(guān)技術(shù)知識和底層概念,構(gòu)建全面的技術(shù)認(rèn)知,再深入了解業(yè)務(wù)需求。
學(xué)以致用,祝各位都能用好指標(biāo),管好指標(biāo),共同創(chuàng)建美好的數(shù)據(jù)時代。
作者:lee;公眾號:樂說樂言
本文由 @lee 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自?Unsplash,基于 CC0 協(xié)議
想請教一下數(shù)據(jù)產(chǎn)品需要深入到那么深的技術(shù)細(xì)節(jié)嗎?3NF這些都已經(jīng)是數(shù)據(jù)表設(shè)計的范疇了吧,這塊的東西是不是交給技術(shù)來進(jìn)行設(shè)計會好一些呢?
您好,我對技術(shù)實踐較少,想向您請教如何將維度與原子指標(biāo)相結(jié)合。如果做管理平臺,可以將維度抽象出來一些通用維度,然后將其與原子指標(biāo)結(jié)合嗎?業(yè)務(wù)上感覺合理,但是實踐上,如果原子指標(biāo)來自不同庫表,同一維度的字段名也不盡相同,在技術(shù)上如何將抽象出的維度與原子指標(biāo)結(jié)合得到派生指標(biāo)。
建議看看阿里的dataworks、華為的DGC,華為的產(chǎn)品可以免費體驗1個月,自己實操一下,比我講解要好很多~
好的,非常謝謝您,看您的文章受益匪淺
感謝支持,平臺的一些文章偏概述,入門很不錯,但是真到實踐,內(nèi)容就偏少一些。
干貨的東西看的人還是少~
想問衍生原子指標(biāo)和派生指標(biāo)的區(qū)別是什么呀?
指標(biāo)的技術(shù)口徑,通常會用SQL進(jìn)行定義。
原子指標(biāo),則是最后計算的方式,而衍生指標(biāo)則基于原子指標(biāo),進(jìn)行維度的組合。
比如,原子指標(biāo):訂單數(shù) = count( order_id )
基于這個指標(biāo),可以衍生出不同的指標(biāo),PC平臺訂單數(shù)、移動端訂單數(shù)。
而移動管指標(biāo),和可以拆得更細(xì):IOS、安卓。
PC平臺、移動端、都是下單平臺維度里面的值。而 IOS、安卓,則是移動端維度具體的值。
原子指標(biāo),定義計算口徑。
衍生指標(biāo)是從分析結(jié)果出發(fā),將不同的維度和原子指標(biāo)組合到一起。
感謝答復(fù),還想再問一下,派生指標(biāo)和衍生原子指標(biāo)怎么區(qū)分呀?
我以為衍生原子指標(biāo)是對原子指標(biāo)進(jìn)行進(jìn)一步的邏輯計算,如銷售額是原子指標(biāo),客單價=銷售額/客數(shù),此時客單價為衍生原子指標(biāo);而對銷售額加定義,如線上銷售額為派生指標(biāo)。
寫完這篇文章后,我意識到一個問題。脫離具體的表(或者說粒度)談指標(biāo),其實是站不住腳的。
假定原始數(shù)據(jù)(從業(yè)務(wù)方采集的ODS層)中,就有訂單明細(xì)表、訂單匯總表(按照天匯總)。當(dāng)然,最原始的數(shù)據(jù),肯定來源于明細(xì)表。萬一業(yè)務(wù)方只記錄了匯總數(shù)據(jù),而舍棄了明細(xì)數(shù)據(jù)呢?
回到你說的例子:
你應(yīng)該看的是阿里體系的介紹,衍生原子指標(biāo),我的理解是,基于原子指標(biāo)之間進(jìn)行運算,直接就衍生出來的指標(biāo)。有些情況下,一張事實表進(jìn)行聚合運算就能得到指標(biāo)的分子和分母,訂單數(shù) = count(order_id),訂單總金額 = sum(order_amt)
平均客單價 = 訂單總金額 / 訂單數(shù),這時,【平均客單價】就是定義中的“衍生原子指標(biāo)”了。
其實“派生”,字面含義跟“衍生”差不多。。主要為了區(qū)別一下吧,區(qū)別是:在原子指標(biāo)的基礎(chǔ)之上,加了維度,加了業(yè)務(wù)限定。