產品經理必備技能:定義數據指標

5 評論 16867 瀏覽 149 收藏 9 分鐘

數據指標的定義,是培養數據思維要闖的第一道關。

數據分析是產品經理的一項基本技能,然而每次想好好學習下,資源不是7天精通Excel就是20天進階SQL,甚至于Python必知必會……工欲善其事必先利其器,確實沒錯,但工具需要思維來指揮。

而數據指標的定義,是培養數據思維要闖的第一道關。作為一只數據小白,分享一點定義數據指標的心得,有問題老鐵們請斧正。

1、激活,如何定義一個激活?

下載、安裝并打開APP的用戶數?我們暫且這么定義。根據定義,下載沒安裝或者安裝沒打開的用戶,都不計入激活。只有完成所有步驟的用戶才算。但是問題來了,一個用戶下載、安裝并打開APP時,根本沒登錄,他只是一個游客。激活的定義變成:下載、安裝并打開APP的游客數。

如果我們把這個定義交給開發,開發可能會問,拿什么標識一個游客?設備號。每臺移動設備都有一個唯一的識別號碼,也叫IMEI(International Mobile Equipment Identity)。所以,激活的定義又變成:下載、安裝并打開APP的設備數,以設備號為唯一標識。

有人可能會問,我更新APP后打開,或者卸載重新安裝APP再打開,算一個新的激活么?這就涉及到統計口徑的問題,一般來講,覆蓋安裝與卸載安裝后的打開,都不計入激活。

2、新增用戶數,多維度區分

如果把新增用戶定義為新注冊的User_ID,簡單粗暴,但市場的同事首先不答應。

市場推廣APP有多種渠道類型,比如各大安卓應用市場、AppStore、信息流、SEO、流量互換等,每個類型下的渠道,以Channel_ID來標識。

渠道有區分,APP自身也有區分。最省事的區分是Android包和iOS包,顯然未考慮擴展性。如果市場制作馬甲包(APP小號)、獨立H5頁,推向市場,需要以Product_ID來區分產品(APP、H5)。

另外一個維度是版本。每個版本發布時,市場可能會帶一波量,需要觀察版本新增用戶的推廣成本、轉化、ARPU值等。我們可以通過Version_ID來區分版本。

以上,通過Channel_ID、Product_ID、Version_ID的區分和篩選,市場部的同事就可以知道,每個渠道下的每個產品的每個版本的新增用戶情況。

維度區分清晰了,除了在一定程度上,提高市場推廣效率外,甚至能預防數據異常的發生。筆者所在公司是做公積金查詢的,查詢數/新增用戶數,是一項重要的指標。有天突然查詢數/新增用戶數斷崖式下跌,一開始,大家都以為是查詢成功率下降導致查詢數(分子)下降,拼命分析影響成功率的因素,卻始終無解。

后來才發現,是新增用戶數(分母)的暴增導致了比率的下跌。新增用戶數暴增,查詢數成功率正常,查詢數卻沒有增加,什么鬼?其實這是個偽暴增。新增用戶的統計口徑,納入了錯誤的Product_ID,而ID對應的產品剛好正在大力推廣……

如果能在數據指標定義時,清晰地劃分出可能的維度,類似耗費時間與溝通成本的數據異常問題就不會發生。

3、活躍,誰的活躍?

定義活躍,不能粗暴地只定義一個用戶日活指標,可以先從轉化的角度進行用戶層級的劃分。

筆者所在的公司,是通過公積金數據做授信,幫助銀行篩選優質貸款客戶,用戶在APP上的關鍵行為是查詢公積金、申請貸款。因此轉化漏斗是:激活-注冊-查詢公積金-申請貸款,對應指標是:APP日活(游客+用戶)、用戶日活、公積金導入用戶日活和貸款申請用戶日活。

APP日活,以APP的一次打開為一個活躍,以設備號為標識,當日的重復打開不計入活躍。剩下的3種日活,以相應用戶群體的一次登錄請求為一個活躍,以User_ID為標識,當日的重復請求不計入活躍。

跟蹤以上指標,能得到比單純的用戶日活指標更豐富的信息。

另外,活躍也不一定以日為單位。從行為頻率上來看,查詢公積金可能是1次/月,申請貸款可能是1次/日。那么,公積金導入用戶,月活可能更適合作為活躍指標;而對于申請貸款的用戶,則日活更適合。

4、留存/流失,兩兄弟?

在和同事討論7日留存率的定義時,出現了分歧。有人認為7日留存率指的是,新用戶在第2-7日的活躍數/新用戶數;而不同意見表示是新用戶在第7日的活躍數/新用戶數。老鐵們也可以發表下自己的意見,你們支持哪種,理由呢?

留存率是APP推廣初期尤其要重視的指標。留存率低的產品,等于一個巨大的漏斗,市場砸錢買來的流量,在產生收益前,就都統統漏掉。真真是黃金萬兩,砸不出一個聲響。

至于選擇次日留存率、7日留存率還是30日留存率作為唯一關鍵指標,多少留存率為目標,要根據產品特性與市場環境作具體分析。

從定義上看,流失和留存貌似是兩兄弟。有7日留存率,就有7日流失率,兩者的分子加起來等于首日的新用戶。但新用戶在第7日未活躍,就定義為流失用戶,未免太過草率。由于回流用戶的存在,定義流失用戶的周期一般比留存用戶的長。比如,定義90日內未活躍的用戶為流失用戶,更為合適。

5、定義數據指標的目的性

最后強調一點,定義數據指標不能無的放矢。

如果是為了解決一個問題,那我們先明確問題,分析可能的原因,再去定義指標。

如果是為了驗證設計方案的優劣,那我們先明確設計方案的目標,圍繞目標去對比上線前后的數據,或者做A/B Test。

如果是為了預測,那我們先摸索現有的數據規律,找到規律的自變量,再進行推演。

如果是為了預警,那我們先制定數據基線以及浮動范圍,并根據實際情況的變化靈活調整。

 

作者:產品戴唯威。微信公眾號:產品戴唯威(ID: PMDaiweiwei)

本文由 @ 產品戴唯威 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自PEXELS,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 非常干貨了!很有幫助!

    回復
    1. 謝謝!

      來自浙江 回復
  2. 謝謝分享,之前沒想過這個數據指標和統計口徑整理的這么細。
    但是關于留存,想說一下自己的看法;
    7日留存,說的是第7日的留存率;而2-7日留存,我們叫周留存,不知道我理解的對不對

    來自北京 回復
    1. 這個我們內部也沒有討論出結果,在實際情況中,也不必糾結于名詞定義,把數據需求澄清即可

      來自浙江 回復