數據掃盲(2):新增用戶與留存到底是啥?

34 評論 15947 瀏覽 95 收藏 14 分鐘

對數據基本功的扎實了解,是溝通的橋梁,本文作者對常見的數據指標進行了分析,希望通過此文能夠加深你對基礎數據指標的認識。

01 新增用戶

如果大家看過咱們系列的第一篇文章:《數據掃盲(1):我們常說的DAU、MAU是啥?》應該是知道這樣一句話:

對數據基本功的扎實了解,是溝通的橋梁!

這句話是貫穿我們數據掃盲系列始終的,跟著新增用戶我們舉一個場景,大家可以再次深度感受一下這句話。

我們的運營同學為了推廣app,去找渠道商進行合作,涉及到結算錢的時候,商量以新增用戶為指標進行結算,但是對于新增用戶的具體定義,大家發生了爭執:

  • 渠道商:只要用戶在我們渠道的推廣頁面點擊了產品下載按鈕,就記作一次新增用戶。
  • 運營喵:那不成,點了按鈕沒下載那意義不大啊。咱們下載成功記作一次新增,且多次點擊記作一次。
  • 產品狗:錯了錯了,咱們app這么牛,至少也要啟動一次記作一次,讓他們體驗下,要不然數據質量不大,不具備參考價值。
  • 工程獅:都打住啊,你們這yy半天不行啊,不注冊我們后臺都沒有數據。必須注冊了才算新增用戶。

面對這樣的場景,我們很難去說對錯,我們更關心的是彼此間對于數據指標如何達成共識!

那么新增到底指的是什么呢?

我們把新增用戶進行說文解字般的拆解,新增=新+增。接下來我們需要明確兩個問題:

Q1:什么是增?在哪個節點為增?

A1:一般來說,在用戶與產品發生關系之前,往往會經歷如下圖所示路徑:

用戶通過不同的渠道銜接進入到渠道頁(例如某度廣告頁,某企鵝廣告頁);用戶在渠道頁面點擊下載或者通過渠道頁進入到應用商店下載;安裝,啟動應用,來到應用首頁;觸發相應的激活行為(不同業務激活行為不同,例如注冊成功、購買商品、亦或是觀看一次視頻等等)。

理論上不同的節點,都是可以作為一次新增,這里呢,我總結一下不同節點作為新增的優劣勢,以及適合的場景。

大家就可以根據表中總結的,結合自己公司業務選擇適合自己的節點。

Q2:怎么判斷是否為新?

A2:這個問題是由一個實例引入的,假設我們以安裝啟動這個節點作為增,一個用戶下載了某app并安裝啟動,裝了兩天卸載了,又重新安裝啟動,此時他是否算作新增用戶?這里,我們一般有兩種判斷方法:

  1. 基于設備:用戶第一次安裝啟動時,記錄設備。再次安裝則不記錄。其中涉及的不同系統之間(ios,安卓,web)判斷設備的門道,詳情細節可見上一篇文章《再也不怕別人問我DAU和MAU了》其中關于user部分的介紹。
  2. 基于賬號關聯。

以賬號作為判斷基準,和后臺已有的賬號進行比對,看以前是否存在此賬號。

02 留存用戶

本文提到的留存都是指的新增用戶的留存,下不贅述。

首先我們來看一下友盟平臺對于留存是怎么下定義的。

宋老濕還是給大家引入一個案例,來幫助大家理解定義。

案例還是一款悲催的app,上線第一天新增了100名用戶,之后就再也沒有獲取新增用戶。下面給出其上線七日的日活表:

我們由表可以得出MAU=100,這點如果有疑問,請查看數據掃盲系列文章一《再也不怕別人問我DAU和MAU呢~ 數據掃盲系列(1)》。

問題:如何計算新增用戶七日日留存?

這里給出兩個算法。

算法一:(第七天留存用戶數/第一天新增用戶數)*100%

算法二:(第二天~第七天去重后的留存用戶數/第一天新增用戶數)*100%

根據留存的定義,“某段時間內的新增用戶,經過一段時間后,仍繼續使用應用的,為留存用戶”。從中可以提煉出留存用戶是某段時間新增用戶的子集。

就本題而言,上線第一天新增了用戶100人且之后再沒有新增用戶,所以第一天之后幾天的活躍用戶都是第一天新增用戶的子集,即第X日留存用戶數=第X日活躍用戶數,第一天的新增用戶=第一天的活躍用戶。

但是,如果沒有“第一天新增100人后再無新增用戶”的前提,則第X日留存用戶數≠第X日活躍用戶數,準確表述應為第X日留存用戶數=第X日來自于第一天新增用戶中的活躍用戶。

這里有一點繞,我舉一小例子幫助大家理解一下。

(假設5月份新增用戶200,這200人在6月份啟動過應用的有100人,7月份啟動過應用的有80人,則6月份留存用戶為100人,7月份留存用戶為80人。)

那么采用哪一個算法呢?

如果您有心記得,宋老濕反復強調過:數據分析一定是基于業務的,是有目的(即留存用戶這個數據指標的意義)。

目的一般來說,留存的計算與分析有以下目的:

  1. 觀測不同渠道帶來用戶的質量;
  2. 版本更新后的新功能上線的效果反饋。(功能這一塊,會涉及到用戶關鍵行為的觸發。屬于精準留存的問題,后期文章我們會講解)

此處我們以區分渠道質量來做講解:

算法一

假設某app有兩個獲客渠道A和B,且都是1月1日上線,當日新增用戶100名之后再無新增用戶。已知兩個渠道1月1日~1月7日每日的活躍用戶的數量,用算法一【(第七天留存用戶數/第一天新增用戶數)*100%】計算分別得到兩個七日留存率。

這里可能會有一些朋友會覺得,用算法一計算忽略了2日到6日的用戶數據,這樣計算得到數據不準確。其實不是這樣的,我們獲取了兩個數據是為了進行數據對比,從對比中洞察業務爆破點。因為無論是渠道A還是渠道B,我們都只使用第一天和第七天的數據,同時忽略了2日到6日的數據,忽略的信息是一致的。

因為單一影響因素相同,所以采用算法一計算進行對比是相對公平合理的。

當然,即使這樣,可能還會有一些朋友會問那有什么辦法不忽略2日到6日的數據呢?

算法二

【第二天~第七天去重后的留存用戶數/第一天新增用戶數)*100%】這種計算方式就是把2日到6日之間的活躍用戶計算在內,但是這樣的計算方法是否適合用來評估渠道質量呢?

我們可以看下下圖是關于渠道A和B七天日活用戶的折線圖,我們嚴格按照算法二計算會得出渠道A留存率高于渠道B,實際上我們由圖可以看出渠道B的活躍用戶曲線更接近于自然平緩下降,同時第七日的活躍用戶也高于渠道A。綜合來說渠道B的用戶質量是高于渠道A。

所以用算法二來計算留存評估渠道質量是不ok的,究其原因,恰恰是引入第二日和第六日的數據,反而影響了結果的判斷。

通過以上的案例,大家應該理解了兩者的區別。

算法一我們可以稱之為七日日留存,算法二為七日內留存。

當然,存在既有合理性,算法二并不是沒有適用場景,針對一些用特定使用周期的app就更適合,例如某app是專注于周末轟趴,活躍用戶大部分聚集在周六和周日,我們如果去計算工作日(周一至周五)任一天的新增用戶七日日留存,會發現明顯偏低于周末。

針對這種情況,我們只看第七天的日留存顯然不能反應真實情況,反之,關心七日內的留存就更為真實可靠。

那么,宋老濕還是以友盟數據平臺一組七日留存的表格,大家可以嘗試看下友盟采用的是算法一還是算法二。

有些朋友可能有些摸不到頭腦,有些朋友直覺可能覺得友盟用的是算法一。實際上,友盟平臺計算方法和算法一很相似但有些許不同。我們暫且稱之為算法三。

算法三

(第七天的留存用戶數/第0天的新增用戶)*100%。

這個第0天其實指的就是計算留存的當日,和算法一中的第一天指的是同一天。如上圖所示,如果計算2018—08—01的七日日留存,則算法一中的第1天和算法三中的第0天都是指的08-01的新增用戶數339人。再仔細看上圖會發現,友盟統計時采用1天后,2天后對應就是算法一中的第二天與第三天。

那么友盟為什么采用算法三,這樣計算有什么好處嗎?希望大家動腦子想一下。

(這里給一個提示:和一周七天有關聯)。

揭曉答案:這是因為采用算法三我們可以規避星期對數據的干擾。

舉一個例子,2018-08-01是星期三,采用算法一的第七天則是08-07星期二,算法三則是七天后08-08星期三,這樣同時用星期三的數據,就可以合理規避今日是周幾對數據的干擾。

那么我們一共講了三種算法,每種算法都有其存在的意義,具體的要根據自己公司業務進行選擇,保證公司內部采用同一種標準即可。

這里,宋老濕給大家做一個表格進行總結,大家可以保存圖片備用。

基于此,新增或和留存咱們是聊得差不多了。大家應該會有種毛塞頓開的感覺。

下一期,具體主題宋老濕可能會繼續聊一些數據指標,也可能會聊一些UI設置的基礎。敬請期待。

 

作者:宋老濕,公眾號:產品經理吐槽喵,一個有溫度的公眾號 互相學習交流進步

本文由 @產品吐槽喵 原創發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 這個悲催的app不會是真實的事情吧,不會是?——

    來自江蘇 回復
    1. secret

      來自河南 回復
  2. 寫的真好。talkingdata 也是第三種計算方式。

    來自廣東 回復
    1. 感謝

      回復
  3. 請問入門的話到底怎么分析這些數據?訪問人數越來越多,總收入越來越少,我都不知道從哪塊數據開始分析。。。

    來自北京 回復
    1. 這個要具體問具體分析

      回復
  4. 假設某月1日新增用戶1000,是不是代表當日活躍就是1000呢?有沒有可能活躍人數是900(少于1000)的情況?

    回復
    1. 新增的定義和活躍的定義不同 看你怎么定義活躍
      例如你認為有了某種用戶行為才算活躍 那么就可能出現你說的情況

      回復
  5. 感謝老師的分享!

    來自北京 回復
    1. 感謝您耐心的看完 希望對您有用

      來自河南 回復
    2. 更新新文章了

      來自河南 回復
  6. 所以分別是 七日日留存、七日內留存、七日后留存?

    來自上海 回復
    1. 名字不同要 主要還是業務場景

      回復
  7. 老哥,是時候更新一發了! ??

    來自河北 回復
    1. ??

      回復
    2. 更新新文章了

      來自河南 回復
  8. 好像看不到文章里的圖呢,期待繼續更新~ ??

    來自美國 回復
    1. 我測試了下 可以看到

      回復
    2. 更新新文章了

      來自河南 回復
  9. 期待第三集,什么時候更

    來自廣東 回復
    1. 盡快哦 很開心文章對您有幫助 訂閱點贊收藏是我更新的動力 筆芯

      回復
    2. 已更新

      來自河南 回復
    3. 已更新

      來自河南 回復
  10. 很棒 小白容易理解

    回復
    1. 如果對您有幫助
      訂閱加贊 收藏素質三連來一波

      回復
  11. 優秀

    回復
    1. 互相學習

      回復
    2. 更新新文章了

      來自河南 回復
  12. 數據小白一枚,期待更新~

    來自浙江 回復
    1. 催更是可以的 訂閱收藏加贊不來了三連嗎 小姐姐

      來自河南 回復
    2. 更新新文章了

      來自河南 回復
  13. 入門,普及的挺好

    來自安徽 回復
    1. 共同學習 謝謝認可 就是普及下數據指標的基礎

      來自河南 回復
    2. 更新新文章了

      來自河南 回復