數據掃盲(2):新增用戶與留存到底是啥?
對數據基本功的扎實了解,是溝通的橋梁,本文作者對常見的數據指標進行了分析,希望通過此文能夠加深你對基礎數據指標的認識。
01 新增用戶
如果大家看過咱們系列的第一篇文章:《數據掃盲(1):我們常說的DAU、MAU是啥?》應該是知道這樣一句話:
對數據基本功的扎實了解,是溝通的橋梁!
這句話是貫穿我們數據掃盲系列始終的,跟著新增用戶我們舉一個場景,大家可以再次深度感受一下這句話。
我們的運營同學為了推廣app,去找渠道商進行合作,涉及到結算錢的時候,商量以新增用戶為指標進行結算,但是對于新增用戶的具體定義,大家發生了爭執:
- 渠道商:只要用戶在我們渠道的推廣頁面點擊了產品下載按鈕,就記作一次新增用戶。
- 運營喵:那不成,點了按鈕沒下載那意義不大啊。咱們下載成功記作一次新增,且多次點擊記作一次。
- 產品狗:錯了錯了,咱們app這么牛,至少也要啟動一次記作一次,讓他們體驗下,要不然數據質量不大,不具備參考價值。
- 工程獅:都打住啊,你們這yy半天不行啊,不注冊我們后臺都沒有數據。必須注冊了才算新增用戶。
面對這樣的場景,我們很難去說對錯,我們更關心的是彼此間對于數據指標如何達成共識!
那么新增到底指的是什么呢?
我們把新增用戶進行說文解字般的拆解,新增=新+增。接下來我們需要明確兩個問題:
Q1:什么是增?在哪個節點為增?
A1:一般來說,在用戶與產品發生關系之前,往往會經歷如下圖所示路徑:
用戶通過不同的渠道銜接進入到渠道頁(例如某度廣告頁,某企鵝廣告頁);用戶在渠道頁面點擊下載或者通過渠道頁進入到應用商店下載;安裝,啟動應用,來到應用首頁;觸發相應的激活行為(不同業務激活行為不同,例如注冊成功、購買商品、亦或是觀看一次視頻等等)。
理論上不同的節點,都是可以作為一次新增,這里呢,我總結一下不同節點作為新增的優劣勢,以及適合的場景。
大家就可以根據表中總結的,結合自己公司業務選擇適合自己的節點。
Q2:怎么判斷是否為新?
A2:這個問題是由一個實例引入的,假設我們以安裝啟動這個節點作為增,一個用戶下載了某app并安裝啟動,裝了兩天卸載了,又重新安裝啟動,此時他是否算作新增用戶?這里,我們一般有兩種判斷方法:
- 基于設備:用戶第一次安裝啟動時,記錄設備。再次安裝則不記錄。其中涉及的不同系統之間(ios,安卓,web)判斷設備的門道,詳情細節可見上一篇文章《再也不怕別人問我DAU和MAU了》其中關于user部分的介紹。
- 基于賬號關聯。
以賬號作為判斷基準,和后臺已有的賬號進行比對,看以前是否存在此賬號。
02 留存用戶
本文提到的留存都是指的新增用戶的留存,下不贅述。
首先我們來看一下友盟平臺對于留存是怎么下定義的。
宋老濕還是給大家引入一個案例,來幫助大家理解定義。
案例還是一款悲催的app,上線第一天新增了100名用戶,之后就再也沒有獲取新增用戶。下面給出其上線七日的日活表:
我們由表可以得出MAU=100,這點如果有疑問,請查看數據掃盲系列文章一《再也不怕別人問我DAU和MAU呢~ 數據掃盲系列(1)》。
問題:如何計算新增用戶七日日留存?
這里給出兩個算法。
算法一:(第七天留存用戶數/第一天新增用戶數)*100%
算法二:(第二天~第七天去重后的留存用戶數/第一天新增用戶數)*100%
根據留存的定義,“某段時間內的新增用戶,經過一段時間后,仍繼續使用應用的,為留存用戶”。從中可以提煉出留存用戶是某段時間新增用戶的子集。
就本題而言,上線第一天新增了用戶100人且之后再沒有新增用戶,所以第一天之后幾天的活躍用戶都是第一天新增用戶的子集,即第X日留存用戶數=第X日活躍用戶數,第一天的新增用戶=第一天的活躍用戶。
但是,如果沒有“第一天新增100人后再無新增用戶”的前提,則第X日留存用戶數≠第X日活躍用戶數,準確表述應為第X日留存用戶數=第X日來自于第一天新增用戶中的活躍用戶。
這里有一點繞,我舉一小例子幫助大家理解一下。
(假設5月份新增用戶200,這200人在6月份啟動過應用的有100人,7月份啟動過應用的有80人,則6月份留存用戶為100人,7月份留存用戶為80人。)
那么采用哪一個算法呢?
如果您有心記得,宋老濕反復強調過:數據分析一定是基于業務的,是有目的(即留存用戶這個數據指標的意義)。
目的一般來說,留存的計算與分析有以下目的:
- 觀測不同渠道帶來用戶的質量;
- 版本更新后的新功能上線的效果反饋。(功能這一塊,會涉及到用戶關鍵行為的觸發。屬于精準留存的問題,后期文章我們會講解)
此處我們以區分渠道質量來做講解:
算法一
假設某app有兩個獲客渠道A和B,且都是1月1日上線,當日新增用戶100名之后再無新增用戶。已知兩個渠道1月1日~1月7日每日的活躍用戶的數量,用算法一【(第七天留存用戶數/第一天新增用戶數)*100%】計算分別得到兩個七日留存率。
這里可能會有一些朋友會覺得,用算法一計算忽略了2日到6日的用戶數據,這樣計算得到數據不準確。其實不是這樣的,我們獲取了兩個數據是為了進行數據對比,從對比中洞察業務爆破點。因為無論是渠道A還是渠道B,我們都只使用第一天和第七天的數據,同時忽略了2日到6日的數據,忽略的信息是一致的。
因為單一影響因素相同,所以采用算法一計算進行對比是相對公平合理的。
當然,即使這樣,可能還會有一些朋友會問那有什么辦法不忽略2日到6日的數據呢?
算法二
【第二天~第七天去重后的留存用戶數/第一天新增用戶數)*100%】這種計算方式就是把2日到6日之間的活躍用戶計算在內,但是這樣的計算方法是否適合用來評估渠道質量呢?
我們可以看下下圖是關于渠道A和B七天日活用戶的折線圖,我們嚴格按照算法二計算會得出渠道A留存率高于渠道B,實際上我們由圖可以看出渠道B的活躍用戶曲線更接近于自然平緩下降,同時第七日的活躍用戶也高于渠道A。綜合來說渠道B的用戶質量是高于渠道A。
所以用算法二來計算留存評估渠道質量是不ok的,究其原因,恰恰是引入第二日和第六日的數據,反而影響了結果的判斷。
通過以上的案例,大家應該理解了兩者的區別。
算法一我們可以稱之為七日日留存,算法二為七日內留存。
當然,存在既有合理性,算法二并不是沒有適用場景,針對一些用特定使用周期的app就更適合,例如某app是專注于周末轟趴,活躍用戶大部分聚集在周六和周日,我們如果去計算工作日(周一至周五)任一天的新增用戶七日日留存,會發現明顯偏低于周末。
針對這種情況,我們只看第七天的日留存顯然不能反應真實情況,反之,關心七日內的留存就更為真實可靠。
那么,宋老濕還是以友盟數據平臺一組七日留存的表格,大家可以嘗試看下友盟采用的是算法一還是算法二。
有些朋友可能有些摸不到頭腦,有些朋友直覺可能覺得友盟用的是算法一。實際上,友盟平臺計算方法和算法一很相似但有些許不同。我們暫且稱之為算法三。
算法三
(第七天的留存用戶數/第0天的新增用戶)*100%。
這個第0天其實指的就是計算留存的當日,和算法一中的第一天指的是同一天。如上圖所示,如果計算2018—08—01的七日日留存,則算法一中的第1天和算法三中的第0天都是指的08-01的新增用戶數339人。再仔細看上圖會發現,友盟統計時采用1天后,2天后對應就是算法一中的第二天與第三天。
那么友盟為什么采用算法三,這樣計算有什么好處嗎?希望大家動腦子想一下。
(這里給一個提示:和一周七天有關聯)。
揭曉答案:這是因為采用算法三我們可以規避星期對數據的干擾。
舉一個例子,2018-08-01是星期三,采用算法一的第七天則是08-07星期二,算法三則是七天后08-08星期三,這樣同時用星期三的數據,就可以合理規避今日是周幾對數據的干擾。
那么我們一共講了三種算法,每種算法都有其存在的意義,具體的要根據自己公司業務進行選擇,保證公司內部采用同一種標準即可。
這里,宋老濕給大家做一個表格進行總結,大家可以保存圖片備用。
基于此,新增或和留存咱們是聊得差不多了。大家應該會有種毛塞頓開的感覺。
下一期,具體主題宋老濕可能會繼續聊一些數據指標,也可能會聊一些UI設置的基礎。敬請期待。
作者:宋老濕,公眾號:產品經理吐槽喵,一個有溫度的公眾號 互相學習交流進步
本文由 @產品吐槽喵 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
這個悲催的app不會是真實的事情吧,不會是?——
secret
寫的真好。talkingdata 也是第三種計算方式。
感謝
請問入門的話到底怎么分析這些數據?訪問人數越來越多,總收入越來越少,我都不知道從哪塊數據開始分析。。。
這個要具體問具體分析
假設某月1日新增用戶1000,是不是代表當日活躍就是1000呢?有沒有可能活躍人數是900(少于1000)的情況?
新增的定義和活躍的定義不同 看你怎么定義活躍
例如你認為有了某種用戶行為才算活躍 那么就可能出現你說的情況
感謝老師的分享!
感謝您耐心的看完 希望對您有用
更新新文章了
所以分別是 七日日留存、七日內留存、七日后留存?
名字不同要 主要還是業務場景
老哥,是時候更新一發了! ??
??
更新新文章了
好像看不到文章里的圖呢,期待繼續更新~ ??
我測試了下 可以看到
更新新文章了
期待第三集,什么時候更
盡快哦 很開心文章對您有幫助 訂閱點贊收藏是我更新的動力 筆芯
已更新
已更新
很棒 小白容易理解
如果對您有幫助
訂閱加贊 收藏素質三連來一波
優秀
互相學習
更新新文章了
數據小白一枚,期待更新~
催更是可以的 訂閱收藏加贊不來了三連嗎 小姐姐
更新新文章了
入門,普及的挺好
共同學習 謝謝認可 就是普及下數據指標的基礎
更新新文章了