如何通過數據找到影響用戶留存的關鍵因素
編輯導語:伴隨著流量紅利見頂的現狀,除了做好拉新促活之外,品牌商家還需要思考怎么提升用戶留存率,做好精細化運營。而在進行用戶留存分析時,數據分析是一個有效手段。本篇文章里,作者結合自己的工作經驗,總結了一些可借鑒的留存分析方法論,一起來看一下。
寫在前面
根據QuestMobile數據顯示,2021年中國移動互聯網用戶規模保持在近11.6億,2021年5月同比增速竟首次出現負增長,這意味著流量紅利時代結束,進入存量爭奪階段。而互聯網不同賽道的玩家,也不得不把突破增長困局的關鍵點,放在如何提升存量用戶的留存價值上。
在該背景下,作不甘淪為取數工具人的分析師,可以主動深入業務,通過海量數據挖掘出影響用戶留存的關鍵指標,并結合業務邏輯,給出合理可行的建議。
接下來筆者會分享自己在工作中沉淀的一些留存分析方法論,給大家奉獻滿滿的干貨,別走開,精彩馬上來~
分析框架:
- 確定流失和留存的具體口徑;
- 通過定性和定量等方法尋找與用戶留存相關的指標,并設計相應策略;
- 設計AB實驗,檢驗留存提升策略的有效性。
一、確定留存的具體口徑
首先要結合用戶行為數據,或者基于業務常識,和業務人員對流失或者留存用戶的口徑達成一致。口徑的確認點主要是:【多久(窗口期)】內沒有發生【什么關鍵行為】會被定位為流失。。
1)關鍵行為
不同業務模式下的用戶核心行為不同,比如對于交易平臺,關鍵行為可能是下單;對于短視頻平臺,關鍵行為可能是播放視頻;對于工具類APP,關鍵行為可能是啟動APP。
2)窗口期
窗口期的長短取決于,用戶關鍵行為的發生頻次高低。比如車主用戶一般每隔14天加油一次,因此14天可以作為窗口期。
可以基于用戶相鄰兩次關鍵行為天數間隔的75%分位數的方法確定窗口期的大小。比如,選取昨日發生過關鍵行為(比如下單、或啟動APP)的用戶作為研究對象。分析這些用戶最近兩次關鍵行為發生的間隔天數。如果75%用戶的間隔天數都在 xx 天內,則 xx 天可以作為流失行為的窗口期。
二、影響用戶留存的相關性因素分析
1. 搭建影響用戶留存的指標體系
可以選取用戶靜態畫像、活躍行為類指標、付費行為類指標、以及其他核心行為類指標作為指標體系。也可以參考用研團隊針對流失和留存用戶的調研結果,為指標體系搭建提供新的思路。
一般的,用研團隊對流失和留存用戶的調研提綱如下:
- 流失用戶:調研其年齡、性別、職業、城市、圈層等社會學畫像;深度挖掘其為什么流失的原因;回歸意愿如何;以及流失的去向是哪里;他們對競品和本品的使用體驗差異點在哪里。
- 留存用戶:社會學畫像; 留在本品的核心驅動力;通過什么方式被吸引到本品;來源渠道。
巧婦難為無米之炊,數據是分析師必備的武器。用戶調研結束后,數據分析師要嘗試對調研結果中用戶強烈吐槽或者十分滿意的功能體驗,盡可能抽象成可觀測、可度量的數據指標。
比如用戶吐槽刷到內容平臺 APP 廣告太頻繁,可以將廣告性質內容的曝光次數作為指標,納入下一階段的定量分析中;用戶認為平臺最大的優勢在于有金幣領取,可以將金幣等指標體系納入定量分析中。
2. 影響留存的重要指標篩選
影響用戶留存或者流失的因素非常多,需要從眾多指標中篩選出重要度較高的幾個指標。以下有兩種方法可以提供參考。
1)相關性分析
選出與留存率相關性系數較高的前幾個行為,作為關鍵行為候集;同時還要考慮發生該行為的用戶的滲透率高低、留存率提升幅度的高低,即要保證最終的留存人數處于較高的水平(留存人數 = 人數*滲透率*留存率 )。
假設某個社交媒體平臺 APP ,流失用戶被定義為近7日未啟動APP的用戶。影響留存的指標、各指標與留存率間的相關系數、行為滲透率、留存率提升幅度見下表(具體數值均為模擬數據,請勿參考)。
從上面的四象限圖可以發現,播放短視頻、金幣頁面訪問等行為的滲透率較高,且留存率提升幅度也較高,因此可以作為影響留存的關鍵行為候選集。
2)基于各類樹模型
各類樹(決策樹、隨機森林、GBDT等)模型訓練結束后,可以輸出模型所使用的特征的相對重要度,可以解釋哪些因素是對預測有關鍵影響,因此可以幫助我們快速找出對用戶留存影響度高的關鍵因素。
① 特征選擇
- 用戶畫像類特征(年齡、性別、城市、手機品牌、手機型號、平臺角色、是否安裝競品、競品APP安裝數量、新增渠道類型);
- 活躍類標簽(近 7 天APP啟動次數、近 7 天APP使用時長、近 7 天活躍天數、首次活躍距今天數、末次活躍距今天數);
- 消費類行為標簽(近 7 天內容曝光次數、近 7 天內容點擊次數、近 7 天內容播放時長);
- 互動類行為標簽(近 7 天點贊次數、關注次數、評論次數、轉發次數、收藏次數);
- 付費類行為標簽(近 7 天打賞主播次數、打賞金額、充值金額);
- 金幣激勵類標簽(近 7 天金幣提現金額、簽到次數、得金幣數、訪問福利中心頁面次數)。
② 正負樣本構建:先鎖定特定日期范圍(比如 2021.07.01-2021.07.07)的活躍用戶,根據其是否在后續7天(2021.07.08~2021.07.14))活躍來劃分正負樣本。
- 正樣本:留存用戶,即前7-14日(2021.07.01-2021.07.07)啟動過APP,近7日(2021.07.08~2021.07.14)啟動過APP的用戶;
- 負樣本:留存用戶,即前7-14日(2021.07.01-2021.07.07)啟動過APP,但近7日(2021.07.08~2021.07.14)未啟動過APP的用戶。
③ 構建模型時的注意點
- 正負樣本的樣本數盡量保持在1:1,避免正樣本數量過少導致學習不到正樣本的信息,或者負樣本數量過大影響訓練速度;
- 模型預測效果不佳時,可以嘗試使用多種模型,比如GBDT+LR、XBoost等;
- 區分不同類型用戶分別構建模型,比如區分新老用戶、創作者用戶和消費型用戶、高低中頻次用戶等。
根據上圖(具體數值均為模擬數據,請勿參考)可以看出,近7日活躍天數、APP啟動次數、訪問時長、以及播放短視頻次數等行為指標可以作為留存的關鍵指標。
④ 特征間的相關性分析
通過對特征間的相關性系數分析發現, APP 啟動次數和 訪問 APP 時長指標之間存在很強的相關性,可以剔除其中一個指標。
至此,我們可以選擇7天內APP活躍天數、啟動APP次數、播放短視頻次數作為影響留存的關鍵指標。
根據這些指標,我們可以設計新人激勵體系,引導用戶盡可能地多完成關鍵行為。比如新用戶激活后登錄APP、播放視頻,會有積分或者金幣等形式的激勵,該激勵活動以 Push 或者站內彈窗等形式傳遞到用戶。
但是激勵活動的具體規則,比如播放視頻次數在7天達到多少,才能給到激勵呢?我們同樣可以基于數據給到建議。比如觀察第一個7天內完成不同播放次數的用戶,在下一個周期的留存率,找到留存率變化的拐點(邊際提升幅度最小的點)作為激勵規則的臨界值。
三、留存關鍵因素的因果性驗證
相關性不等于因果性,因果性的檢驗必需通過設計AB實驗驗證,并量化策略的增量效果。
比如對于金幣激勵策略,可以抽取50%新用戶作為對照組用戶,且對照組用戶無激勵活動觸達;50%新用戶的實驗組,則通過push或者站內彈窗觸達用戶。觀測對比兩組用戶在未來7天的留存率,并核算delta ROI(delta 活躍人數/金幣折算),以衡量策略的效果。
鑒于網上AB實驗如何開展以及如何評估的文章較多,該部分不再具體展開敘述。
總結
本文介紹了用戶留存相關的通用分析方法,希望能夠給大家帶來一些新的認識。但限于筆者自身知識和能力水平限制,本文難免會有考慮不周全之處,如有不同見解,希望大家可以一起討論。
本文由 @郝笑笑 原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自Unsplash,基于 CC0 協議
原封不動的抄襲?
非常干貨,牛
get it ??