無腦帶你遍歷用戶生命價值與流失挽救(下):流失分析與產品化
編輯導語:在上篇文章中,作者從三個方面展開了分析,告訴我們當用戶逐漸流失時,企業應該怎么做。在這篇文章中,作者又從價值與流失的分析角度出發,為我們做出了更進一步的探討,希望看后對你有所啟發。
之前發過一篇文章的上篇,《帶你遍歷用戶生命價值與流失挽救(上) : 流量下的價值套路》,主要是用一個短視頻的案例來做分析,闡述了用戶價值體系。
本文下篇,將從價值與流失的分析角度來做一些分享。
本文涉及到的知識點有:用戶生命周期、流量方向的分析方法論、用戶分群、用戶挖掘、算法、渠道歸因、拉新、端承接、運營、產品等。
除了遍歷這些知識外,文章的核心部分是關于兩個數據產品的,關于數據產品方向文章沒有做更多闡述。
一、用戶水池與流失
關于流失與召回,這個是長久不衰的一個話題。
在業務活動中,涉及到的角色還是蠻多的,比如產品角色、運營角色、數據分析角色、甚至渠道市場角色都有。
本文將從數據分析的角度來探索一個關于流失的業務場景,以及通過驅動運營、投放等一系列的動作來應對流失挽救,這些落地就成為一個系統化的工作。
曾經繁榮的第三方應用市場,這幾年前來逐漸走向沒落。從百度巨資吞了 91 助手,到應用手機廠商崛起達到頂峰,整個應用市場已經經歷過多輪洗牌。
“莢,再見!豌豆莢、PP 助手宣布下架,從此再無免費軟件?” 你是否還記得豌豆莢這些應用?它們也曾在繁華的第三方應用市場里激起過一點浪花。
到現在,不管是應用寶、360 手機助手、華為、小米等應用商店,都在構建自己的城池。
記得在 2016 年左右一個拓新的成本從之前的幾塊錢升到 10 塊錢、最高時能到幾十元,留住老用戶或許一條短信、一點積分、活動就可以,相對的成本是很低廉的。
從用戶生命周期與成本來講,留住老用戶的成本與拓新的成本是完全不同的。留住老用戶的成本之所以很低,是因為老用戶知道套路,而新用戶對套路無感且教育成本就很高了。
運營的同學在每日面對剛涌進來的、將要離開的、已經離開的這幾個類型的用戶還是很頭痛。一邊是通過渠道拼命買量拉來的新用戶,一邊是保持耿直不變或緩緩下降的DAU曲線。
如果把每日 NU 數據曲線疊加到 DAU 上,從這個DAU曲線緩緩下降的趨勢來看,每日的 NU 增量或許大幾十萬,每日不活躍用戶也是大幾十萬或上百萬。
從數據的表現來看用戶的新增與流失相當,一邊是花錢買量,一邊是留不住用戶,如果趕上產品、業務、環境形勢問題,更是一個讓人心碎的問題。
下圖中給出的是 2016 年某個第三方應用市場的日 DAU、次日留存、7 日留存的的數據情況, 從數據上明顯看出來,這個 Android App 的 DAU 量級在短短幾個月中一直抖動著下滑。
結合數據來看,每周的 WAU 中有千萬級別的用戶,但是在一周內 AU 角度流失的用戶占比為 30%,在 LU 中流失的比例為 50%以及以上。
從每月的數據來看,50%以上的 AU 將會最終流失掉,LU 的流水占比也是在 50%。
用戶不斷的流失,就像水池的水位不斷的在下降,用戶流失超過新用戶的補給,且速度越來越快、規模越來越大。
如果不做任何動作,這個水池遲早會干枯。就像前面說的,很多業務都會面臨類似的問題,這種問題不管怎么樣都是要解決的。
二、如何解決
1. 先來看幾個問題
- 挽救了這些用戶對業務有什么好處?
- 流失的用戶都來自哪里?
- 流失的用戶都會有什么先兆?
- 在資源有限的情況應該挽救哪些用戶?
如果能夠解決上面的事情就已經夠了嗎?實際上還是不夠的。
2. 還需要
- 需要清晰的知道用戶長的樣子。
- 通過哪些角度來刻畫流失用戶,各群體用戶中流失用戶的規模都是多少?
- 用戶流失的可能性有多大,如何第一時間發現征兆?
- 發現征兆后如何挽救?
- 該如何形成自動化流失與挽救呢?
差不多需要將以上的問題都回答了,才可以把流失問題認識的清晰一點。
三、流失與深度挖掘數據據價值
要研究這個課題,首先需要定義什么叫流失用戶、活躍用戶、新用戶流失。
這里簡單的引用一篇文章,是在 2012 年發表的一篇名為《網站的活躍用戶與流失用戶》 這一篇講述的非常清晰:
活躍用戶:這里是相對于“流失用戶”的一個概念,是指那些“存活”著的用戶,用戶會時不時地光顧下網站,同時為網站帶來一些價值。同時,我們還需要知道到底有多少用戶可能已經拋棄了我們的網站,不可能再為網站創造任何的價值,也就是所謂的流失用戶。
流失用戶:是指那些曾經訪問過網站或注冊過的用戶,但由于對網站漸漸失去興趣后逐漸遠離網站,進而徹底脫離網站的那批用戶。當然,一個網站一定會存在流失用戶,這是網站用戶新老交替中不可避免的,但流失用戶的比例和變化趨勢能夠說明網站保留用戶的能力及發展趨勢?!?/p>
這里我給出的公式就是:
當前時間點 – 用戶注冊時間點 > 流失臨界時間間隔
結合本案例,我們要研究是移動互聯網 App 方向,可以用 “當前時間點- 用戶首次安裝且激活時間點> 流失臨界時間間隔”,這個時間拐點是需要通過分析來得到的。
例如下圖的流用戶流失高風險是在第 20 周至第 25 周,至于本次案例講解的 APP 的流失時間拐點,同理的分析方法可以得到的
有次團隊里數據同學做用戶分群,遇到了幾個糾結問題,比如該如何分群,分群的意義,分群該從哪個角度入手,如何將流失率等計算出來,是否要細化到個體去做挽救等等。
舉個例子來說,我們在研究用戶流失、用戶使用的那些產品有什么特點、用戶看了什么內容、搜索了什么、消費了什么這些問題的時候,換一個角度來說就是在研究用戶-產品-內容三者之間的關系,拿人、貨、場理論來套用也是沒得挑。
拿第三方應用分發這個業務來說,用戶安裝了第三方應用市場, 使用這個應用市場App的搜索、推薦、信息流、搜藏、 自動更新、備份等,來尋找自己的需要的App。
這個過程從人貨場來解析就是:
- 人:就是用戶
- 貨:一切內容就是App
- 場:第三方應用各種功能場景
從BI的分析模型角度來講,這里研究的幾個關系的意義:
- 用戶、產品、業務內容之間關系來講,可以從高低風險的的角度來刻畫不同的流失用戶群。
- 理清用戶、產品、業務的價值邊界,讓產品功能定位更清晰。
- 在內容定投上,結合用戶畫像與標簽,可以在前期分析發現用戶顯性特征、群體特征,用作小流量定投效果測試。
做用戶研究的課題時,切入點還是蠻多的,比如從業務黏性、用戶屬性、正負用戶體驗、用戶活躍度等角度進行切入。但之前肯定會梳理一個比較完整的鏈路來盤點這個事情。
例如:對某包月業務的用戶盤子價值做個分解,拉新用戶、增加已有價值、減少流失。
有時在第一次做用戶分群時通常切入的點有流失用戶群體的研究、活躍用戶群體的研究、新用戶群體的對比研究,這幾個切入點流失用戶群體的研究成本是最低的,可能帶來的效果是最好的。
切入流失分析流程后,關于流失挽救的過程,網上相關的文章多的數不清,大多數都是些基本必備與固定流程:
- 流失用戶的定義
- 畫像數據的準備
- 流失模型的搭建
- 分析流失數據找到特征
- 建立流失壁壘
- 開展召回以及活動
把這個流程整理一下就是這樣的:
1. 畫像構建
有些人不喜歡一上來就開始構建用戶畫像,因為畫像都是一堆標簽,畫像一般按業務屬性劃分多個類別模塊。
因為每一個標簽都要經過大量的分析與挖掘,到實際可應用時的周期還是漫長的。標簽的精準度與覆蓋度也經常受到訓練的數據所影響,有時會準備很多畫像的基礎變量來做更多不同角度研究。
隨著自己對業務的分析與拆解,然后可以加入更多的基礎變量來參與到模型研究中。
關于用戶的pv行為、用戶點擊行為、用戶的播放行為,我會做更詳細的分片拆分,這樣能得到更多顯著特征與更多特征。當然在某個地方可以叫做連續變量的區間化。
當然,大部分情況下會存在一個比較成熟的畫像體系,比如常見的人口統計、社會屬性外,還有用戶消費畫像、用戶行為畫像,用戶興趣畫像等。
人口屬性和行為特征是大部分互聯網公司做用戶畫像時會包含的:人口屬性主要指用戶的年齡、性別、所在的省份和城市、教育程度、婚姻情況、生育情況、工作所在的行業和職業等。行為特征主要包含活躍度、忠誠度等指標。
2. 模型準備階段
模型算法與標簽還是有一些關系的,不同的算法可以用在不同標簽中。
監督算法中會用到logic 回歸、c5.0決策樹、svm算法、最優算法、神經網絡、矩陣算法。非監督類的,聚類、離散統計分析、隨機游走、小波/F變換,這些算法用在哪些標簽會更合適的,給出一個很明確的圖(整個訓練過程就不進入深談)。
從另外一個角度來看一下這個體系這個會顯得很直觀:
3. 流失模型
在分析中會選擇一個用戶樣本進行觀察與分析,在流失模型中選擇每一個變量參與到模型計算都是需要做不同的評估的。
例如:用戶基礎屬性中年齡、App使用時長、興趣標簽、上網行為、手機品牌等,這是從模型角度要考慮的變量,通過找到的一些線索,分析不同用戶群體在這些標簽上有什么屬性,從而識別哪一類用戶忠誠度比較高。
流失模型里面不做更多討論,圖示給出流失模型中的某一個節點判斷。
4. 人群的分析
經過反復的分析以及定量與定性的分析與刻畫,可以從流失角度對用戶分群進行定量描述。
每一個分群除了含有流失的描述外,還有很多其它相關顯著屬性來進行刻畫,再進一步根據分群的用戶特征來做下一步的業務活動。
例如 :第三方應用分發這個業務,根據特征可以劃分為十幾個用戶群體,其中有兩個群體可以定位為低活躍低黏性、易流失搜索用戶群體。
低活躍低黏性的群體顯著特征是一日游用戶很多,都是新安裝的用戶過來看一下就離開了(不排除有潛在的作弊用戶可能性)。
這個用戶的特征是很多用戶有click 響應、95%的用戶沒有安裝任何工具類App或游戲類的App(猜測一下,這個來看新機或潛在作弊刷量可能,或被其它的APP或升級功能引導到這個應用市場,也可能中間被渠道截胡了)。
有了這些定量描述后,可以群體的定性刻畫與業務上的觸達動作。
5. 用戶觸達及渠道評估階段
下圖給出的三個易流失用戶群體的定量描述,有了這些定量描述與群體規??梢栽跇I務上做些事情。
能做什么事情呢?
針對這些用戶群體指定不同的觸達文案、觸達活動頁面與內容,然后再選擇比較合適的通道,像站內信、APP push、短信、電子郵件、成本更高的電話回訪等一系列手段,進行用戶觸達拉活等,過后再進行效果的評估。
比如這三個群體、低活躍低黏性、易流失搜索、邊緣性型三個群體,需要開始做用戶觸達, 考慮成本,在用戶觸達的方案上選擇了Push的方式來做流量測試。
相比較產品改造的風險和開發時間,Push有著快速驗證的優點。
與此同時,為了控制影響,避免騷擾正常用戶,在Push投放時,一個用戶最多只能收到一條,那么可以對流失風險較高的用戶進行投放。
投放結束后需要總結,從啟動率的比較、Push CTR% click ctr%等一系列角度進行分析并輸出相關結論。
當然這個過程只是針對不太啟動的用戶群體做Push拉活,也還有很多的其它抓手與觸點需要與用戶做更多的作用,才能達到想要的結果。
例如在已經曾經值得紀念那款第三方的APP分發平臺,從運營入口、內容入口、產品入口分別盤點出來的所有渠道資源與觸達給用戶的內容,可以參考一下, 這塊業務沒什么可以做深入分析了。
到此,從流失到挽留的一個比較簡單的完整動作就此結束了。
現在很多App的前后臺都支持在線的定向投放、小流量測試、a/b測試等一系列測試功能,對于觸達用戶拉活還是有特別大的幫助。
總結一下,用戶生命周期中的數據驅動,因為涉及到產品運營、數據分析與挖掘、用戶運營,在分工上每一個團隊關注的重點必然是不同的。
6. 用戶流失與數據產品化
數據分析與挖掘,是要研究消費用戶群體、建立流失指數、沉淀回流拉動目標群體圈定與用戶分析等。
這樣可以給業務一個瞄準器,可以讓大家知道需要觸達哪些用戶、什么時間節點觸達、以什么樣的活動可以觸達。
同時也能給業務傳遞一套比較客觀與科學的上線評估體系,而不用業務自己上線、自己評估、自己說了算( 例如:有的業務會觀察組對照組都搞的不對,這種潛在的小故障是不在少數的)。
通過數據分析與挖掘,拿到了瞄準器與打擊節奏,接下來就是要解決武器與打擊地點的問題,結合產品運營方向、用戶運營方向,從產品的運營內活動、Push渠道不同內容推薦、產品優化與完善的的角度就是要解決用什么手段觸達用戶了。
我在針對這個方法論提煉一下就是如下圖所示:
有了場景、方法論,我們的數據產品經理就有空間去到更多的系統化與產品化,將這整個過程從體系化的角度進行泛化,讓更多的前線運營、產品運營同學參與工作。用一個通用詞來說就是”賦能“給他們。
這個賦能過程是要從”探索“和”效果評估“的體系化來規劃,還需要加上觸達資源庫管理與用戶分群變量管理,講到這里或許一些懂這個方向產品的讀者已經能夠構思這款產品該是個什么樣子。
如果展開講,共有六層是要思考:
- 底層就是需要數據的支持,需要用戶畫像、標簽支持,切入點就是要很容易的添加補充與管理很多標簽。
- 模型支持層就是有各種算法模型的可視化與非常容易的組織,做好更多興趣標簽的挖掘與管理,切入點就是探索與輸出更多的模型。
- 用戶分群層,就是根據變量進行人群的細分與各種角度角度刻畫,切入點就是定向人群分析、人群差異化分析等等。
- 策略層,支持人工運營、人工調整,自動化的調整等, 切入點就是系統化與人工方式。
- 內容層, 包裝了大量的個性化內容專題、促活的運營活動、文案引導模板等等等素材庫,切入點就是產品化策略優化,運營的策略固化。
- 觸達渠道層,就是要從用戶路徑角度盤點清楚運營入口、內容入口、產品入口等觸達點能夠很容易的觸達到用戶, 切入點就是產品、運營資源庫的各種內容。
如下圖所示:
這個架構產品化后,會給業務的生產效率帶來很大的提升(這里只是放了一個核心圖),跟這款產品有關的其它的知識等內容不在這里做闡述與分享。
四、寫在最后
在寫完這篇文章后,發現與自己最開始列的大綱還是有很大的差異。
原計劃是寫一個完整的流失分析,在整理過程發現所牽涉的知識面還是非常廣的,也讓自己整理了很多項目的材料,并對這些材料進行了脫敏處理。
這個文章可以給業務一些參考,也可以給分析師一些分析方向上的參考,同時可以給數據產品經理一個從業務到模型到數據產品的規劃參考。按照慣例,里面涉及到的很多案例不做更詳細的解釋,如果有感興趣可以私下交流。
上篇回顧:帶你遍歷用戶生命價值與流失挽救(上) : 流量下的價值套路
作者:松子(李博源),自由撰稿人,數據產品 & BI 資深總監。公眾號:songzi2016。
本文由 @松子 原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
好文。對業務做了一定抽象。我現在就是需要這樣的輸入。沒有業務基礎,做這款產品的確有些難度。