小白學數據分析—留存率是什么?
在網站分析、電商分析、網游分析中,對于留存率的關注度極高,這一浪潮隨著APP應用、社交游戲的火爆逐漸成為一個很重要的衡量準則,也甚至有了40-20-10準則。對于這個準則不予評價,今天就是簡單說說留存率就是是個什么玩意。
留存率顧名思義,就是留下來存在的比率。從時間上我們分為次日、三日、七日、14日、30日、90日、180日。從用戶上來分,有新登用戶和活躍用戶兩大類。但是我們大多數是關注時間次日、三日、七日,用戶是新登用戶。下面具體說說這些個概念以及為什么是這樣定義形式。
次日留存率:新登用戶在首登后的次日再次登錄游戲的比例;
3日留存率:新登用戶在首登后的第三天再次登錄游戲的比例;
7日留存率:新登用戶在首登后的第七天再次登錄游戲的比例。
以此類推計算下去就得到了N日留存率。
在此圖中,我們看到7日新登用戶在8日登錄的為次日留存用戶,9日登錄為2日登錄留存用戶……這就是留存基本定義,所謂留存率就是留存用戶/新登的總量。留存率反映的實際上是一種轉化率,即由初期的不穩定的用戶轉化為活躍用戶、穩定用戶、忠誠用戶的過程,隨著這個留存率統計過程的不斷延展,就能看到不同時期的用戶的變化情況。
之所以是這樣,是因為留存是以研究新登用戶為目標對象的,即我們研究某一個點的一批用戶在隨后的十幾天,幾周,幾個月的時間內的生命周期情況,這樣的意義是從宏觀上把握用戶的生命周期長度以及我們可以改善的余地。
因此這里就引申出一個問題,我們為什么要研究的是新登用戶?如剛才所說的,我們要宏觀觀察用戶的生命進程情況,那么我們最佳的辦法就是從用戶導入期就開始,所謂導入期就是用戶進入游戲,這個地方我們的分析其實大有作為的,因為用戶進入游戲時來源于不同的渠道,通過不同的營銷手段拉入游戲,這樣我們交叉分析,通過用戶的后期留存情況就能從一個層面把握渠道質量,比如,付費,粘性,價值量,CAC成本。
那么說到留存就不得不提到另一個詞就是流失,有句話我一直覺得有點道理,就是新用戶看留存,老用戶看流失,但是從目前我們看到的一些分析系統上似乎這部分都沒開發或者省略,因為這部分的難度相對而言比較大,再者,其改善帶來的效益不是立竿見影的,因此我們似乎很多時候是忽視了對老用戶的質量把控和分析。因為老用戶在整個用戶的生命進程中是屬于衰退期和流失期要關注和解決的問題[實際上從進入游戲就伴隨流失,此處只是點了一部分],關于流失這里不再多講。
剛才說到留存和生命周期扯上關系了,為什么這么說,我們來看看下面的曲線。
這里截取了4天首登用戶在隨后接近40天的留存變化情況。
上圖是跟蹤了39天的數據,我們發現留存率的變化初期是震蕩的比較厲害,但是隨后開始逐步的趨于平穩,下一個時期就開始逐漸穩定,保持在一個水平上,如果持續觀察下去,隨后開始逐漸的衰退,并最終無限趨于0。
事實上,以上的過程是符合用戶生命周期的基本形式,用戶在導入期用戶量會增加很多,一段時間內如果我們渠道和手段得當,用戶初期的幾天留存質量會很好,之后隨著用戶的游戲內等級成長,那么就會逐漸淘汰一些人[實際上就是留存下降,流失加劇的過程],在用戶的成長過程中,這樣的留存犧牲是必然,而此時的淘汰就意味著接下來的用戶成長將會趨于穩定,并保持一個時期。
以上我們所說的三個時期,也就是震蕩期[留存高]、淘汰期[留存波動]、穩定期[留存趨于穩定水平],隨后的衰退期和流失期那就是流失率分析的部分,因為這個階段用戶留存下的基本就是老用戶了,當然此處不是說前三個時期的用戶就不需要流失分析,相反用戶導入初期的階段[如果擁有足夠的信息],正需要去做流失分析,因為初期流失是最多的。但是由于初期用戶參與游戲的參與度有限,提供的信息也是有限的,偶然因素見多,所以就選擇做留存分析。
一般來說留存率這類指標是需要長期持續跟蹤的,且要根據版本更新,推廣等諸多因素結合起來分析,試圖去找到玩家的最佳周期進行制定相應的策略提升質量。
此外留存率的分析可以結合聚類,決策樹等做進一步的深入分析,用于挖掘渠道具體的用戶質量,盈利分析等。這類的深入的分析首先是要建立長期的留存率跟蹤分析的基礎上進行的,抓住留存率長期的作用特點,才能更好的把握這類深層次的分析。
最后說一句,至于是不是出于穩定期,這個得自己很好的把握和衡量,必要的時候對于變化趨勢做一下顯著性檢驗也可以檢驗一下。
作者:小白學數據
來源:http://www.cnblogs.com/yuyang-DataAnalysis/archive/2012/08/17/2644318.html
??