怎樣合理地定義用戶流失
很久沒有更新博客了,這篇再寫一些關于“用戶流失”的內容,之前發(fā)布的網站的活躍用戶與流失用戶這篇文章對網站的活躍用戶、流失用戶及新用戶流失做了定義,這里修正下對流失用戶的英文叫法,一般對流失用戶常用的英文為“churn user”,之前用的wastage、away、lost等都不是太規(guī)范。后來陸續(xù)有做相關分析的朋友問到流失用戶的流失時間長度到底選擇多長是合理的,尤其是《網站分析實戰(zhàn)》這本書出版之后,我在里面有提到如何更準確地定義流失的時間長度,可能解釋的比較簡單,還是有朋友留言反饋這方面的問題,所以這里再用一篇文章解釋一下。
流失用戶與回訪用戶
流失用戶的定義請參考“網站的活躍用戶與流失用戶”這篇文章,要解釋怎么樣合理地去定義用戶流失時間段長度的問題,需要先介紹一個新的指標概念:回訪用戶。這里的回訪用戶不是指Google Analytics上面的Returning Visitor(與新用戶相對,指之前訪問過網站的用戶再次訪問網站),這里的回訪用戶指流失之后再次訪問網站的用戶,即用戶曾經流失過,滿足流失時間期限內完全沒有訪問/登錄網站的條件,但之后重新訪問/登錄網站。然后,根據回訪用戶數(shù)可以計算得到用戶回訪率,即:
用戶回訪率 = 回訪用戶數(shù) ÷ 流失用戶數(shù) × 100%
回訪用戶率的數(shù)值大小間接地可以驗證對用戶流失定義的合理性。正常情況下,用戶的回訪率應該是比較低的,從業(yè)務的角度考慮,如果對流失的定義是合理的,那么很難讓那些對你的網站已經失去興趣的用戶重新來訪問你的網站。一般情況下,網站的用戶回訪率應該在10%以下,在5%左右的數(shù)值是比較合理的,對于成熟的網站而言用戶回訪率會稍高,而新興的網站的用戶回訪率通常更低,尤其像手機APP這類用戶易流失的產品。
流失期限與用戶回訪率
用戶流失的流失期限的長度與用戶的回訪率成反比,我們在定義用戶流失時使用的連續(xù)不訪問/登錄網站的期限越長,這批流失用戶之后回訪網站的概率就會越低,并且隨著定義的流失期限的增大,用戶回訪率一定是遞減的,并逐漸趨近于0。那么如果選擇合適的流失期間長度?我們可以設定不同的流失期限長度,進一步統(tǒng)計每個流失期限的用戶回訪率,并觀察用戶回訪率隨定義的流失期限增大時的收斂速度。如果以“周”為單位設定流失期限:
根據設定的不同流失周期的用戶回訪率的變化曲線,我們可以使用拐點理論(Elbow Method)選擇最合適的流失周期。
拐點理論:X軸上數(shù)值的增加會帶來Y軸數(shù)值大幅增益(減益),直到超過某個點之后,當X增加時Y的數(shù)據增益(減益)大幅下降,即經濟學里面的邊際收益的大幅減少,那個點就是圖表中的“拐點”。比如上圖中流失周期增加到5周的時候,用戶回訪率的縮減速度明顯下降,所以這里的5周就是拐點,我們可以用5周作為定義用戶流失的期限,即一個之前訪問/登錄過的用戶,如果之后連續(xù)5周都沒有訪問/登錄,則定義該用戶流失。
所以,有個這個辦法之后,就能更加合理地定義流失用戶的統(tǒng)計邏輯,而之前要做的就是選擇不同的流失期限分別計算用戶的回訪率,然后用統(tǒng)計的到的數(shù)值生成如上的一張帶平滑線的散點圖,問題就迎刃而解。
via:kdd china
不能一概而論,要看具體產品,B端和C端產品也不一樣。
我覺得吧,有行業(yè)共識的就用共識,跟龍頭企業(yè)看齊。
沒有行業(yè)共識的,就自己去試,7天,8天,9天……n天
但是!有可能7天流失回訪率是5%,14天流失回訪率是20%,而30天流失回訪率也是5%
我覺得重點是搞清楚一個人產品的流失到底怎么定義,有哪些關鍵指標。定義之后再去看滿足定義的用戶的準確率是多少,
回訪的時間要設置多久才好??時間太長是不是也不太合理?因為回訪時間不同也不好比較
專程為這篇文章注冊回復。
根據用戶回訪率來定義流失,但是用戶回訪率=回訪用戶數(shù) ÷ 流失用戶數(shù) × 100% ,流失沒有定義,怎么計算回訪率?
同為這篇文章注冊的。。
個人理解,作者說的回訪率,按作者的意思,若以1周7天為流失周期,其實就是某天活躍的用戶中,連續(xù)7天沒用產品但第8天又使用了產品的用戶有多少;若以2周為流失周期,則指某天活躍的用戶中,連續(xù)14天沒用產品但第15天又使用了產品的用戶有多少……依次類推。所以實際上,這個方法找出來的天數(shù)(或周數(shù)),就是可以涵蓋大部分用戶任意2次登錄時間間隔最大值的天數(shù)。所以若直接統(tǒng)計登錄時間間隔的分布,找到這個天數(shù)會方便的多。作者的思路是正確的,可能表達得有些繞彎
有一個問題,用戶回訪率不一定是一直下降的,因為回訪用戶和流失用戶隨著流失最大期限的增大是同時下降的,其比值很可能增加。這個方法感覺在稀疏數(shù)據上不可行~
大量數(shù)據面前比值也有增加的可能。PS:稀疏數(shù)據在做任何分析的時候都不是很可行,數(shù)據只有在大量的時候才有意義,小量數(shù)據有片面性,