有一個“活性”數據,比“活躍”更重要|騰訊移動分析測評大賽獲獎作品
我所期待的,便是 “活躍天數”的一小步變革。
工具改變一個時代,或者說,時代的變革都離不開工具的變革,這或許是工具類的產品給我們帶來的最大的吸引力。
拍照工具的變革,引起了自拍的時代,而且這個時代將會一直持續下去,直到被下一個工具再次改變。
時代便是如此被工具所影響,作為產品經理而言,我們也將會被工具所影響,包括墨刀,釘釘,藍湖,石墨等等,越來越多新的工具變革在悄悄的改變著這個行業。
當然,這篇文章的主角:MTA(騰訊移動分析),也會持續發生新的變革,發揮他作為工具的使命價值,為整個移動互聯網行業帶來新的數據驅動方式。
數據驅動產品/運營,永遠不會是一個即定的目標,而是一個可持續的過程,在這個過程中,我們手中用來做數據監控,分析的工具,將會直接影響我們日常的工作,影響我們對產品走向的判斷,影響我們的決策。
最終,數據工具將會影響我們的產品是成功,或是失敗。
事實上,我對于接下來要展開講述的主題抱有十分的期待,如果能夠進入MTA的迭代排期,我將十分慶幸,能夠是這樣一款產品的受眾用戶。
我所期待的,便是 “活躍天數”的一小步變革。
1. 活躍天數概述
活躍天數是MTA比較早的一個功能了,具體上線時間未知,記憶中2017年,已經存在這個模塊了。
簡單來講,活躍天數是在統計周期內記錄用戶的登錄天數為數據對象,我們認為,周期范圍內,活躍天數越多,用戶的粘性越強,活躍天數越低,用戶的粘性越弱。
在MTA提供的Demo數據里,我們發現在2018-5-25至2018-6-1日 這7天的周期里,5-29日這一天,有兩天登錄行為的用戶占比11%,有5天登錄
行為的用戶占比5%
(由于是Demo數據,又或者是因為該模塊的設計問題,導致數據難以解讀,以上數據僅作為文章觀點闡述,不代表正式數據解讀。)
我們可以通過Demo數據來做一次簡單的解讀,該產品的用戶粘性并不是十分強,高頻用戶僅占活躍用戶的5%,而一周內,僅存在兩天登錄行為的用戶卻占比11%。
換個說法,會更容易闡述我的觀點,低頻用戶是無限接近流失用戶的,案例對象在5月29日的活躍用戶里,存在11%的用戶即將流失。
正常情況下,喜歡的將會更加喜歡,不喜歡的將會更加不喜歡,常態數據從來不是瞬間的變化,他是一個持續的趨勢,是A點到B點的一個過程。
(活動,服務器崩潰,業務異常等特殊事件會導致數據瞬間的變化,但這種變化并不是常態的,而是由事件觸發的。)
這個過程恰恰就是數據所反饋給我們的核心價值之一,常態下,人們不可能突然從喜歡變成不喜歡,一個連續使用7天的用戶 不可能突然流失,必然會經過 活躍7天,活躍5天,活躍2天 這些階段,活躍天數變化的過程,恰恰是用戶粘性變化的最好體現。
借助活躍天數,我們可以判斷用戶的粘性,產品的健康度,這更加有利于我們去打造一款深受用戶喜愛的產品。
我曾打造過這樣一款產品,在30天的觀察周期里,超過50%的用戶,活躍天數在25天以上,超過70%的用戶,活躍天數在20天以上。
這個數據表明,我的用戶對這款產品十分滿意,他們愿意讓這款產品成為日常生活中的一部分,就如同微信一樣,融入到我們的生活當中。且在不發生突發事件的情況下,會有較長的安全周期,用戶不會太快的流失。
如果超過50%的活躍天數在5天以下,我可能就會很焦慮了,因為我即將面臨一半用戶以上的流失。
2. “活性”概念闡述及應用場景
我將通過活躍天數來判斷用戶粘性的數據指標稱之為“用戶活性”,以活躍天數為基礎,輔助以加權分,得到用戶活性分,再對活性分進行等級劃分,得到用戶活性等級。
活性是一個可量化的詞,我們可以說某款產品的用戶活性高,這將會是一款非常不錯的產品,我們也可以說某款產品的用戶活性低,那這款產品就要注意了,他的用戶隨時都有可能流失。
對用戶活性進行數據量化,其價值遠超活躍數據,流失數據,留存數據,后者反饋的是一個即定的結果,而活性反饋的則是一個變化中的過程。
我相信,作為產品經理的我們,必然經歷過或者正在經歷一些數據迷宮, 他的表現形式是這樣的:
第一天,新增10000用戶, 日活20000用戶
第二天,新增10000用戶, 日活20000用戶
第三天,新增10000用戶, 日活20000用戶
第四天,新增10000用戶, 日活20000用戶
四天總共新增了40000用戶,但日活卻未曾發生過變化,我們當然可以對數據進行解讀(任何數據都是可被解讀的,盡管有時候我們難以接受)。
解讀一:來了多少用戶,流失多少用戶,產品留存有問題(新用流失:需要關聯留存率深入分析);
解讀二:新用戶的增量,和老用戶的流失持平。(老用戶流失:若用戶生命周期有限,非可持續化的產品,必然出現的場景,需要關聯用戶生命周期深入分析)
可是,真實的情況卻比以上兩種解讀要復雜的多,第一天活躍的20000用戶,和第二天的相比,并不是同一批用戶,我們并不能因為日活未發生變化,就判斷用戶流失,我們也不清楚第一天活躍的20000用戶里有多少是第二天流失了的,有多少是持續留下來的。
未能解開的謎題還有很多,我們需要一些新的數據維度,來幫我們解開這個謎題,活性不是唯一解開謎題的數據,但卻是可以解開一部分謎題的數據維度。
2.1 用戶活性等級是對活躍的精細化數據分析
我們不妨補充一些假設性質的數據,來看看會發現什么奇妙的變化,以每一天活躍用戶數為樣本,將數據進行精細化處理。
- 第一天,50%高活性等級,30%中活性等級,20%低活性等級
- 第二天,40%高活性等級,40%中活性等級,20%低活性等級
- 第三天,30%高活性等級,40%中活性等級,30%低活性等級
- 第四天,30%高活性等級,30%中活性等級,40%低活性等級
日活不變的情況下,我們可以發現用戶的活性等級越來越低了,這表示產品對用戶的粘性逐漸降低了,我們會震驚于到了第四天有接近40%的用戶即將流失,因為用戶活性等級正在持續的降低,當降低為0時,也就流失了。
2.2 活性等級變化趨勢代表了用戶粘性的變化趨勢
固定周期內,活性等級的占比變化趨勢,也能夠為我們預測活躍數據走向提供了正面的參考價值,這源于我在前文所提到的觀點“喜歡的會更喜歡,不喜歡的會更不喜歡” 。
人們對某件事物的情感變化是一個線性的過程,而非點性的變化,這一點將會給我們做產品的方法帶來本質的改變,或許,我們可以嘗試回答下列幾個問題:
- 產品/運營在什么時候去做提升活躍的功能?
- 產品/運營在什么時候去做拉新的功能?
- 產品/運營在什么時候去做提升留存率的功能?
目前,我能想象到的答案有兩個:
- A:活躍降低的時候提活,新增降低的時候拉新,流失大的時候做留存;
- B:任何時候都需要持續的做提活,拉新,提升留存。
沒有意外的話,你的答案會屬于兩者之一,在現有工具里,我們僅僅能給出這兩個答案,這和我們的經驗,能力,技能無關,僅僅是因為我們缺少一款工具,是因為我們所掌握的數據稍顯欠缺的原因導致。
引入活性數據,會給我們第三個答案,基于他的預測特性,不妨一同思考一番。
- 在活性降低,而活躍數據尚未改變時,提升活躍度(如同文中的案例)
- 在活性較高時,去做新用戶增長。(如70%的日活用戶都是高活性的用戶)
- 在主要活性等級不高時,去做留存。(如70%的日活用戶只是中活性的用戶)
2.3 活性等級的占比率是基于動態數據分析的結果
活性等級的占比率依賴的是變化的日活,每一天的數據樣本都是不同的,這是另一個維度的數據分析方式。
傳統的占比率,都是基于固定的或者說是持續增長的數據樣本,比如日活率。
我們知道日活率是必然降低的,提升日活率的唯一方法是“老用戶回歸”,不管我們如何調動新用戶的活躍度,能夠達到的效果僅僅只能是放慢日活率的降低速度,無法對日活率起到提高的作用。
原因在于:
日活率的計算公式=當日登錄用戶/總用戶數
流失的用戶將會對日活率產生永久的影響,而新用戶的活躍度極限情況,只能保障日活率不再降低,這幾乎是不可能的,這要求我們的新用戶不再出現流失。新用戶的活躍度僅能讓我們減緩活躍率的降低速度,而不能提高活躍率。
只有老用戶的回歸,在不增加總用戶數的情況下,增加當日登錄用戶才能達到提升活躍率的目的。
活性等級的占比率,則比活躍率更能準確的表達用戶的活躍狀態,由于每天的分母樣本不同(日活用戶),導致每天的數據占比不同。不會受到累計用戶的影響,能夠更準確的反應當前階段產品真正的健康狀態。
我們再來看一組案例,仍然是以日活20000來做數據推演:
第一天 70%高活性等級 活躍率10%
第二天 50%高活性等級 活躍率7%
第三天 70%高活性等級 活躍率6.5%
我們可以準確的解讀出,第二天日活用戶活躍度降低,第三天用戶活躍度顯著提升,如果用活躍率來判斷,我們能得出的結論僅僅只是第三天阻止了活躍率的降低趨勢。
實際上隨著我們累計用戶的數量增長,活躍率作為參考指標的辨識度將會越來越低,也許10%高活性等級的占比,在活躍率上體現出來的數值不到0.0001%。
3. 一小步,活躍天數變活性
活性的取材樣本來自于 活躍天數,以目前MTA所提供的活躍天數模塊,是不足以支撐對用戶活性的觀察的,甚至大部分用戶不知道如何使用活躍天數,也不知道活躍天數有何使用場景,存在何種價值。
很遺憾,我也屬于那大部分用戶中的一員……
僅僅需要MTA繼續向前一小步,就能讓活躍天數變成用戶活性,而這一小步,卻能改變整個移動互聯網數據分析的方式,能夠影響所有APP開發者判斷,分析,預測的方式,能讓產品經理,在更加合適的時間,做合適的事情。
用戶活性的第一特征是指觀察固定周期內的活性,而非持續累加的數據,活性所反應的信息,也是指觀察周期內真實的狀況,不受周期外的數據影響,其中就包括 已經確定流失的用戶。
當我們篩選統計周期為7日時,便是表示觀察用戶在7日內的活躍天數。在這個期間里,最大值不會超過7,最小值也不會超過1。
而在視覺的表達里,用戶活性的數據分析則包含單日占比,相對上一日的增長幅度,以及7日的趨勢走向三個主體分析維度。
粗略畫了個構思原型,僅供參考:
后續,我們在觀察產品數據時,活性等級相關的數據將會僅次于新增和活躍數據的觀察力度,某種意義上而言,活性數據或許比活躍數據的力度更重。
因為活性數據,能夠更準確的反應用戶的粘性,且能對活躍數據的走勢進行相對準確的預測和監控。
我會在文末的附文里,帶上我對用戶活性等級的設計方案,在我所孵化的早期項目里,多是以監控活性來做迭代規劃,由于工具的缺失,我的做法只能是導出用戶的登錄日志,再用excel進行計算分析。
活性數據的讀取,計算和呈現對于許多團隊而言,成本都是非常昂貴的,而且可行度是比較低的,除非企業規模達到一定量級,能夠組建自己的數據中心團隊,用來探索第三方所不能提供的數據,對于中小型團隊而言,幾乎無法觸及,無法實現。
如果你擅長excel的使用,或許也可以嘗試像我一樣,導出用戶的登錄日志,并通過excel來計算自己想要的數據,可excel的計算承載能力是極其有限的,一旦度過項目初創期,引來數據大量增長時,就沒有辦法使用excel來進行計算了。
這是我們需要依賴工具的原因,很少有團隊能夠獨立負擔活性數據的挖掘成本。
此時,作為受眾用戶而言,我們其實特別期待諸如MTA(騰訊移動分析)類似的第三方數據統計分析系統,能夠為我們帶來這樣一個能力,能夠為APP的開發團隊,產品團隊追加賦能。
我仍然認為,數據驅動產品,數據驅動運營遠遠未達到終點,我們目前所使用的主流數據維度十分薄弱,還需要引入更多的維度,來幫助我們達到數據驅動產品的目的。
由衷的希望能盡早的看到MTA的活躍天數能夠邁出一小步,讓我們能夠近乎0成本的使用“活性數據”來觀察,監控產品的健康度,也能更加細致的了解產品用戶的粘性。
根據我的實踐,活性數據的引入會帶來以下變化是可以確定的:
- 預測活躍度的走向趨勢;
- 活躍降低之前,提升活躍,而非降低之后再來提升;
- 活躍較高時,拉動新增,避免“來多少,走多少”;
- 更準確的判斷用戶粘性;
- 更準確的判斷產品健康度。
你希望在你的團隊 引入 活性數據 這樣一個新的數據分析維度嗎?
你覺得,這會給我們的產品工作帶來什么樣的變化呢?
以下內容為 “附文:活性數據” 的設計思路:
附文:活性數據設計思路
活性數據包含五個數據項:統計周期,活躍天數,活性分,活性等級,活性等級占比。
- 統計周期:是指我們的觀察周期。
- 活躍天數:是指觀察周期內,用戶使用的天數。
- 活性分:活性分是觀察周期內不同日期對應的加權項。
- 活性等級:是根據用戶活性分計算的等級。
- 活性等級占比:是指定活躍等級用戶于當日登錄用戶的比值。
活性分是一個比較特殊的概念,我們通過一個案例來認識活性分。
若觀察周期為6月1日至6月7日,總計7天的周期,這里有3位用戶A,B,C,他們的活躍天數都為一天,即在觀察周期內,都有1天的登錄行為,但登錄的日期不同,你認為誰的活性等級高一點呢?
A用戶 在6月1日 登錄
B用戶 在6月3日 登錄
C用戶 在6月7日 登錄
事實上,即使是在一個觀察周期內,不同的日期也會導致活性等級偏差,反向解讀會更清晰一點。
A用戶已有6天未登錄
B用戶已有4天未登錄
C用戶已有1天未登錄
如此我們是否能判斷出A,B,C三位用戶的活性等級C>B>A呢。
針對具備相同活躍天數,但日期不同的情況下,我們需要引入活性分作為加權項目,距離開始時間越近,活性分越低,距離結束時間越近,活性分越高。
我們以0.1至0.7來設計活性分,A用戶的活性分為0.1分,B用戶的活性分為0.3分,C用戶的活性分為0.7分。
若活躍天數>=2天,只需要將多日的活性分計算加法即可。
如D用戶,在觀察周期內,活躍天數為7天(每日都使用),活性分便是0.1+0.2+0.3+0.4+0.5+0.6+0.7=2.8分。
當我們計算出每個用戶的活性分時,為了讓我們更好的去對整體情況進行把控,需要對分值進行等級劃分,我們知道最低分是0.1分,即第一天有登錄行為,也知道最高分是所有日期的分數總和,就可以對總分數進行等級的劃分,以此得到活性等級:
如我們設置三個活性等級分別為高(2分以上),中(1-2分),低(1分以下)
僅以高活性等級為例,只有符合以下條件之一的用戶,才會被我們記錄為高活性等級的用戶。(以A,B,C,D,E,F,G對應6月1日至6月7日的日期)
*ABCDEF(2.1分)(6天)
*ABCDEFG (2.1分) (7天)
*BCDEFG(2.7分)(6天)
*CDEFG(2.5分)(5)
*DEFG(2.2分)(4)
(……組合有點多,不再贅述)
我們發現按照2分的標準來判定用戶的高活性等級,需要最少最近4天的連續登錄行為,若最后一天未登錄,則需要7天內有6天的登錄行為,才能判定為高活性等級的用戶。
當然,案例中的分值劃分,包括活性分的定義都是隨意構造,我們可以讓這些活性分變得更加貼近真實場景,只需要我們設計不同日期的活性分值,以及不同等級所覆蓋的活性分范圍即可。
這包括,我們可以使用非連續的數值作為活性分,比如 第一天0.1分 第二天0.2分 第三天0.5分,第四天0.7分,第五天0.9分,我們還可以使用相同的數值作為不同日期的活性分比如第一天和第二天都是0.1分。
這取決于我們如何定義觀察周期里,不同日期多代表的價值,但務必遵守活性分定義的核心原則:距離開始日期越近,活性分越低,距離結束日期越近,活性分越高。
除非你有一些特殊的構思。
我們將不同活性等級的用戶數與觀察日期的總活躍用戶數進行對比,就能得到活性等級占比,這個數據相比活躍率具備更高的參考價值。
也就是我們在正文當中多次提及的70%高活性等級用戶。
嘗試解讀一下文中的數據案例:
6月1日 70%高活性等級 日活20000
6月2日 50%高活性等級 日活20000
6月3日 70%高活性等級 日活20000
相關閱讀
原標題:MTA的一小步,“活躍天數”變“用戶活性”
作者:枯葉(微信公眾號:枯葉咖啡館),人人都是產品經理專欄作家,近6年經驗的產品經理,擅長社交、社區、細分群體挖掘。
本文為「人人都是產品經理」社區和騰訊移動分析聯合主辦的“騰訊移動分析測評大賽”中的三等獎作品,未經許可,禁止轉載。
題圖來自 Pixabay,基于 CC0 協議
活性度就是粘性度的話,為什么要改個名字呢?
作者觀點明確,對模型各個細節闡述到位,挺好的