產品日活DAU下降,我該如何著手分析?
本文將以“產品日活DAU下降該怎么分析”這個問題為主進行詳盡解析,為大家拆分出解決問題的步驟,分享自身經驗的同時總結一些思考分析框架。
本文我選擇了一個具體的問題著手寫。產品核心數據異常是在工作中經常會遇到的問題,也是常見的互聯網面試問題。在此我結合網上的一些分享以及自己的經驗,總結一些思考分析框架,讓大家在遇到此類問題的時候有一個明確的著力點。
案例簡介
一款信息流APP平時日活穩定在79w-80w之間,但是在6月13日起突然掉到了78.8w,到6月15日已經掉到78.5w,這時產品負責人著急了,讓你盡快排查一下數據下跌的原因。這樣的問題對大多數人來說還是比較頭疼的,因為對于80w量級的產品,一兩萬并不是一個非常大的波動,但原因還是要排查。
拿到這個問題,會覺得不知道從哪點著手開始分析?沒關系,我們把常用套路捋清楚了,然后回頭再看這個案例。
核心點:先做數據異常原因的假設,后用數據驗證假設。
不建議大家第一步先自己對著數據去拆,影響日活數據的因素很多,不可能把所有維度逐一拆解對比,容易浪費時間卻沒有任何有價值的發現。做數據異常原因分析的核心就是結合以往經驗及各種信息,找出最有可能的原因假設,通過數據的拆分進行多維度分析來驗證假設,定位問題所在。過程中可能會在原假設基礎上建立新的假設或者是調整原來假設,直到定位原因。
第一步:確認數據真實性
在開始著手分析前,建議先確認數據的真實性。我們經常會遇到數據服務、數據上報、數據統計上的BUG,在數據報表上就會出現異常值。所以,找數據流相關的產品和研發確認下數據的真實性吧。
第二步:根據幾個常見維度初步拆分數據
計算影響系數:每一項數據都要和以往正常值做對比,算出影響系數。
影響系數=(今日量-昨日量)/(今日總量-昨日總量)
影響系數越大,說明此處就是主要的下降點
以上是幾種常見的初步拆分維度,通過初步拆分,定位原因大致范圍。
第三步:異常范圍定位后,進一步做假設
針對初步定位的影響范圍,進行進一步的排查。分三個維度來做假設,建議針對數據異常問題專門建一個群,拉上相應的產品、技術、運營人員一起,了解數據異常時間點附近做了什么產品、運營、技術側調整。
綜合考慮以往數據異常原因、產品運營技術側調整、初步定位的影響范圍最可能由什么原因造成,再結合自身業務經驗確定幾個最可能的原因假設,給這些假設排數據驗證的優先級,逐一排查。
最后:細分假設,確立原因
除了上述,可以細分分析的維度實在太多,邏輯上說核心點在于一個假設得到驗證后,在這個假設為真的基礎上,進行更細維度的數據拆分。我們需要記住這種分析方式,當猜測是某種原因造成數據異常時,只要找到該原因所代表的細分對立面做對比,就可以證明或證偽我們的猜測,直到最后找到真正原因。
案例分析
以上就是核心數據異常的分析套路,是不是剛才拿到問題還不知道從哪開始分析,現在覺得其實有很多點可以去著手?讓我們回到剛才的案例吧。根據上述套路,首先我們拆分新老用戶活躍量,如下圖(老用戶左軸、新用戶右軸):
發現老用戶日活較平穩,但是新用戶自6月13日下降嚴重,于是計算新老用戶影響系數:
老用戶影響系數=(77.89-78)/(78.8-79.5)=0.16
新用戶影響系數=(0.98-1.5)/(78.8-79.5)=0.84
新用戶影響系數0.84,說明DAU下降是出在新用戶身上,明確范圍后進一部細分,新用戶由什么構成?
新用戶=渠道1+渠道2+渠道3+其他渠道 ,于是我們把新用戶日活按渠道進行拆分:
通過渠道拆分,我們發現渠道3自6月13日起新用戶下降嚴重,于是我們把問題定位在渠道3,應該是渠道3的渠道效果發生問題。聯系渠道3的負責人一起定位具體原因,渠道線索量降低?渠道轉化率降低?渠道平臺的問題?找出原因后,再針對原因解決問題,制定渠道優化策略。
最后要說的
至此本篇文章已到尾聲,詳細敘述了核心數據異常的分析套路以及講了一個易于大家理解的小案例,相信大家下次再遇到這類問題,至少有一個明確的著手點。
還有一些想對大家說的是:為了方便大家理解,這個小案例的數據是我虛構的,問題定位過程也比較簡單。但是在實際業務中,數據異常的影響原因可能是多方面的(本篇只講到了一些內部因素,外部環境和競對其實也會影響核心數據),有的時候也需要建立統計分析模型來做一些定量分析。
可能要花幾天的時間去不斷排查問題,這個過程繁瑣且枯燥,假設驗證失敗可能會有挫敗感,或許忙活了很久但是最后并沒有找出原因。
其實這是很正常的事情,數據異常分析甚至對于一個資深數據分析師都是一個令人頭疼的問題。所以我們需要在平時工作中多留意數據變化,隨著對業務的熟悉和數據敏感度的提升,針對數據異常分析我們也會越來越熟練,更快找到問題所在。
希望本篇內容對大家有實際的幫助,后續想了解更多互聯網數據分析相關內容,歡迎關注點贊轉發,歡迎一起探討更多話題。
作者:趙小洛,微信公眾號:趙小洛洛洛,wechat:luoluo963,郵箱:youlu2409@163.com
本文由 @趙小洛 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
其實這塊的計算還是沒有太明白。
老用戶影響系數=(77.89-78)/(78.8-79.5)=0.16, 這里的話用1-0.16=0.84 ,可以直接算新用戶嗎?
新用戶影響系數=(0.98-1.5)/(78.8-79.5)=0.84———— 這里的0.98和1.5是看第一個圖里面的數字么
可以的,你看兩個式子分子加起來不就是分母嘛
個人認為這里的影響系數是否應該乘上新老用戶占大盤的比例(權重)才是正確的
好文 , 感謝!!
這是篇好文 言簡意賅
您好,首先很感謝您的講解。在這里我有一個疑惑(新手小白,如果有錯,請指出,謝謝),請問,按照之前的分析,定位到了是渠道問題,這里我覺得按照渠道的曲線圖,實際上在整個周期里,渠道2、3以及其他渠道的用戶數量都是穩定的,而渠道1 在6.13的時候下降嚴重,我覺得這里應該考慮的是渠道一是否出現了問題,因為整個渠道一的趨勢都是呈現下降的,而實際上2、3對這個下降的影響并沒有1的大,所以應該去找渠道一的相關運營人員溝通,解決問題。
3下降嚴重呀,哪里看出來的是渠道1下降嚴重
是不是還不會辨別顏色……
請問 影響系數=(今日量-昨日量)/(今日總量-昨日總量) 這個意思是?
請問一下您的 影響系數 怎么算的?公式是?
影響系數=(今日量-昨日量)/(今日總量-昨日總量)
也就是——某維度的變化值/整體變化值
贊
感謝!