一文搞懂數據異常問題該如何分析
編輯導讀:數據異常監控分析不僅是數據分析面試中的高頻考題,同時也是業務分析中一項常態化的工作內容。當出現了數據異常波動的情況,應該如何進行分析呢?本文作者對此發表了自己的看法,與你分享。
一、數據異常波動的表現形式
數據異常監控分析不僅是數據分析面試中的高頻考題,同時也是業務分析中一項常態化的工作內容。當我們面對市場、產品、運營等各種業務場景,經常會發現很多異常數據的問題,比如:
- 某APP日活DAU相比昨日突然下降了10%,該如何分析?
- 某公司銷售收入環比上月下降了15%,該如何分析?
- 某產品客單價環比上月下降了20%,該如何分析?
- ……
上述各種業務場景,其實都是發現了數據有異常波動的情況,那接下來問題來了,我們該如何著手進行分析呢?大部分人解決問題的思路,都是直奔主題找原因,上來就去找出現異常的原因、異常點在哪里。其實這種分析思路有一個最大的弊端就是不夠體系化,往往能夠找到一些原因,但是很可能是片面的,甚至可能還會踩雷。接下來就給大家分享一種比較實用的方法,我個人稱之為“點 – 線 – 面”分析法。
二、數據異常分析的方法論
1. 點
首先排查數據準確性,確定是否屬于數據錯誤。容易出現數據錯誤的環節有數據采集環節(埋點)、數據提取環節、產品環節(BUG)、業務環節(數據口徑)等。如果沒有問題進入下一步分析;
2. 線
拉長時間周期,也就是進行縱向分析,看是否屬于周期性波動,有些行業受季節或淡旺季影響較大,比如家電、飲料、在線教育等都受淡旺季影響較大。如果沒有問題進入下一步分析;
3. 面
首先,綜合運用公式拆解法、多維度拆解法等對大問題進行拆解,拆解為一個個可著手分析的小問題;然后,通過計算影響系數初步定位到主要影響原因;最后,大膽假設,小心驗證,通過假設檢驗法逐步排查到產生問題的根本原因。
比如,我們以銷售收入下降為例,通過“點 – 線 – 面”分析中的“點 – 線”分析確認屬于數據異常后,接下來就可以在“面”的分析環節中采用“三部曲分析”法,主要流程如下:
1)運用公式拆解法、多維度拆解法等對大問題進行拆解
2)計算影響系數,定位主要原因影響系數=( 細分項本月數 -細分項上月數 ) / ( 本月總量 – 上月總量 )
影響系數越大,說明該維度數據就是造成總體波動的主要影響因素。
3)通過假設檢驗法逐步排查根本原因
假設在計算影響系數后,初步確定主要是新用戶減少引起的收入下降,接下來就需要對新用戶數下降的原因進行假設,常見的假設維度有內、外部維度,其中內部維度主要有渠道側、產品側、運營側、技術側等等,然后通過數據逐一對上述假設進行驗證。
以上是幾種常見的拆分維度,通過初步拆分,定位原因大致范圍。
三、數據異常分析的案例實戰
某連鎖零售集團最近兩年每月銷售收入保持穩中有升的趨勢,但是在2021年6月銷售收入突然下降了17%(下圖),這時銷售負責人非常著急,讓你盡快排查一下銷售下跌的原因。面對收入下降這種棘手的問題,如果對于沒有經驗的同學,確實還是比較頭疼的,就像那燙手的山芋,無從下手。
接下來,我們就按照按照上面的套路來演練一下。
1. 點
首先排查數據準確性,確定不屬于數據錯誤;
2. 線
拉長時間周期,不屬于季節波動;
3. 面
1)首先把總收入拆分成新、老用戶收入
如下圖:
通過觀察數據,發現新、老用戶收入均有不同程度下滑,于是啟動第二步,分別計算其影響系數。
2)計算新、老用戶收入影響系數
新用戶收入影響系數 =(33 – 47) /(100- 120) =0.7
老用戶收入影響系數 =(67 – 73)/(100- 120) =0.3
新用戶收入影響系數0.7,說明總收入下降主要影響因素是新用戶收入下降,明確問題的范圍后接著進行細分,新用戶收入的構成是什么?
新用戶收入 = 新用戶數量*轉化率* 客單價
通過調取數據分析發現,新用戶轉化率和客單價都保持穩定,那么問題就出在了新用戶數量這個指標上,那新用戶又是由什么構成呢?
新用戶 = 渠道 1 + 渠道 2 + 渠道 3 + …… + 渠道 n
于是我們把新用戶按照其渠道來源進行拆分:
通過對新用戶渠道來源進行拆分,我們發現渠道1在2021年6月新用戶數量下降非常嚴重,于是我們就定位到收入下滑的根本原因在于渠道1新用戶數量下滑嚴重。接下來我們就可以啟動第三步,對渠道1新用戶數量下滑原因進行假設檢驗。
3)對渠道新用戶數下滑原因進行假設檢驗
渠道流量下降可能的原因可以從兩個大的維度進行考慮:對于外部維度,可以考慮外部環境變動、競品變化等;對于內部維度,可能的原因有渠道線索問題、投放策略變化等。這個時候一方面要調取數據進行分析驗證,另一方面需要聯系渠道1的負責人一起定位具體原因,找到具體原因后,再對癥下藥。
本案例純屬虛構,如有雷同,純屬巧合。當然,實際的業務要比這復雜的多,需要考慮的因素也很多,花費的時間也會更長。但是,解決問題的方法論和流程是可復用的。相信大家以后再面對類似問題的時候,會有一個清晰的分析思路和明確的入手點。
最后,我們如果對上面的“點 – 線 – 面”分析法進行總結歸納的話,可以提煉為下面這張圖:
希望這一篇能夠對大家準備面試和實際工作有切實的幫助,如果同學覺得有幫助,歡迎點贊、轉發?。〈蠹胰绻衅渌敕?,歡迎加入我一起討論交流。
本文由 @知了數據分析 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
微信公眾號:知了數據分析
本文由 @知了數據分析 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
關注【知了數據分析】,獲取更多數據分析干貨!