做數據十年,第一次見這么棒的數據分析方法
本文深入探討了數據分析在業務中的應用,提出了六大業務需求對應的分析方法。解決如何將數據分析與實際業務緊密結合的問題,特別適合數據分析師和業務決策者閱讀。
很多同學會困惑:到底什么才是數據分析方法?因為網上對于數據分析方法的描述,有些抄襲自營銷學書本,比如4P、PEST;有些則抄襲自統計學書本,比如相關分析,回歸分析??烧娴阶龇治龅臅r候就傻眼了:眼前的問題到底該P一下還是回歸一下?
想真正理解,掌握數據分析方法,當然不能這樣“拿著錘子找釘”。工作中的數據分析,要緊密結合業務,服務業務需求。因此理解業務需求,圍繞問題找答案,才能理解各種數據分析方法有什么用,該怎么用。
一、6大類典型的業務需求
一個完整的業務活動,分為六個步驟:了解現狀→設定目標→制定計劃→監控走勢→診斷問題→復盤結果。在每個階段,業務掌握的信息,想解決的問題是不一樣的,因此對數據的需求會不一樣(如下圖)。
如果是從制定年度經營計劃開始,數據分析師就參與到工作中,那么就會完整地經歷這6個步驟。
但是,很多同學是中途入職/半道接手工作,最常見的是:
- 從監控開始,先輸出日常報表,再發現問題
- 直接接到一個分析任務,就XX問題輸出報告
- 事情已經做完了,事后補一份復盤報告
這個時候,很有可能數據分析師對業務都不熟悉,匆忙趕鴨子上架,肯定毫無思路了。此時,至少得把第1步:了解業務現狀補齊,然后再對癥下藥。
二、了解現狀的方法
了解現狀階段,更多是系統地呈現數據指標,讓業務看清楚情況。數據指標體系本身有3種結構:并列式、流程式、總分式。有
一些常見的分析方法與這三種形式對應。比如:
- 杜邦分析法對應總分式指標體系。主要用于評估經營情況好壞,拆解財務指標,監控業務行動結果。
- UJM方法對應流程式指標體系。主要用于梳理用戶行為路徑(互聯網企業使用的尤其多),看清楚用戶轉化方式。
- RFM方法對應并列式指標體系,主要用于對用戶消費行為進行分類,區分高中低消費+待喚醒的緊急程度。(如下圖)
需要注意的是:單純地展示指標并不能得出任何分析結論。至少要展示指標+不同個體間進行對比。比如:
- 杜邦分析法:兩個同行業公司進行比較
- UJM方法:兩個不同路徑進行比較
- RFM方法:兩類用戶群體間比較
因此,在了解現狀階段,不要光想著羅列一大堆指標出來,而是思考下:到底選取誰進行對比,才能更好發現業務之間差異性,從而啟發業務部門思考。
三、設定目標的方法
在設定目標階段,很有可能業務部門想了解:
- 如果不做任何改變,自然情況下業務會發展成啥樣?
- 如果增加/減少某項資源投入,業務會發展成啥樣?
- 如果改變一種業務做法,業務會發展成啥樣?
此時就涉及到預測問題。預測自然發展趨勢,一般會運用到時間序列法,根據數據走勢的不同,有平滑法、自回歸、季節性回歸、帶季節趨勢的回歸等方法可用。如果考慮改變資源投入,可以考慮帶因果關系回歸。因為投入產出之間一般都有函數關系,可以通過數據擬合投入產出曲線,從而模擬調整結果。
如果要改變業務做法,則要先看:業務是否有采取同類措施。如果已有同類做法,則可以參考同類做法的投入產出情況進行推算。如果連做都沒做過,那就得先做測試,不然沒數據就是空拍腦袋。
需要注意的是:設定目標很多時候要體現領導想法,數據本身只是參考。所以很有可能在做完自然情況預測后,業務部門就會開始拍腦袋了。此時可能不需要復雜的分析方法,而是利用數據指標體系,拆解KPI指標,之后根據領導們的要求增減相關,模擬可能的結果。
四、制定計劃的方法
在制定計劃階段,很有可能業務想把一個大目標拆解下去,落實到具體執行工作中。此時可以使用OGSM方法,這是一套標準的把定性目標落實為定量目標,把定量目標拆解為執行步驟,再監控執行的方法(如下圖)。
還有可能,業務想先不自己動手拆,而是看在現有投入產出水平下,理論最優解是什么。此時可以構建投入成本函數,利用本量利分析/線性規劃方法,計算理論最優解,供業務參考(如下圖)。
同目標設定一樣,做計劃的時候,很有可能業務完全憑經驗,自己估摸一個數字就開干了。過于粗糙的計劃,會導致:執行安排不合理、臨時調來調去、缺少后備方案,這些都會導致執行過程的問題。
數據分析師如果能提前了解情況,就能在下一步監控走勢的時候輕松很多。
五、監控走勢的方法
在監控走勢階段,核心任務是:觀察業務是否在預期內發展,是否有異常波動。因此需要數據分析方法,判斷業務是否正常。
此時有周期性分析法、投入產出分析、結構分析法、分層分析法、矩陣分析法五種方法可用。
- 周期性分析法,是根據業務特點,拆解出業務發展隨季節變化/生命周期變化/投入產出變化而產生的規律。通過和常規走勢對比發現問題。
- 投入產出分析,則是根據業務行動投入力度+過往數據經驗,預判可能效果,如果排查:是否因本次業務執行不力,導致數據異常
- 結構分析、分層分析、矩陣分析,則是通過多個業務之間對比,發現被平均數掩蓋的問題。還有些常見的說法,比如ABC分類、二八分類,其實都是分層分析的特殊形態(如下圖)
在監控走勢的時候,這些常規方法,完全可以和監控指標做到一起,做成同一張監控數據看板,在觀察到主指標異常以后,直接從總體到具體查看數據情況,看看是哪個部分出了問題,從而極大提高發現問題的效率。
六、問題診斷的方法
在診斷問題過程中,是否有業務假設是最關鍵的。
- 如果業務啥都沒有,那就只能構建分析邏輯樹,層層排查問題
- 如果業務有一個明確假設,可以直接做排除法,驗證假設是否成立
- 如果業務已經有應對方案,可以直接做實驗,測試方案可行性
雖然一提起問題診斷,人們本能會想到:構建邏輯樹。但構建完整的邏輯樹太過費時費力,且很多假設需要收集外部數據檢驗,現實工作中不是時時刻刻都有這么充足的數據供應。因此診斷問題時,盡可能先找業務假設,快速輸出結論。
驗證業務假設的時候,是否做實驗是最關鍵的區別:
- 如果完全不能做實驗,那么只能通過標桿分析(對比好/壞個體),過程診斷(分析業務過程中最拉胯的環節)來輸出分析結論。
- 如果能做實驗,但不能做抽樣測試,那么只能做改進前后對比分析。
- 如果能做實驗,且能做抽樣測試,那么可以采用統計學方法,檢驗實驗效果。
七、結果復盤的方法
如果前邊5步做到位了,在結果復盤的時候就非常輕松:
- 對比目標、實際差距,下判斷:到底做得好不好
- 調取過程監控數據,看執行過程中是否有問題
- 調取問題診斷數據,看問題發生原因及處理的結果
這樣綜合各項結果的復盤是非常全面的,即包含了結果陳述,又包含了經驗總結。
很多同學覺得復盤特別麻煩,是因為沒有參與到全流程的工作中,活動結束了才被指派任務要復盤。此時一不了解目標,二不了解過程,自然得從頭到尾梳理一遍才能出結果。如果碰上業務自己都沒有設定清晰的目標,沒有監控過程數據,那就更兩眼一抹黑了。
專欄作家
接地氣的陳老師,微信公眾號:接地氣的陳老師,人人都是產品經理專欄作家。資深咨詢顧問,在互聯網,金融,快消,零售,耐用,美容等15個行業有豐富數據相關經驗。
本文原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
寫的真好