如何開展數據分析?–產品經理
數據分析是產品和運營都必須掌握的技能之一,但不少同學接觸較少還是不怎么會。本文分享了產品經理如何做數據分析的流程和方法,供大家參考。
小A:
“這張曲線圖真好看,怎么做的”
“這些數據可以做什么樣的分析”
“高級的分析方法在這里能用嗎”
“要做多少張圖表”
小B:
“數據變化的背后真相是什么”
“從哪些角度分析數據才系統”
“用什么分析方法最有效”
“數據分析的目的達到了嗎”
小A和小B在做數據分析的時候分別思考了相關問題,不難看出,小B的問題對于數據分析來說價值更高,也更專業;而小A就是以前的我,在收到數據分析任務的時候,總是找不到重點、隨意發散、無法聚焦,結果也總是不盡人意;通過多次的經歷與不斷復盤,摸索并驗證了一條真實可落地的思路,和大家探討一下。
常見的數據分析全流程一般是:明確分析目的→確定分析方法與思路→數據加工→得出結論
一、明確主題
主題可以是封閉的,如“廣州機場1期項目的隱患整改率指標能否符合預期”,也可以是發散的,如“當前公司供需匹配的矛盾是什么”,需要根據公司具體情況確定分析目標。
整個分析過程就是對業務的診斷過程,從淺到深、從大到小,下面我們通過一個案例,來貫穿整個流程。
案例:
需對小Y公司零售業務銷售額下降進行數據分析。
小Y公司在2024年前4個月銷售額持續增長,但在5月份的銷售額卻出現了一定程度的下降,具體數據表現如下:
全國5月份比4月份整體下降362千元。
二、分析思路
1. 首先是數據校驗
1)校驗數據準確性
是否因系統上報錯誤等異常原因導致,如檢查數據獲取渠道、sql是否有誤、數據看板是否及時更新;
2)異常還是波動
拉長時間軸對比查看觀測日數據是否異常;
最終確定數據準確且是異常變化,再進行后續分析。
2. 其次是確定方法
我常用的分析方法一般是:假設驗證、邏輯樹、5W2H
1)假設驗證
提出假設→驗證假設
我們用上面提到的小Y公司案例進行分析:
假設可能是某個區域的銷售額下降,導致整體銷售額下降,獲取到更細力度的數據后,用excel對基礎數據進行透視,觀察分區的銷售額變化情況:
通過觀察發現,北京、河北5月份的銷售額明顯下降,其中北京下降幅度最大,因此猜測北京銷售額下降是導致全國銷售額下降的首要因素。為什么北京的銷售額會下降呢?是整體下降?還是某個品類下降?為進一步分析,需對各區域的數據進一步按品類分組觀察如下:
通過觀察,北京蔬菜品類5月份下降明顯,從423千元下降到40千元,降幅達90%,而海鮮和水果基本穩定。因此基本可以確定銷售額下降主要是因為北京地區蔬菜品類銷售額下降導致的。
若此刻下定結論,也許不夠嚴謹,因為河北的銷售額也有所下降,大膽推測一下:全國的蔬菜品類是否因為某些原因出現了整體下降呢?
我們這次從分品類分區域的銷售額維度進行觀察,數據表現如下:
觀察發現,全國海鮮品類銷售較穩定,水果品類持續增長,蔬菜品類在5月份的銷售額明顯下降。廣州和深圳的蔬菜品類銷售額是增長的,只有北京與河北兩地的蔬菜品類銷售額明顯下降。
考慮到北京與河北兩地相連,猜測可能是同一原因導致的蔬菜品類下降。因此我們詢問了華北地區采購員,得知5月份蔬菜品類的華北地區供應商貨品質量大面積出現問題,導致嚴重退貨。華北地區供應商是北京與河北客戶采購商品的同一供應商。
至此,得到了明確的分析結論:華北地區蔬菜品類出現嚴重質量問題,導致北京與河北的銷售額驟減,進而導致全國銷售額下降。
這里的分析工具只用到了excel的數據透視,還有其他如BI軟件,也可以從各個維度探查數據,大家可根據自己的實際情況選擇合適的分析工具,只要能達到最終分析的目的即可。
2)邏輯樹:
通常會將公式拆解、用戶/產品/競品三維度拆解,用邏輯樹來體現。
如:GMV下降
i.公式拆解:為訪客數、訂單轉化率、訂單均價進行進一步分析。
ii.三維度拆解:用邏輯樹體現如下
3個維度不斷細分,進行分析。
3)5W2H:同樣用邏輯樹體現如下
這個方法作為產品經理應該再熟悉不過了,我做需求調研的時候也經常用到這個方法,簡單清晰,覆蓋的范圍也比較全面。
3.最終得出結論
數據分析的結果一般會以分析報告類的文檔呈現,分析報告結構可以按照總分總的形式編寫,如提出論點、進行論證、陳述總結。
報告中要注意:標題、數據來源、格式與排版等。
三、數據加工
數據分析過程離不開數據加工,一般收集來的數據,都要做一些清洗、處理等操作,以保數據的準確性與可信度。
專業的數據加工工作一般是由數據分析師等職位的同學執行,產品崗的我們,能執行一些必要的處理工作即可,如對excel相關公式的使用、BI軟件、埋點平臺的使用等,當然如果對數據加工過程也能掌握肯定是更好的。
數據加工的過程一般包括:
數據采集、數據預處理、數據存儲、數據處理與分析、數據可視化、數據服務產品化。
1.數據采集:從各種來源(業務系統、日志文件等)收集原始數據,需要保證數據的完整性和準確性;
2.數據預處理:收集到的原始數據進行清洗、去重、轉換等操作,消除數據中的噪聲和異常值,提高數據質量;
3.數據存儲:將預處理后的數據存儲到合適數據存儲系統中,如分布式文件系統(HadoopHDFS)或數據庫(NoSQL)
4.數據處理與分析:使用各種技術和工具對數據進行分析,如統計分析、機器學習等,以發現數據中的模式、關聯,應用于決策支撐
5.數據可視化:分析后的數據通過圖形化的形式展示出來,幫助用戶更好理解和使用數據,常用的可視化工具如tableau、power BI等
6.數據服務產品化:經過處理和分析的數據應用到實際業務中,如推薦系統、風險管理等,需考慮數據的真實性、實時性與可靠性,以滿足業務需求。
這里僅做一些簡單介紹,感興趣的同學可自行查閱~
四、總結
在整個數據分析過程中我認為方法工具、業務知識、細心耐心三者都很重要。事情的執行總是由簡到繁、由陌生到熟悉的。我一開始做數據分析的時候很難聚焦,總是找不到出發點或分析點,像個無頭蒼蠅一樣,什么數據都想要,最后結果分析不到位、缺少重點。在很多次的摸爬滾打中,逐漸找到了適合自己的方法,拓展了思路。
小Tips:如果實在不知道怎么做/迷茫的時候,就先開始,動起來再說。
今天的分享就到這里了,希望可以幫到你,歡迎大家一起交流學習。
本文由 @不知名產品露 原創發布于人人都是產品經理。未經作者許可,禁止轉載
題圖來自Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務
- 目前還沒評論,等你發揮!