數據分析沒思路,這些數據分析方法掌握了么?
為了更好的理解用戶,洞察用戶的需求,數據分析就能很好的幫助解決這個需求。但是在數據分析時,沒有思路該怎么辦呢?對此,本文從整體思考框架5W2H、描述問題現狀對比分析等七個方面做了分析,希望對你有所幫助。
對于產品經理來說,產品的每一次迭代和升級,都需要評估效果,以便今后改進。如果僅僅是憑借肉眼觀察和主觀感受,下一個“用戶反饋很好”、“用戶很喜歡這個新功能”類似的結論,是很蒼白無力的。更多時候,會因為主觀感覺而產生誤判,另外,數據分析還可以幫助產品經理更好地了解用戶,洞察用戶的需求。
而對于運營而言,作為與用戶和產品接觸最頻繁的人,也是策略的制定者和實施者,但產品運營的好與壞,最直觀的體現就是數據,通過數據的高和低作為衡量的一個標準。對于運營來說,數據產生和決策制定中間,一定還有大量可以優化的空間,這種空間很大程度上可來源于數據。從數據中發現知識,優化決策,將會成為大大提升運營效率。
所以,無論是產品還是運營,在數據驅動業務的大背景下,數據分析都是必須要掌握的一項技能,本文介紹了7種常用的數據分析方法,介紹了一個完整的數據分析過程中可能用到的系列方法:
從界定問題→診斷現狀→定位問題環節→追溯問題原因→判斷問題發展趨勢。
一、整體思考框架:5W2H
著名教育學家陶行知先生曾經寫過一首小詩:
我有幾位好朋友,曾把萬事指導我,
你若想問其姓名,
名字不同都姓何,
何事何故何人何時何地何法,
好像弟弟和哥哥,
還有一個西洋派,
姓名顛倒叫幾何,
若向七賢常請教,
即使笨人不會錯。
這首小詩講的就是5W2H:What(何事) When(何時) Where(何地) Who(何人) Why(何故) How(何法) How much(何幾),5W2H是對目標計劃進行分解和決策的思維框架,它對要解決的問題進行完整的刻畫,以便清晰地界定問題并找到解決方案。
- What:何事?發生了什么?一般用來指的是問題是什么?是否真的發生了?比如DAU真的下降了嗎?;
- When:何時?在什么時候發生的?問題發生的時間,比如DAU下降了,下降的具體時間是什么?是不是節假日等等;
- Where:何地?在哪里發生的?問題發生的拆解其中一個環節, DAU下降了, 是哪一個的地區的下降了,哪個終端的用戶下降了?還是哪一個功能的使用的人下降了等等;
- Who:何人?比如DAU下降了, 是哪一部分的用戶群體在降, 是什么年齡、 性別、活躍度的用戶等等;
- Why:何故?為什么會這樣?問題發生的原因猜想, 比如android用戶的DAU降低了, 其他終端的DAU沒有降低, 是不是android新發版本存在bug;
- How:何法?明確上面的問題后, 我們要采取什么樣的方法和策略去解決DAU下降的問題;
- How Much:何幾?做到什么程度?DAU下降了以后, 我們對應策略的成本是多少, 以及我們要把這個問題解決到什么程度才可以;
5W2H分析方法從問題出發,有一套科學完整的分析思路,對造成問題的原因進行推測,并提出相應的解決方案,最終解決問題,形成閉環。
當然,5W2H只是一種思維方式,在實際應用過程當中可能還會遇到各種各樣的業務場景,針對不同的業務場景,整體的思路是一樣的, 但分析的維度就需要根據不同的產品形態和業務特性來調整。
二、描述問題現狀:對比分析
通過5W2H已經有了整體的思維框架,形成了大致的分析思路,接下來就要針對問題進行具體分析,首先從問題現狀入手。
沒有對比,就沒有優化提升的方向。在數據分析中,沒有對比,就沒有結論。
比如,小虎某次期末考試的成績不好,數學只得了 40 分。
小虎的媽媽對他說:“你上次考試數學考了 70 分,這次怎么就考得這么差?你看你的同班同學,這次都考 80 分以上。我之前跟你說考90分給你買奧特曼,這下別想了……”
常見的對比思維有以下 5 種:
- 跟目標對比:本月目標銷售額500w,實際完成了300w,目標達成率60%;
- 跟上個月比:上個月銷售額200w,環比增長50%;
- 跟去年同比:去年同期銷售額400w,同比下降25%;
- 分渠道對比:線上/線下渠道銷售分別200w、100w;
- 跟同類競對比:同水平競對A、B、C本月銷售額分別為600w、500w、100w;
總結一下上面的對比思維,主要是橫向和縱向對比:
橫向對比:同一時期,外部和競對比,內部各渠道對比
- 同一時期和外部競對對比,整體市場表現以及所占市場份額變化;
- 同一時期自己內部各渠道對比,看銷售額貢獻和貢獻占比變化;
縱向對比:自身不同時期對比
- 和上一期數據對比,近期有無提升/后退;
- 和去年同期對比,季節周期性考量下對比,是否有提升/后退;
數據分析的過程,就是在明確目標之后,通過對比等思維,找到問題的原因,得出分析的結論,提出可行的建議,從而起到幫助決策和指導行動的作用。
三、定位問題環節:漏斗分析
已經通過橫向、縱向對比大致了解了業務的現狀,知道業務是在變好/變壞,以及變好/變壞的程度,如果業務在持續變壞,我們就需要通過漏斗分析來定位問題到底出現在哪個環節上。
漏斗模型,本質是分解和量化,這里以電商購物漏斗模型舉例。
也就是把購物的整個流程拆解成從選購商品到最終轉化成購買的一個個子環節,用相鄰環節的轉化率/流失率來量化每一個環節的表現。所以整個漏斗模型就是先將整個購買流程拆分成一個個步驟,然后用轉化率/流失率來衡量每一個步驟的表現,最后通過異常的數據指標找出有問題的環節,從而解決問題,優化該步驟,最終達到提升整體購買轉化率的目的,整體漏斗模型的核心思想其實可以歸為分解和量化。
漏斗分析其實是一種業務流程拆解和量化的思路,任何業務流程都可以按照這個思路來拆解,常見的業務漏斗模型還有很多:消費者行為AIDMA漏斗、用戶生命周期的AARRR等。
四、細分分析原因:細分拆解
通過漏斗分析我們大致可以定位到問題出現在哪個環節,但是,到底是什么這個環節的哪個部分出了問題,我們還需要進一步細分拆解定位問題癥結所在。
在數據分析中,細分是數據分析的靈魂,沒有細分拆解,就沒有數據分析。
小虎期中考試的總成績不好,細分一看,發現其他科目的成績都不錯,只有數學成績特別差,只得了 40 分,而且三角函數一題都沒有做對。
常見的細分方法有以下 5 種:例如本季度的銷售額沒有達標,可以按照以下思路進行細分:
- 按時間細分:哪個時間段的銷售額出了問題?
- 按空間細分:哪個區域的銷售額出了問題?
- 按過程細分:售前導購、購買體驗還是售后服務的哪個過程出了問題?
- 按公式細分:GMV=流量*轉化率*客單價,流量、轉化率和客單價的哪個部分出了問題?
- 按模型細分:用戶價值分層模型,不同價值的用戶的銷售額貢獻,是哪類用戶出了問題?
拆解的方式千千萬,在運用細分拆解思維的過程中,要做到有的放矢,圍繞數據分析的目標,找到合適的拆解方法,否則只能無頭蒼蠅一樣到處亂撞。
另外,當發現數據異常時,嘗試從不同的維度進行細分,這樣既能鍛煉數據分析思維,又能加深對業務的理解。
五、尋找相關因素:相關性分析
如果一個變量改變的時候,另一個變量也朝著相同的方向發生變化,那么我們就說這兩個變量之間存在相關性。
分析一家商場的產品銷量數據發現,尿布和啤酒的銷量會出現大致相同的變化趨勢,啤酒和尿布有什么關聯呢?采訪小虎的爸爸,他說自己下班后,給小虎的弟弟買尿布的同時,也會購買自己喜歡喝的啤酒。
相關性分析,就是尋找變量之間相互關聯的程度,相關性一般通過相關系數衡量。最常用的是用于計算線性相關系數的Pearson相關系數,取值區間在1到-1之間。1表示兩個變量完全線性相關,-1表示兩個變量完全負相關,0表示兩個變量不相關。數據越趨近于0表示相關關系越弱。
用Excel進行簡單的相關分析,通常包括以下 3 個步驟:
- 收集相關數據
- 繪制散點圖形
- 計算相關系數
需要注意的是,相關性不等于因果性。兩個變量之間相關性,并不代表其中一個變量的改變,是由另一個變量的變化導致的。
比如說,分析發現,國家的諾貝爾獎數量,與巧克力消費量之間呈現正相關關系,但這并不是說,多吃巧克力有助于獲得更多的諾貝爾獎。一種合理的解釋是,諾貝爾獎的數量與巧克力的消費量,很可能都是由其他變量導致的,例如國民的受教育程度和富裕程度。
六、溯源影響因素:歸因分析
實際業務中,很多問題的出現并非是單個因素造成的,而是經過多種因素的影響而共同造成的。
所以數據分析最頭禿的問題就是:導致問題的原因到底是什么?歸因分析(Attribution Analysis)要解決的問題就是多因素影響的情況下,最終效果的提升/下降,應該如何合理地分配給過程中的各個因素。
小虎在手機上看到了朋友圈廣告發布了最新的iPhone,午休的時候刷抖音看到了有網紅在測評這款手機,下班在地鐵上刷朋友圈的時候發現已經有小伙伴收到手機在曬圖了,于是喝了一杯江小白壯壯膽回家跟老婆申請經費,最后老婆批準了讓他去京東買,有保障。那么請問,朋友圈廣告、抖音、好友朋友圈、京東各個渠道對這次成交分別貢獻了多少價值?
現實情況往往是很復雜的,在衡量其貢獻價值時,只依靠單渠道歸因分析得到的結果是不科學的,需要引入多渠道歸因分析。常見的多渠道歸因分析模型如下:
- 末次歸因模型:將功勞100%分配給成交前的最后一個環節
- 首次歸因模型:將功勞100%分配給第一個環節
- 線性歸因模型:將功勞平均分配給過程中的每個環節
- 時間衰減歸因模型:距離最終結果時間越短的環節,可以獲得越多的權重
- 位置歸因模型:第一次和最后一次環節各貢獻40%,中間的所有環節平分剩下的20%貢獻
- 自定義模型:根據自身業務的需求,自定義各環節分配比例
沒有完美的歸因分析模型,任何模型都存在它的局限性和不足,如何有效地結合使用場景和模型特點是用好歸因模型的前提。
七、預測變化趨勢:預測分析
了解完問題的現狀,定位到問題的原因后,我們還需要預測問題接下來的發展趨勢。
另一方面,在各行業各領域,只要有核心的業務指標,都要預測核心業績未來的走勢,銷售,市場營銷,運營,財務等,一方面可以對未來的發展趨勢有個大致的掌握,另一方面也可以提前規劃,設定各子部門的KPI,以便盡可能地完成或者超過KPI,所以,如何準確地預測核心指標的變化趨勢非常重要。
什么是預測?用最簡單的術語來說,它是在分析過去和現在的數據,進而預測未來的過程。我們主要根據時間序列數據進行定量預測。我們通過一個案例說明時間序列數據的主要組成。
如下是各年搭乘飛機飛行乘客數量的趨勢。
- 趨勢性:趨勢是事物發展或變化的總體方向。在上面的例子中,我們看到時間序列呈增長趨勢,這意味著在搭乘飛機飛行的乘客數量整體趨勢上是在增加。如下圖中第一張圖所示。
- 季節性:在上述時間序列中可以看到的另一個清晰的模式,就是該變化趨勢以固定的時間周期重復,我們稱為季節性。在特定時間周期內重復出現或重復的時間序列中任何可預測的變化模式都可以說是季節性。下圖中第二張圖所示。
- 隨機性:去除趨勢性和季節性后,剩下的就是一些隨機的、無任何規律的白噪聲。下圖中第三張圖所示。
時間序列預測的模型有很多,主要歸為以下2類:
(1)傳統預測方法
- AR(Auto Regressive Model)自回歸模型
- MA(Moving Average Model)移動平均模型
- ARMA(Auto Regressive and Moving Average Model)自回歸移動平均模型
- ARIMA(Auto Regressive Integrate Moving Average Model)差分自回歸移動平均模型等
(2)現代預測方法
基于機器學習方法、深度學習的預測方法。對于機器學習方法,xgboost,隨機森林及SVM這些都是可以用的,也沒有說哪個模型好用,需要看具體的場景及實驗,總之就是看效果說話。
(3)用Excel也能做預測
黑貓白貓,能抓住老鼠的就是好貓,不需要復雜的算法和模型,用Excel也能做簡單的預測。
以上就是產品、運營工作中7種常見的數據分析方法的內容。
本文由@數據分析星球 原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!