七種常見的數據分析方法拆解,打工人必備|6000字解析
編輯導語:數據分析是用適當的統計分析方法對收集來的大量數據進行分析,將它們加以匯總和理解并消化,以求最大化地開發數據的功能,發揮數據的作用。本文作者分享了七種常見的數據分析方法拆解。推薦工作中需要數據分析的用戶閱讀。
數據分析一直是我們互聯網人辨別方向的不二法門,我們通過對數據的觀測來判斷事物的發展趨勢,也常常利用數據的思維來辯證的為決策做參考。
下面就給大家詳細拆解七種常見的數據分析,讓我們的數據分析少走彎路。
一、象限分析法
從這張圖,你能分析出來什么呢?
X軸從左到右是點擊率的高低,Y軸從下到上是轉化率的高低,形成了4個象限,這就是我們要說的象限分析法。針對每次營銷活動的點擊率和轉化率找到相應的數據標注點,然后將這次營銷活動的效果歸到每個象限,4個象限分別代表了不同的效果評估。
- 象限一:高點擊高轉化,點擊高代表營銷創意打動了受眾,轉化高代表被打動的受眾是產品的目標用戶;
- 象限二:高轉化低點擊,同樣的,高點擊代表被打動的受眾是產品的目標用戶,但低點擊代表的是營銷創意沒有打動用戶;
- 象限三:低點擊低轉化,這個象限是最糟糕的營銷活動了,投放廣告點擊少,點擊用戶轉化低,創意無效,用戶不精準;
- 象限四:高點擊低轉化,這個象限的營銷活動要給策劃和文案加雞腿,但就要給渠道扣績效了。這種象限的營銷活動一定程度上有標題黨的嫌疑。
1. 象限分析法的作用
(1)找到問題的共性原因
通過象限分析法,將有相同特征的事件進行歸因分析,總結其中的共性原因。例如案例中第一象限的事件可以提煉出有效的推廣渠道與推廣策略,第三和第四象限可以排除一些無效的推廣渠道;
(2)建立分組優化策略
針對投放的象限分析法可以針對不同象限建立優化策略,例如提升象限二的投放創意,象限四的投放渠道。
二、公式拆解法
1. 什么是公式拆解分析法
所謂公式拆解法就是針對某項指標,用公式表現該指標的影響因素,例如日銷售額的影響因素是各商品的銷售額,找到影響因素后,需要對影響因素的影響因素進行拆解。
看這張圖,以日銷售額為例做了一次公式拆解分析,這次拆解一共包括了5層,最后一層是對推廣效果的衡量。
第一層:找到日銷售額的影響因素:
日銷售額=各商品的銷售額之和,也可以拆解為各渠道的銷售額之和、各銷售人員的銷售業績之和。公式拆解分析法的第一步是需要確定要分析的指標,然后找到這個指標的直接影響因素。
第二層:找到各商品銷售額的影響因素:
各商品銷售額=銷售數量*單價。
第二層拆解需要找到影響目標指標的影響因素,例如各商品銷售額的影響因素是商品的銷量和單價,這里是簡單舉例算法,在實際分析中,還需要計算優惠政策等因素。
第三層:找到銷售數量的構成因素:
銷售數量=店鋪新客購買數量+店鋪老客購買數量+復購用戶購買數量。
這里對銷售數量的拆解是針對購買人群的特征來劃分的,這樣分析的目的在于找出不同客群的購買影響因素。而在實際應用中,因分析目的的不同,對指標影響因素的拆解也不同,例如銷售數量可以拆解為渠道A銷量+渠道B銷量+渠道C銷量。
第四層:找到新客的來源:
店鋪新客購買數量=渠道A轉化新客購買數量+渠道B轉化新客購買數量+渠道C轉化新客購買數量+……
這樣拆分的目的在于找出不同渠道來源用戶的后續轉化特征,從而找到購買力高的用戶來源渠道。
第五層:計算渠道推廣回報:
渠道推廣回報的計算方式就是A渠道新客銷售額-推廣成本。
從日銷售額拆解到最后一步,是拆解出了對渠道推廣效果的分析,這是對店鋪新客的拆解,那么同樣,也可以對店鋪老客或者復購客戶進行拆解,例如復購用戶可以拆解出復購周期、復購次數、累計復購數量等因素,對復購用戶給予特殊購買通道或提供有約束力的購買政策,例如年卡之類的。
公式拆解法是針對問題的層級式解析,在拆解之前,不能盲目拆解,需要有目的性的找方向,從而挖掘原因。例如在上文案例的拆解過程中,拆解方向可以分為兩種,一種是對績優指標的拆解,找出銷售額上漲的原因,另一種是對績劣指標的拆解,找出銷售額下降的原因。
三、對比分析法
1. 什么是對比分析法
上面這張圖表是一個常見的柱狀圖,而柱狀圖的作用在于直觀對比各項數據之間的差異。
上面這張柱狀圖是針對9月份各渠道獲客統計的一個對比分析圖表,針對各渠道的下載量、訪問量、注冊量進行對比。
對比要點一:對比建立在同一標準維度上。
在這張圖中,首先要關注到的對比要點是各項數據的對比要基于同一維度。這張圖是針對9月份的渠道推廣效果的對比統計,9月份就是第一個對比標準,也就是時間維度。
在時間維度下,后續對比的結果都是基于這個標準產生的,也就是在9月份這個時間范圍內的數據對比,并不能用10月份的數據與這個圖表中的數據對比。當然,除了時間維度,也可以使用空間維度,例如渠道A在1-12月每月的數據對比。無論用什么維度,對比要建立在一個大的標準下。
對比要點二:拆分出相關影響因素。
在時間這個大維度下,我們對各渠道的獲客效果進行了拆分,也就是將獲客效果衡量分為了訪問量、下載量和注冊量。這三個維度的數據作為判斷渠道獲客的標準,從對比中找出各渠道的優劣。
例如通過這個圖表可以看出,渠道A的訪問量最高,渠道B的下載量最高,渠道A的注冊量最高,那么這樣的對比結果能夠說明什么問題呢?我們能夠看到,渠道A從訪問到下載的流失比較嚴重,渠道B從下載到注冊的流失比較嚴重,而渠道C在訪問量、下載量都低于其他渠道的基礎上,渠道C的注冊量與渠道A并沒有相差太多。
也就是說,我們可以提出一個假設,渠道C的獲客效果更好,為了印證這個假設,我們可以在影響因素中再加入渠道投放花費這個維度,如果渠道A的高訪問是因為高花費,渠道C的低訪問是因為低花費,那么基本可以印證這個假設。
對比要點三:各項數據對比需要建立數據標準。
在這張圖中能夠看到一個比較奇怪的現象,渠道B的下載量比訪問量還要高,為什么會這樣呢?
我們在這張圖表中加入了一個中間標準數據,對各項數據進行了一次標準換算。假設訪問量的真實數據為1萬是,標準數據為1,下載量的真實數據為1千時,標準數據為1,注冊量的真實數據為100時,標準數據為1。
經過標準數據的換算,我們將各項數據放在一張圖表上時,對比的差異化會更明顯。
對比分析法的維度可以分為同比、環比、定基比等不同的對比方法:對比分析在于看出基于相同數據標準下,由其他影響因素所導致的數據差異,而對比分析的目的在于找出差異后進一步挖掘差異背后的原因,從而找到優化的方法。
四、可行域分析
1. 什么是可行域分析
上方左側圖是一張福格模型的圖,福格大哥將影響用戶行為動機的因素拆分為mat三個因素。
m是付出行動的動機,a是付出行動的能力,t是觸發行動的條件,簡單理解就是大眾只對自己感興趣并且有能力滿足的事物會產生下一步行為。
比如新iphone賣1萬,大多數人是買的起的,這就有了付出行動的能力,而產生行為的動機就取決于新iphone的創新能力,當喬布斯從文件袋里掏出ipad的時候,將大家的動機調動到了最高點,但價格限制了一部分人付出行動的能力。
動機越高,需要付出的能力越低,形成的有效觸發區域就越廣,福格模型的觸發有效區,我們就將其稱之為可行域。
2. 可行域分析的應用
看上方右側圖表是針對推廣創意做的一次象限分析,橫軸代表點擊量的從低到高,縱軸代表轉化率的從低到高。
而點擊率代表的營銷創意的有效性,轉化率代表的是推廣渠道的精準性,在這張圖表上我們分成了4個象限,但同樣是高點擊、高轉化的象限中,也有具體數據的差別。諸葛io-專注于用戶行為分析首先我們看到2條紅色的曲線,在高點擊和高轉化的區域中我們畫了一條紅色曲線,這條曲線上方是“高可行域”,曲線下方是低可行域;而在低轉化與低點擊的象限中我們也畫了一條曲線,這條紅色曲線的下方是最不可行域。
什么意思呢?
其實就是對點擊率和轉化率的高低做了一個細化分層,點擊率和轉化率是每一次推廣創意的數據化表現,而畫出一個可行域,是對營銷活動的歸類。
那么這條曲線到底要畫在什么樣的數據標簽上?
這需要在實際分析工作中做總結,也就是說,可行域分析實際上是一種自己建立的數據分析模型,根據具體數據不斷修正調整可行域的范圍,對業務指標進行有效評價。
除了兩條紅色曲線外,還有兩條藍色曲線,一條是渠道可行域,另一條是創意可行域,這兩條曲線是對渠道有效性和創意有效性的評價,滿足相應區域條件的事件即可作為有效事件經驗,為后續的運營增長提供支持。
五、二八分析法
經濟學定律中說80%的財富掌握在20%的人手中,而在運營中可以發現,80%的貢獻度來自于20%的用戶。
這張圖中體現了2個法則,也就是二八法則和長尾理論,在數據分析中,建議將這個兩個理論合起來用。
但實際上呢,二八法則和長尾理論是相對的,二八法則告訴我們說,你要重視頭部用戶,也就是能產生80%收益的那20%的用戶或商品,而長尾理論告訴我們說要重視長尾效應,也就是剩余那20%的收益。
1. 在數據分析中二八法則的應用
在數據分析中,二八法則和長尾理論和應用于用戶分析和業務分析2個方面:
(1)20%的頭部用戶:憑什么那么優秀
在用戶分析上,通過二八法則建立用戶分群,將所有用戶切割成一個又一個的實驗組,對實驗組的用戶進行單體特征分析,目的只有一個,同樣都是用戶,憑什么你們那么優秀?
在數據分析中,單體分析與群體特征分析同樣重要,然而我們不可能對上萬的用戶進行個體分析,可能的是對頭部用戶進行個體行為分析,建立群體樣本。
在運營數據分析中,可以針對核心指標分別找到20%的用戶:
- 購買數量前20%的用戶
- 購物金額前20%的用戶
- 日訪問次數前20%的用戶
- 訪問頁面數量前20%的用戶
- 轉發次數前20%的用戶
- ……
也就是說,你想提升什么指標,就找到這個指標表現優秀的用戶。那么20%的用戶也很多怎么辦呢?可以主動設置數據區間。
例如想要提升用戶的訪問時長,我們可以對頭部用戶的訪問內容、路徑進行分析找到原因,20%的頭部用戶訪問時長從10分鐘到30分鐘不等,那么我們可以將頭部用戶的訪問市場切分為10分鐘、15分鐘、20分鐘、25分鐘、30分鐘,獲得不同的用戶組,從這個用戶組中找到相應的20%的用戶進行特征分析。
這里需要注意的是,同組20%用戶的特征提升只對同組剩余80%的用戶有效,例如訪問時長10-15分鐘的用戶中,頭部20%的用戶的行為特征可以對剩余80%的用戶起效,但對日訪問5分鐘的用戶效果并不大。
(2)20%的頭部業務:帶頭大哥的應有覺悟
針對業務分析的目的在于找到爆款內容的特征。
例如資訊類產品中對閱讀量頭部文章的分析,一方面是對文章的特征進行分析,另一方面,是對閱讀用戶的分析。
爆款文章或商品背后,代表的是對大多數用戶興趣的滿足,充分喚起了用戶的行為動機,而在用戶分析中,我們需要進一步找到這部分用戶日常閱讀的頭部內容,進行特征的延展分析。
六、假設分析法
1. 什么是假設分析法
舉個栗子:
“小明和媽媽買了10本書,正好花了100塊錢,書的單價有8塊錢和13塊錢2種,那么8塊錢的書和13塊錢的書各買了幾本?
解題思路:
首先,假設這10本書都是8塊錢買的,那么10本書一共是80塊錢,那還多出來20塊錢,是算錯賬了么?不是,顯然多出來那20是13塊錢1本的書多出來的。13塊錢的書比8塊錢的書每本多了5塊錢,20塊錢可以買4本,那么可以得出結論了,13塊錢的書有4本,那么8塊錢的書有幾本呢?
對了,6本。
這道6年級的數學題里就用到了假設法,假設所有書都是8塊錢,那么在數據分析中,什么是假設法呢?簡單理解,假設法是在已知結果數據,在影響結果的多個變量中假設一個定量,對過程反向推導的數據分析方法。
2. 假設法在運營分析中的應用
假設法在運營分析中最常見的有2種場景:
場景一:已知結果找原因,做過程變量假設。
例如:某內容社區在11月份的發帖數相比10月份下降了20%,針對這個結果,該如何分析原因?
面對這樣一個無厘頭的問題,該怎么分析呢?結果數據是發帖數下降了20%,那么影響發帖數的有哪些因素呢?
我們可以將發帖數量按照用戶分層進行拆分,例如老用戶發帖數量和新用戶發帖數量,也可以按照具體發帖篇數進行拆分,例如發帖5篇以上的用戶,發帖3-5篇的用戶,發帖1-3篇的用戶,拆分后將11月與10月份相同維度的數據進行對比,找出變量。
例如經過拆解后發現,發帖1-3篇的用戶相比10月份減少了40%,其他篇數的用戶量還高于10月份,那么問題就出在了發帖1-3篇的用戶身上。
那么發帖1-3篇的用戶為什么減少了呢?我們可以提出2個假設:
- 假設10月份發帖1-3篇的用戶成長為更加活躍的用戶了,造成發帖3-5篇的用戶增加,1-3篇的用戶減少;
- 假設10月份發帖1-3篇的用戶流失率比較高,同時11月份新用戶轉化少,導致這一群組用戶數量變少。
那么針對這2個假設,需要對10月份發帖1-3篇的用戶與11月份發帖3-5篇及5篇以上的用戶進行追蹤分析,同時分析11月份新增用戶與10月份新增用戶在留存和活躍上的對比。
場景二:已知目標找過程,做結果假設。
例如:12月份的銷售KPI為1000萬,環比11月份上升20%,該如何做一份銷售方案?
這是在做工作計劃時最常見的需求,以12月份需要達成1000萬的銷售KPI為例,拆分銷售KPI的相關影響因素,同樣有2個拆解維度:
(1)從商品角度做拆分
要達成1000萬的銷售額,有多種假設方式,例如假設現有商品銷售額與11月相同,新品銷售額達到200萬,那么為了實現這個結果假設,去做能夠支持200萬銷售額的的過程方案,例如在推廣渠道預算上、倉儲物流上、人力配置上等方面做計劃;還可以針對幾款產品提出銷售額增長的假設;
(2)從人群角度做拆分
要達成1000萬的銷售額,一方面挖掘老客戶的購買力,另一方面增加新客戶的來源渠道,假設老用戶復購銷售500萬,那么針對老用戶設計營銷活動。
假設分析法是在現實應用中常用的數據分析思路之一,數據分析的過程是不斷的提出假設、驗證假設的過程,通常我們遇到的不知道如何下手的數據分析,可以通過假設法來破局。
七、同期群分析
簡單來說,就是將?戶進?同期群劃分后,對?不同同期群組?戶的相同指標就叫同期群分析。
1. 同期群分析的作用
例如:9月份新增用戶10萬人,10月份新增用戶15萬人,但9月份新增用戶的30日留存用戶為1萬人,10月份新增用戶的30日留存用戶也為1萬人,哪個月的運營業績更好呢?
通過同期群分析,我們可以發現9月份和10月份新增用戶的留存用戶是相同的,那么9月份的留存率更高,從用戶質量角度考慮,9月份的運營成果更好,從有效用戶角度考慮,2個月的運營成果相同,從新增用戶角度考慮,10月份的運營成果更好。
同期群分析的目的在于透過現象找到結果,以時間維度建立同期群,除按時間維度考慮,也可以對來源渠道等維度建立同期群。
以上是七種比較常見的數據分析法,只是一些基本的入門概念,希望有一點點幫助。
至于在實際工作中如何運用,是一件很復雜很困難的事,需要將這些方法適配到自己所在的業務,甚至需要根據實際業務進行一些修改,這都需要很多的實踐和思考。
我國的互聯網時代剛剛完成野蠻生長的階段,大家對流量的獲取已經有所理解和應用,但在互聯時代的后半場,對數據的理解和應用將成為制勝的關鍵。
我始終認為互聯網行業的未來在運營,運營的未來則在精細化運營和有效的數據分析管理,持續學習,讓我們工作用數據說話。
本文由 @諸葛io 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
有個疑問哦,復購用戶不就是老客嗎?
二八法則和長尾理論是相對的,文章解釋的很到位