九大數據分析方法:相關分析法
編輯導語:在平常工作中,我們常常會需要衡量兩者之間的關系,這時,我們就可以用到一種基礎的分析方法——相關分析法。本文介紹了相關分析法的使用方法以及其不足之處,希望對你在數據分析中有所幫助。
在工作中,我們經常會問:
- 下雨和業績下降有多大關系?
- 銷售上漲和新品上市有多大關系?
- 營銷投入與業績產出有多大關系?
這些問題,都有一個基礎分析方法有關:相關分析法。
一、什么叫“相關
簡單來說,相關就是兩個事件之間有關系。比如:
- 廣告投入與銷售業績
- 下雨刮風和門店人流
- 用戶點擊和消費行為
即使沒有做分析,直觀上看這些事件之間也有關系。但是不做分析的話,具體是啥樣的關系,很難說清楚。而相關分析,就是找出這種關系的辦法。
二、什么是“相關分析”?
相關分析,特指:找到兩個數據指標之間的相關關系。比如一個APP里,用戶反復瀏覽一款商品,所以他會買嗎?
- 一派認為:看的多,說明用戶感興趣,所以會買
- 另一派認為:看了這么久都不買,那肯定不會買了
- 還有一派認為:看多少次跟買不買沒關系,得看有沒有活動
聽聽似乎都有理,最后還是得數據說話。這里討論的,就是:用戶瀏覽行為與消費行為之間,是否有關系的問題。相關分析,即要找出這兩個指標之間的關系。
三、直接相關關系
注意:指標之間可能天生存在相關關系。常見的有三種形態:
- 在結構分析法中,整體指標與部分指標之間關系
- 在指標拆解法中,主指標與子指標之間的關系
- 在漏斗分析法中,前后步驟指標之間的關系
(如下圖所示)
這三種情況,稱為:直接相關直接相關不需要數據計算,通過指標梳理就能看清楚關系。直接相關的情況下,兩個指標出現同時上漲/下跌的趨勢,是很好理解的。比如:
- 整個公司業績都不好,所以A分公司業績也很差(結構分析)
- 客戶數太少了,所以整體業績不好(主指標、子指標)
- 看到廣告人數太少了,所以最后轉化不好(前后步驟)
如果直接相關的兩個指標沒有同漲同跌,往往意味著問題。比如做用戶增長,注冊的新用戶數量大漲,但付費轉化率持續大幅度下跌,這就說明獲客效率在下降,可能是目標用戶已耗盡,也有可能是渠道在造假,也有可能是獲客方法有誤,總之要深入分析(如下圖)。
四、間接相關關系
有些指標并非直接相關,但理論上是有關系的。比如品牌廣告與銷售收入,理論上肯定是存在關系:廣告多了,知名度高了,銷量肯定好。
但是品牌廣告又沒有帶貨鏈接,不能直接說:有5000萬的銷售業績是用戶通過廣告鏈接購買的。此時就是典型的間接相關關系(如下圖)。分析間接相關關系,有2種常用方法,一種是散點圖法,可以直接做散點圖,發現相關關系(如下圖所示)
另一種是計算相關系數。這里先不講相關系數具體公式,小伙伴們只要記得excel里對應的操作即可(如下圖)。
計算出可以發現,廣告投入與銷售兩個指標之間,確有相關關系。至于具體是怎么相關的,可以再做進一步研究。間接相關關系,經常用來找改進業績的措施。比如互聯網行業里著名的“魔法數字”法,本質就是找用戶瀏覽、點贊、分享、登錄等行為,與用戶留存、付費行為之間的相關關系。
如果發現:當用戶點贊4次以后,用戶的90天留存會明顯增高。那么就把這個“4次留存”稱為魔法數字,然后努力推動用戶完成4次點贊。
五、相關分析的不足之處
世界上沒有完美的分析方法,相關分析有兩大不足之處。
1. 相關不等于因果
兩個指標相關關系,本質上只是一條數據公式計算出來的結果,至于兩個指標為啥相關?不能直接從計算里得結論。實際上只要兩個指標走勢相似,在計算的時候就能顯示出相關關系。
這里有一個經典例子,下圖是我在小區里種的一棵樹的高度,與我國GDP之間的相關分析。大家會發現:哇塞!這倆指標完美相關哦!那么我種的這顆樹就是我國的龍脈,能保佑我國經濟騰飛咯?——當然不是!這就是相關不等于因果的直接體現。
2. 相關分析不能解決非量化指標問題
很多時候,我們想找的關系不能用數據量化。比如我們想知道:旗艦店是不是比社區店更能吸引消費者。一個店是不是旗艦,取決于位置、裝修、宣傳等諸多因素,不能粗暴的用開店面積、員工人數等指標來代替。想分析這種非量化特征與指標之間的關系,需要用到另一種分析方法:標簽分析法。
作者:碼工小熊,微信公眾號:碼工小熊
本文由 @碼工小熊 原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議
寫的非常好