數據分析基礎思維之:細分思維
細分思維可以說是數據分析最重要的思維,這也是一個看起來很簡單,想做好很難的技能。本文作者將從三層境界來分析細分思維,希望對你有幫助。
第一層境界:單一維度細分
估計一半以上的數據分析師還在這個境界。
舉個例子,新用戶數量下降了,怎么分析?
理想情況:
一般的步驟就是拆解,從系統(tǒng)、地域、機型、版本等各種維度找新用戶下降的原因,最后發(fā)現(xiàn)是某個版本出了問題。大功告成!
真實情況:
真實業(yè)務場景很少有這么明顯的問題。往往是從各個不同的維度拆,最后找到一堆有差異的分類維度。每個維度看起來都有點道理,但是拼在一起只能把問題變得更加復雜。數據和業(yè)務人員大家開個會看了半天,發(fā)現(xiàn)一點用都沒有。
單一維度分析法是在分析初期,摸索業(yè)務現(xiàn)狀時經常用的分析方法。在實際分析中,一般不會用到單一維度的分析直接找到答案。
提高單一維度分析的效率,最好的辦法是根據業(yè)務問題有目的地選擇需要分析的維度。
比如新用戶數量下降,一般可以通過兩個維度進行拆分。
第一種維度是新用戶的來源,可以從各應用市場分析,看是全部下跌還是部分下跌。通過來源維度判斷問題的性質,如果是部分下跌,那么可以重新定義問題。如果是全部下跌,就要深入分析為什么全都下跌。
第二種維度是新用戶來源的漏斗,從曝光到點擊到打開APP等不同步驟細分出不同的指標,找到分析轉化鏈路找到轉化的下降環(huán)節(jié),這種增加過程指標的方式可以找到問題原因。
順便提一下,這兩種維度分別是從歸納法和演繹法的角度去思考。所以很多底層思維還是要多了解一下,指不定哪里就出現(xiàn)了。
第二層境界:交叉維度細分
如果單一維度沒用,那自然就會想到用多個維度一起找原因。
問題:客單價下降,是哪部分用戶下降?
理想情況:
先用單一維度一個個去拆分客單價,然后用差異明顯的維度組合起來看客單價差異。最后區(qū)分度大的維度強強聯(lián)手,整出了一個巨牛X的交叉維度。男性一線城市安卓機型的用戶下降最明顯,數據和業(yè)務看了都說好~
真實情況:
大多數人認為的A維度有差異,B維度有差異,那么A和B組合起來一定差異更大。這是一個非常錯誤的認識。
現(xiàn)實中也許A維度和B維度細分出來都沒啥區(qū)別,但是一組合區(qū)別就特別明顯。
比如將考試成績按照性別和科目分類,分為男生女生、理科文科。
按男女看,大家分數都差不多,平均分都是75分。
按照文科理科看,成績也差不多,也是75分。
但是兩者交叉之后,男生的理科高,文科低。而女生的文科高,理科低。
看到問題了吧,先用單一維度排查,再將有效的單一維度組合起來形成交叉維度的做法是不可行的,并不一定能找到真正有效的交叉維度。
有些同學說,這題還不簡單,我會,用暴力破解??!
我對多個維度進行兩兩交叉,看兩兩交叉的維度有沒有差異不就行了。
話是這么說沒錯,但是如果有10個維度,你兩兩分組的情況就有45種之多。如果是三個交叉分組呢?如果有20個維度呢?
用暴力破解的辦法,在真實的業(yè)務場景下,時間成本非常大。
那交叉維度該怎么做呢?
要做好交叉維度的細分,必須先從業(yè)務邏輯入手,從業(yè)務邏輯梳理出合理的分類,再用數據區(qū)分各個分類。
舉個例子,投資類產品的運營人員希望對不同的用戶進行精細化運營,希望數據分析師提供一下用戶的分類維度。
這個時候,最好的辦法就是和業(yè)務方溝通幾次,看一下他們對用戶的了解和一些假設。通過數據驗證假設要比自己從數據里找出快速得多。
在細分維度時需要考慮具體的業(yè)務場景和運營手頭擁有的資源。
運營能打的牌其實很有限:持續(xù)提供的不同風險等級的理財產品,以及偶爾進行的讓利促銷活動。
所以我們能做的分組最好是能夠貼合運營手中的牌。我們可以把用戶的風險偏好和用戶的資金狀況進行交叉,得出一個矩陣,對矩陣不同象限的用戶進行不同的運營動作。
有了思路,接下去就是思考如何用數據的方式區(qū)分高價值和低價值,以及用戶的風險偏好問題。
這種維度往往都不在現(xiàn)有的數據庫中,需要數據分析師自己根據用戶的屬性行為等數據計算出一個得分,再用得分進行劃分。
第三層境界:創(chuàng)造新維度
最高層的境界是能用理論指導實踐,創(chuàng)造新維度。
第二層境界的末尾,我們提到現(xiàn)實環(huán)境下的細分,很多時候是沒有現(xiàn)成的維度直接細分的,需要我們通過業(yè)務假設,先預設分類維度,再找出分類方法。
預設分類維度這個事,有時候和業(yè)務方溝通也很難得出好的方法。怎么辦呢?
我們可以用理論指導實踐,聽著很玄乎是不是,別急,我舉個例子。
如果我們按照轉化的過程指標拆分,會得到一個轉化漏斗。我們一般是按照頁面跳轉的場景來做漏斗各層級之間的區(qū)分。比如從曝光到轉化一共有3個頁面,分別是廣告頁,落地頁,支付頁,那么我們的漏斗一般也就是按照這樣三層設置的。
有沒有更好的細分方法?
我寫過一篇《轉化分析的一種新的漏斗模型》一文。文章以用戶購買決策模型為理論指導,將用戶的轉化細分維度從頁面跳轉改成了用戶心理過程。
整個過程以心理學的研究理論為基礎,推演到業(yè)務場景中,再指導數據分析。
感興趣的朋友可以去讀一讀,這里就不多說了。
還可以參考很多其他公司的成熟經驗,用別人的經驗套用在自己的業(yè)務上。
比如線下餐飲連鎖的管理,可以參考麥當勞的管理方式。麥當勞創(chuàng)造了一個“典型市場”的概念。
比如北京就有好幾種“典型市場”,北京王府井中心的店,和在巴黎市中心、紐約市中心的店就屬于同一個典型市場,開在北京郊區(qū)的店,就可能和山西大同或者泰國清邁一樣,屬于另一個典型市場。這種管理方式考慮了每家店的人流密度和商業(yè)價值,相比按城市劃分能更容易發(fā)現(xiàn)單店的問題。
如果有分析線下場景的分析師,就可以模仿這種方式,將單店從價值上進行分類,而不是簡單地分析華東區(qū)如何,華南區(qū)如何。
再比如用戶分群,細分的維度那么多,選哪個入手?下圖就是騰訊的用戶分群步驟,如果做用戶分群可以按照上面的步驟模仿處理,能節(jié)約不少摸索的時間。
互聯(lián)網公司這類經驗分享很多,留意各種論壇和互聯(lián)網社區(qū),只要你做的不是最前沿的領域,一般都能找到相應的經驗分享和成熟套路總結。
總結
有很多細分衍生出來的方法,比如矩陣、RFM模型、漏斗分析等等,其實都算細分的方式。
很多同學入門數據分析,學了一些細分的文章,停留在第一層次甚至還不到第一層次。要做好細分,還是需要提高內功,多了解業(yè)務和核心邏輯。
#專欄作家#
三元方差,公眾號:三元方差(sanyuanfangcha),人人都是產品經理專欄作家。專注用數據驅動業(yè)務增長,擅長數據分析、用戶增長。喜歡閱讀、思考和創(chuàng)作。
本文原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協(xié)議
關于多維度交叉,提一個思路供討論:確定目標指標后,基于一系列維度,使用多因素分析ANOVA模型進行建模。ANOVA可以一次性討論所有維度是否重要,以及各個維度的n階交叉項是否重要。