你 VS 數據分析高手,最大的差異竟是……
在數據分析的世界里,區分新手和高手的往往不是工具的使用技巧,而是對業務深度理解的標簽積累。本文通過一個店鋪分析的實例,揭示了如何通過構建有業務含義的標簽來深化數據分析,從而提供更有價值的業務洞察。
很多同學覺得,相對于高手而言,自己在工作中進步很少,拿著數據,翻來覆去就是同比、環比,做了兩三年也沒進步。在這背后,有個很大問題是:缺少有業務含義的標簽積累,導致只會零散地看數據,既無法推導有業務意義的結論,也積累不了業務分析經驗。
數據分析高手日常非常重視標簽的積累,今天我們就借一個例子,讓大家看出其中的區別。諸位坐好扶穩,我們馬上發車。
一、問題場景
某同學提交了一份店鋪分析報告,指出:A門店業績排行靠后,低于其他店,建議搞高。然而沒想到,這么平平無奇一句話,立馬捅了馬蜂窩了。業務部門同事開始七嘴八舌地爭論:
甲同事:A是新開門店,不應該和其他店這么比,A其實很好
乙同事:雖然A是新開店,但是A是標準店,不能和mini店比,A其實不好
丙同事:雖然A是標準店,但A是撿漏店,不能和普通標準店比,A其實很好
丁同事:雖然A是撿漏店,但是A營銷力度并不低于普通店,A還是不好
戊同事:雖然A營銷力度很大,但是營銷投入并不重,A還是很好
……
大家吵成一團。
最后總結:“數據分析做得不深入,只有數字沒解讀,要結合業務深入分析”。留下做數據的同學在風中凌亂:
“你們說的都是啥???”
“我要怎么深入法???”
那么,要怎么深入分析呢?
二、破局關鍵:標簽的業務含義
這里最大的問題,在于業務討論的各種細節,無法直接表示成一個數據指標,導致量化都做不了,更不要提分析了。而量化業務的關鍵在于貼標簽。注意!很多同學一提標簽,本能地想到“性別、年齡、包裝尺寸、包裝顏色”這些數據庫里現成的,直接從基礎信息導入的標簽。這些基礎標簽,大部分時候沒有直接的業務含義,對業務解讀能力很弱,需要二次加工才好用。
有業務含義的標簽,則是直接指向業務關心的問題,對問題指標有區分度,對業務行為有指導能力的標簽。比如“這個店長能力不行”,這就是個有業務含義的標簽,如果確認了能力不行,那下一步就是換店長或者做培訓,對業務行為指導很清晰。這種標簽,需要復雜的轉化過程與數據驗證,不是一蹴而就的。
那么要怎么打呢?一步步來看。
三、從整理業務假設開始
既然是打業務標簽,首先就得從整理“影響業務指標的假設”開始。這樣打出來的標簽才是直接指向業務問題的。比如開頭的問題,我們可以根據業務部門七嘴八舌的議論,分別列出:
1、待描述的業務對象
2、衡量業務對象好壞的指標
3、影響指標的假設
4、假設的影響方向
這樣就有了一張清晰的,待開發的標簽列表(如下圖):
下一步可以一一進行開發。
四、先做簡單的標簽
在開發的時候,先做能用基礎標簽+現有數據指標,直接計算出來的標簽。這種標簽也被稱作:規則標簽。即業務給到計算規則后,可以基于基礎標簽+現有指標直接計算。這種標簽獲得速度快,也容易驗證。
比如:是否新開店。理論上只要根據開店日期做分類即可。比如規定6個月及以內的都是新開店。那么大于等于7個月的就是老店,小于等于6個月的都是新店。
這里有個關鍵問題:這個“6個月”的標準要怎么來。這里有兩種做法:
第一種,如果業務部門有共識的話,我們可以直接用業務的標準,比如大家共識了是6個月,那就是6個月。
第二種,業務沒有具體數值的共識,但是有一個概念,比如:
1、新開店階段,門店閉店概率很高
2、新開店階段,門店營業額/訂單量處于上升期
此時,雖然沒有明確標準,但是業務給出找標準的方法。我們可以統計所有門店的生命周期數據,看閉店概率/營業額/訂單量的拐點在哪里,從而清晰標準(如下圖)。
原則上,即使業務口頭給出了第一種標準,我也建議大家引導業務做出第二種標準。因為第二種才是有業務邏輯的標準。萬一哪天不同業務部門吵架,或者業務換了領導,不再認可第一種標準,第二種標準就是調整的原則。
類似地,門店面積標簽也可以這么打。先列出業務假設:
1、門店面積大,對應的成本就高
2、營業面積大,收入也應該高。
之后就可以把現有的幾種店面面積列清單,看參數范圍,做出標簽(如下圖)。
這里特別要提醒:很多同學做標簽,不和業務溝通,自己憑感覺或者看數據分布下判斷,比如怎么區分新店,丫自己拍個3個月……這種閉門造車的結果,很容易被業務挑戰,也無法與業務場景結合,最終使標簽工作淪為自嗨。
有了簡單標簽打底,可以再來處理復雜標簽情況。
五、常見的復雜標簽
常見復雜情況一:一個業務問題,需要分幾個標簽來描述。比如“促銷”這個標簽,促銷形式,力度,可能需要分開描述。比如:
1、促銷范圍:參與促銷的商品SKU數量
2、促銷力度:按原價折算,用戶拿到優惠比例
3、促銷形式:買贈、滿減、送禮、加一件……
(如下圖)
可能一個業務場景,需要好幾個標簽組合才能說清楚。
常見復雜情況二:兩個/多個基礎標簽合并出來的標簽(又稱綜合計算標簽)。比如“撿漏店”,潛臺詞是:這個店面積很大,但店租比正常低,同時客流并沒有比正常少很多,因此被我們撿漏了。這個時候,撿漏店是有三個基礎標簽拼接出來的(如下圖)。
類似的,比如:“這個店長能力不行”,怎么證明能力不行,可能得從業績、工作數量、個人履歷好幾個維度來論證,考察的維度一多,就涉及如何付權重問題。付權重本身有一套方法論,同學們感興趣的話,我稍后單獨分享。
常見復雜場景三:標簽是預測未來的情況,并非已發生的情況,比如我們預判這個店是“高潛力門店”,因此要求它表現比普通更好。注意!預測本身是個復雜的活,可以基于規則判斷,可以建模,建模也有好幾種方式,因此處理起來略復雜,有興趣的話,也是稍后單獨分享。
總之,經過這么一堆復雜計算,現在標簽已經打好,可以利用分析了。
六、標簽的綜合利用
標簽的直接應用,就是把復雜的業務問題量化,進而進行分析和檢驗。比如文章開頭那一堆復雜的業務理由,用標簽就可以直接做單維度對比,檢驗說法。
如果有多個標簽疊加,則可以構建復雜的分析邏輯,一層層進行推導。這種復雜的分析邏輯,就是我們常說的“深入分析”,一般習慣性,把考慮了很多種情況,稱為“分析全面”,把推導了多少層,稱為“分析深入”(如下圖)。
當然,標簽不止這一種用法,比如標簽可以作為進一步建模的特征值,輸入模型做綜合性評估/預測。很多同學的評估模型/預測模型做得不準確,就是因為缺少標簽積累,直接把幾個簡單的原始數據懟進模型。
比如,標簽還可以用來推導業務行動。諸如“店長能力不行”“營銷力度不足”,可以直接導向“我要培訓店長”“我要增加營銷投入”這種結論。
綜上,深入分析、建模、提業務建議,標簽是很重要的一環。同學們可以試著多建有業務含義的標簽,特別是涉及“盲盒”狀態的業務,比如線上廣告投放,線下銷售跟進,商品選品等,標簽的作用更大。
本文由人人都是產品經理作者【接地氣的陳老師】,微信公眾號:【接地氣的陳老師】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!