你和數據分析高手之間,只差一個標簽
編輯導語:涉及“盲盒”狀態的業務,比如線上廣告投放,線下銷售跟進,商品選品等,標簽發揮了很重要的作用。本文介紹了有業務含義的標簽積累,量化業務的關鍵就在于貼標簽,感興趣的小伙伴快來看看吧!
很多同學覺得自己在工作中進步很少,拿著數據,翻來覆去就是同比、環比,做了兩三年也沒進步。在這背后,有個很大問題是:缺少有業務含義的標簽積累,導致只會零散地看數據,既無法推導有業務意義的結論,也積累不了業務分析經驗。
今天我們就借一個例子,讓大家看出其中的區別。諸位坐好扶穩,我們馬上發車。
一、問題場景
某同學提交了一份店鋪分析報告,指出:A門店業績排行靠后,低于其他店,建議搞高。然而沒想到,這么平平無奇一句話,立馬捅了馬蜂窩了。業務部門同事開始七嘴八舌地爭論:
- 甲同事:A是新開門店,不應該和其他店這么比,A其實很好
- 乙同事:雖然A是新開店,但是A是標準店,不能和mini店比,A其實不好
- 丙同事:雖然A是標準店,但A是撿漏店,不能和普通標準店比,A其實很好
- 丁同事:雖然A是撿漏店,但是A營銷力度并不低于普通店,A還是不好
- 戊同事:雖然A營銷力度很大,但是營銷投入并不重,A還是很好
- ……
大家吵成一團。最后總結:“數據分析做得不深入,只有數字沒解讀,要結合業務深入分析”留下做數據的同學在風中凌亂:
- “你們說的都是啥???”
- “我要怎么深入法???”
那么,要怎么深入分析呢?
二、破局關鍵:標簽的業務含義
這里最大的問題,在于業務討論的各種細節,無法直接表示成一個數據指標,導致量化都做不了,更不要提分析了。而量化業務的關鍵在于貼標簽。
注意!很多同學一提標簽,本能地想到“性別、年齡、包裝尺寸、包裝顏色”這些數據庫里現成的,直接從基礎信息導入的標簽。這些基礎標簽,大部分時候沒有直接的業務含義,對業務解讀能力很弱,需要二次加工才好用。
有業務含義的標簽,則是直接指向業務關心的問題,對問題指標有區分度,對業務行為有指導能力的標簽。比如“這個店長能力不行”,這就是個有業務含義的標簽,如果確認了能力不行,那下一步就是換店長或者做培訓,對業務行為指導很清晰。這種標簽,需要復雜的轉化過程與數據驗證,不是一蹴而就的。
那么要怎么打呢?一步步來看。
三、從整理業務假設開始
既然是打業務標簽,首先就得從整理“影響業務指標的假設”開始。這樣打出來的標簽才是直接指向業務問題的。比如開頭的問題,我們可以根據業務部門七嘴八舌的議論,分別列出:
- 待描述的業務對象
- 衡量業務對象好壞的指標
- 影響指標的假設
- 假設的影響方向
這樣就有了一張清晰的,待開發的標簽列表(如下圖):
下一步可以一一進行開發。
四、先做簡單的標簽
在開發的時候,先做能用基礎標簽+現有數據指標,直接計算出來的標簽。這種標簽也被稱作:規則標簽。即業務給到計算規則后,可以基于基礎標簽+現有指標直接計算。這種標簽獲得速度快,也容易驗證。
比如:是否新開店。理論上只要根據開店日期做分類即可。比如規定6個月及以內的都是新開店。那么大于等于7個月的就是老店,小于等于6個月的都是新店。
這里有個關鍵問題:這個“6個月”的標準要怎么來。這里有兩種做法:
第一種,如果業務部門有共識的話,我們可以直接用業務的標準,比如大家共識了是6個月,那就是6個月。
第二種,業務沒有具體數值的共識,但是有一個概念,比如:
- 新開店階段,門店閉店概率很高
- 新開店階段,門店營業額/訂單量處于上升期
此時,雖然沒有明確標準,但是業務給出找標準的方法。我們可以統計所有門店的生命周期數據,看閉店概率/營業額/訂單量的拐點在哪里,從而清晰標準(如下圖)。
原則上,即使業務口頭給出了第一種標準,我也建議大家引導業務做出第二種標準。因為第二種才是有業務邏輯的標準。萬一哪天不同業務部門吵架,或者業務換了領導,不再認可第一種標準,第二種標準就是調整的原則。
類似地,門店面積標簽也可以這么打。先列出業務假設:
- 門店面積大,對應的成本就高
- 營業面積大,收入也應該高
之后就可以把現有的幾種店面面積列清單,看參數范圍,做出標簽(如下圖)。
這里特別要提醒:很多同學做標簽,不和業務溝通,自己憑感覺或者看數據分布下判斷,比如怎么區分新店,丫自己拍個3個月……這種閉門造車的結果,很容易被業務挑戰,也無法與業務場景結合,最終使標簽工作淪為自嗨。
有了簡單標簽打底,可以再來處理復雜標簽情況。
五、常見的復雜標簽
常見復雜情況一:一個業務問題,需要分幾個標簽來描述。比如“促銷”這個標簽,促銷形式,力度,可能需要分開描述。比如:
- 促銷范圍:參與促銷的商品SKU數量
- 促銷力度:按原價折算,用戶拿到優惠比例
- 促銷形式:買贈、滿減、送禮、加一件……
(如下圖)
可能一個業務場景,需要好幾個標簽組合才能說清楚。
常見復雜情況二:兩個/多個基礎標簽合并出來的標簽(又稱綜合計算標簽)。比如“撿漏店”,潛臺詞是:這個店面積很大,但店租比正常低,同時客流并沒有比正常少很多,因此被我們撿漏了。這個時候,撿漏店是有三個基礎標簽拼接出來的(如下圖)。
類似的,比如:“這個店長能力不行”,怎么證明能力不行,可能得從業績、工作數量、個人履歷好幾個維度來論證,考察的維度一多,就涉及如何付權重問題。付權重本身有一套方法論,同學們感興趣的話,我稍后單獨分享。
常見復雜場景三:標簽是預測未來的情況,并非已發生的情況,比如我們預判這個店是“高潛力門店”,因此要求它表現比普通更好。注意!預測本身是個復雜的活,可以基于規則判斷,可以建模,建模也有好幾種方式,因此處理起來略復雜,有興趣的話,也是稍后單獨分享。
總之,經過這么一堆復雜計算,現在標簽已經打好,可以利用分析了。
六、標簽的綜合利用
標簽的直接應用,就是把復雜的業務問題量化,進而進行分析和檢驗。比如文章開頭那一堆復雜的業務理由,用標簽就可以直接做單維度對比,檢驗說法。
如果有多個標簽疊加,則可以構建復雜的分析邏輯,一層層進行推導。這種復雜的分析邏輯,就是我們常說的“深入分析”,一般習慣性,把考慮了很多種情況,稱為“分析全面”,把推導了多少層,稱為“分析深入”(如下圖)。
當然,標簽不止這一種用法,比如標簽可以作為進一步建模的特征值,輸入模型做綜合性評估/預測。很多同學的評估模型/預測模型做得不準確,就是因為缺少標簽積累,直接把幾個簡單的原始數據懟進模型。
比如,標簽還可以用來推導業務行動。諸如“店長能力不行”“營銷力度不足”,可以直接導向“我要培訓店長”“我要增加營銷投入”這種結論。
綜上,深入分析、建模、提業務建議,標簽是很重要的一環。同學們可以試著多建有業務含義的標簽,特別是涉及“盲盒”狀態的業務,比如線上廣告投放,線下銷售跟進,商品選品等,標簽的作用更大。
#專欄作家#
接地氣的陳老師,微信公眾號:接地氣學堂,人人都是產品經理專欄作家。資深咨詢顧問,在互聯網,金融,快消,零售,耐用,美容等15個行業有豐富數據相關經驗。
本文原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議。
每篇文章都很受用 現在已經可以通過文章一眼看出是 陳老師寫的了!死忠粉
標簽確實在數據分析中發揮著重要作用,用法也非常多樣。
做標簽是真的很好用,就像分類整理,使用的時候就非常方便
標簽的直接應用,就是把復雜的業務問題量化,進而進行分析和檢驗。比如文章開頭那一堆復雜的業務理由,用標簽就可以直接做單維度對比,檢驗說法。