你和數據分析高手之間,只差一個標簽

4 評論 6907 瀏覽 46 收藏 12 分鐘

編輯導語:涉及“盲盒”狀態的業務,比如線上廣告投放,線下銷售跟進,商品選品等,標簽發揮了很重要的作用。本文介紹了有業務含義的標簽積累,量化業務的關鍵就在于貼標簽,感興趣的小伙伴快來看看吧!

很多同學覺得自己在工作中進步很少,拿著數據,翻來覆去就是同比、環比,做了兩三年也沒進步。在這背后,有個很大問題是:缺少有業務含義的標簽積累,導致只會零散地看數據,既無法推導有業務意義的結論,也積累不了業務分析經驗。

今天我們就借一個例子,讓大家看出其中的區別。諸位坐好扶穩,我們馬上發車。

一、問題場景

某同學提交了一份店鋪分析報告,指出:A門店業績排行靠后,低于其他店,建議搞高。然而沒想到,這么平平無奇一句話,立馬捅了馬蜂窩了。業務部門同事開始七嘴八舌地爭論:

  • 甲同事:A是新開門店,不應該和其他店這么比,A其實很好
  • 乙同事:雖然A是新開店,但是A是標準店,不能和mini店比,A其實不好
  • 丙同事:雖然A是標準店,但A是撿漏店,不能和普通標準店比,A其實很好
  • 丁同事:雖然A是撿漏店,但是A營銷力度并不低于普通店,A還是不好
  • 戊同事:雖然A營銷力度很大,但是營銷投入并不重,A還是很好
  • ……

大家吵成一團。最后總結:“數據分析做得不深入,只有數字沒解讀,要結合業務深入分析”留下做數據的同學在風中凌亂:

  • “你們說的都是啥???”
  • “我要怎么深入法???”

那么,要怎么深入分析呢?

二、破局關鍵:標簽的業務含義

這里最大的問題,在于業務討論的各種細節,無法直接表示成一個數據指標,導致量化都做不了,更不要提分析了。而量化業務的關鍵在于貼標簽。

注意!很多同學一提標簽,本能地想到“性別、年齡、包裝尺寸、包裝顏色”這些數據庫里現成的,直接從基礎信息導入的標簽。這些基礎標簽,大部分時候沒有直接的業務含義,對業務解讀能力很弱,需要二次加工才好用。

有業務含義的標簽,則是直接指向業務關心的問題,對問題指標有區分度,對業務行為有指導能力的標簽。比如“這個店長能力不行”,這就是個有業務含義的標簽,如果確認了能力不行,那下一步就是換店長或者做培訓,對業務行為指導很清晰。這種標簽,需要復雜的轉化過程與數據驗證,不是一蹴而就的。

你和數據分析高手之間,只差一個標簽

那么要怎么打呢?一步步來看。

三、從整理業務假設開始

既然是打業務標簽,首先就得從整理“影響業務指標的假設”開始。這樣打出來的標簽才是直接指向業務問題的。比如開頭的問題,我們可以根據業務部門七嘴八舌的議論,分別列出:

  1. 待描述的業務對象
  2. 衡量業務對象好壞的指標
  3. 影響指標的假設
  4. 假設的影響方向

這樣就有了一張清晰的,待開發的標簽列表(如下圖):

你和數據分析高手之間,只差一個標簽

下一步可以一一進行開發。

四、先做簡單的標簽

在開發的時候,先做能用基礎標簽+現有數據指標,直接計算出來的標簽。這種標簽也被稱作:規則標簽。即業務給到計算規則后,可以基于基礎標簽+現有指標直接計算。這種標簽獲得速度快,也容易驗證。

比如:是否新開店。理論上只要根據開店日期做分類即可。比如規定6個月及以內的都是新開店。那么大于等于7個月的就是老店,小于等于6個月的都是新店。

這里有個關鍵問題:這個“6個月”的標準要怎么來。這里有兩種做法:

第一種,如果業務部門有共識的話,我們可以直接用業務的標準,比如大家共識了是6個月,那就是6個月。

第二種,業務沒有具體數值的共識,但是有一個概念,比如:

  • 新開店階段,門店閉店概率很高
  • 新開店階段,門店營業額/訂單量處于上升期

此時,雖然沒有明確標準,但是業務給出找標準的方法。我們可以統計所有門店的生命周期數據,看閉店概率/營業額/訂單量的拐點在哪里,從而清晰標準(如下圖)。

你和數據分析高手之間,只差一個標簽

原則上,即使業務口頭給出了第一種標準,我也建議大家引導業務做出第二種標準。因為第二種才是有業務邏輯的標準。萬一哪天不同業務部門吵架,或者業務換了領導,不再認可第一種標準,第二種標準就是調整的原則。

類似地,門店面積標簽也可以這么打。先列出業務假設:

  • 門店面積大,對應的成本就高
  • 營業面積大,收入也應該高

之后就可以把現有的幾種店面面積列清單,看參數范圍,做出標簽(如下圖)。

你和數據分析高手之間,只差一個標簽

這里特別要提醒:很多同學做標簽,不和業務溝通,自己憑感覺或者看數據分布下判斷,比如怎么區分新店,丫自己拍個3個月……這種閉門造車的結果,很容易被業務挑戰,也無法與業務場景結合,最終使標簽工作淪為自嗨。

有了簡單標簽打底,可以再來處理復雜標簽情況。

五、常見的復雜標簽

常見復雜情況一:一個業務問題,需要分幾個標簽來描述。比如“促銷”這個標簽,促銷形式,力度,可能需要分開描述。比如:

  • 促銷范圍:參與促銷的商品SKU數量
  • 促銷力度:按原價折算,用戶拿到優惠比例
  • 促銷形式:買贈、滿減、送禮、加一件……

(如下圖)

你和數據分析高手之間,只差一個標簽

可能一個業務場景,需要好幾個標簽組合才能說清楚。

常見復雜情況二:兩個/多個基礎標簽合并出來的標簽(又稱綜合計算標簽)。比如“撿漏店”,潛臺詞是:這個店面積很大,但店租比正常低,同時客流并沒有比正常少很多,因此被我們撿漏了。這個時候,撿漏店是有三個基礎標簽拼接出來的(如下圖)。

你和數據分析高手之間,只差一個標簽

類似的,比如:“這個店長能力不行”,怎么證明能力不行,可能得從業績、工作數量、個人履歷好幾個維度來論證,考察的維度一多,就涉及如何付權重問題。付權重本身有一套方法論,同學們感興趣的話,我稍后單獨分享。

你和數據分析高手之間,只差一個標簽

常見復雜場景三:標簽是預測未來的情況,并非已發生的情況,比如我們預判這個店是“高潛力門店”,因此要求它表現比普通更好。注意!預測本身是個復雜的活,可以基于規則判斷,可以建模,建模也有好幾種方式,因此處理起來略復雜,有興趣的話,也是稍后單獨分享。

總之,經過這么一堆復雜計算,現在標簽已經打好,可以利用分析了。

六、標簽的綜合利用

標簽的直接應用,就是把復雜的業務問題量化,進而進行分析和檢驗。比如文章開頭那一堆復雜的業務理由,用標簽就可以直接做單維度對比,檢驗說法。

如果有多個標簽疊加,則可以構建復雜的分析邏輯,一層層進行推導。這種復雜的分析邏輯,就是我們常說的“深入分析”,一般習慣性,把考慮了很多種情況,稱為“分析全面”,把推導了多少層,稱為“分析深入”(如下圖)。

你和數據分析高手之間,只差一個標簽

當然,標簽不止這一種用法,比如標簽可以作為進一步建模的特征值,輸入模型做綜合性評估/預測。很多同學的評估模型/預測模型做得不準確,就是因為缺少標簽積累,直接把幾個簡單的原始數據懟進模型。

比如,標簽還可以用來推導業務行動。諸如“店長能力不行”“營銷力度不足”,可以直接導向“我要培訓店長”“我要增加營銷投入”這種結論。

綜上,深入分析、建模、提業務建議,標簽是很重要的一環。同學們可以試著多建有業務含義的標簽,特別是涉及“盲盒”狀態的業務,比如線上廣告投放,線下銷售跟進,商品選品等,標簽的作用更大。

#專欄作家#

接地氣的陳老師,微信公眾號:接地氣學堂,人人都是產品經理專欄作家。資深咨詢顧問,在互聯網,金融,快消,零售,耐用,美容等15個行業有豐富數據相關經驗。

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 每篇文章都很受用 現在已經可以通過文章一眼看出是 陳老師寫的了!死忠粉

    來自北京 回復
  2. 標簽確實在數據分析中發揮著重要作用,用法也非常多樣。

    來自云南 回復
  3. 做標簽是真的很好用,就像分類整理,使用的時候就非常方便

    來自廣西 回復
  4. 標簽的直接應用,就是把復雜的業務問題量化,進而進行分析和檢驗。比如文章開頭那一堆復雜的業務理由,用標簽就可以直接做單維度對比,檢驗說法。

    來自吉林 回復