站在數據產品經理角度,說說“業務診斷”

4 評論 1552 瀏覽 10 收藏 8 分鐘

數據產品經理需要做的事情,可能是讓數據會“說話”,按照本文作者的看法,即讓數據從“信息化”變為“智能化”,讓數據從“展示”變為“指導”。這個過程,可能就要涉及到業務診斷了。怎么理解呢?不妨來看看作者的解答。

一、前言

在3-4年的那個階段,是我最迷茫的時候。那時已經接觸了大部分數據產品相關工作,做平臺、工具、報表、大屏、提數、標簽,并且對數倉、數據分析、需求把控、優先級排序、項目管理、價值提煉也有了一些認識,看似做了足夠多的事情。但似乎終究是被業務裹挾著跑,業務的極速增長就同步裹挾著需求的增長,無數的報表需求、取數需求撲面而來。

數據產品經理的價值到底是什么?終極目標是什么?數據團隊對業務來說,到底是價值還是成本?時至今日其實也還沒有問題的答案,但通過工作中的部分實踐、以及業內一些資深數據產品的思考。目前我的理解是:泛化數據給使用的人,把分析的理念和框架變成數據產品,讓數據“說話”。

聽上去很抽象,簡單來說就是從“信息化”變為“智能化”,從“數據展示”變為“指導方針”。因此就有了這章的內容,我把它分為3個部分,「業務診斷」「業務決策」「業務預測」。

  • 業務診斷:對業務異動進行診斷,講清楚為什么發生(發現問題,定位原因)
  • 業務決策:對于已經出現的現狀,給出具體的執行動作(直接告訴怎么做)
  • 業務預測:預測未來將要發生什么

接下來先介紹「業務診斷」的部分:

二、典型場景

增長產品昨天發現C端營收,下降嚴重,老板要求快速找到原因,大概流程如下:

1)找運營、產品等部門問問,昨天有沒有重要動作;再找技術排查下是否存在技術故障;

2)問下來沒有異常,嘗試自己通過報表數據進行分析。

  • 「單指標多維度分析」:先看一級商品類型波動,再看二級商品類型波動,再看訂單頁面來源波動等等,觀察是否有異常波動
  • 「多指標相關性分析」:看活躍用戶數、注冊用戶數等相關性指標3)思緒混亂,提工單給分析師排查

人工排查通常會耗費大量時間,異動分析過程實際可以泛化為數據產品,交給機器來做,下面介紹「單指標多維度分析」自動診斷方法。

三、自動診斷方法

「單指標多維度分析」難點:

  1. 如何找到異動的關鍵維度;
  2. 找到關鍵維度后如何找到關鍵維度值。

解決思路:

  1. 通過現期和基期對比,看異動情況(通過趨勢圖);
  2. 定位影響異動最大的維度是哪個(通過基尼系數);
  3. 定位每個維度下哪個維度值影響最大(通過貢獻度)。

1. 基尼系數定位異常維度

基尼系數系數定義:衡量財富分配是否均勻的指標,將拿到的收入數據從小到大排列,x軸代表人數占比的累加,y軸代表收入占比的累加,繪制出一條洛倫茲曲線,計算圖中A區域的面積占比,該占比就是基尼系數,即A/A+B。基尼系數越大,代表收入差異越大。

基于此,構建基于基尼系數的定位維度問題的方案,用于計算各下鉆維度方案對單個指標波動的影響程度,x軸用特征分組基期累計占比,y軸用波動值累計占比(可以為負值),基尼系數越大說明該特征對波動的解釋效果越好。

這里引申出2個概念,特征分組基期累計占比(權重) 和 波動值累計占比(影響因子),下圖為示例解釋:

由圖可知,當權重和影響因子越接近,基尼系數越趨近于0,基尼系數計算公式(火山引擎應用):

舉例驗證,造成異動維度 支付平臺>商品>支付方式>國家>渠道

2. 貢獻度定位異常維度值

在3.1中描述基尼系數時,已經引入貢獻度計算邏輯,即某維度值貢獻度=(該維度值現期的值-該維度值基期的值)/(大盤現期的值-大盤基期的值)。

四、產品實例(火山引擎)

第一步 :在折線圖中,發現最近一天的GMV突然下降,點擊下降的數據點,進行歸因分析

第二步 :歸因分析計算完成,點擊查看歸因結果。

第三步 :查看歸因結果,最近一段時間GMV波動異常,默認和前一月的數據進行比較,數據下降了22.61%,按照引起下降的貢獻對維度進行排名,發現sale_city的系數為0.56,是重要的影響因素,就可以針對這個區域的銷售情況進行篩選并經一步分析。

本文由 @起司Criss 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 你好!請問下舉例驗證中的第4張表(帶有負值的支付方式表)中的計算過程是否有誤?支付方式B的影響因子應該是100%而不是60%吧。
    如果有誤,修正后的基尼系數還是0.39嗎?

    來自廣東 回復
  2. 文章寫的非常清晰!給作者點贊!請教一個小小的問題,在計算基尼系數的時候,每個維值的權重是如何定義or計算的呀?引入權重的作用又是啥嘞

    來自北京 回復
    1. 每個維度值的權重,即每個維度值基期占比。作用在于通過權重先定位基期的“貧富差距”,貧窮維度影響因子大,富裕維度影響因子小,才能定位異常。

      來自江蘇 回復
    2. 明白了!感謝大佬!

      來自北京 回復