數(shù)據(jù)分析產(chǎn)品從可視化到智能化:快速分析訂單量為什么下降了

3 評論 10033 瀏覽 44 收藏 14 分鐘

本文作者結(jié)合數(shù)據(jù)分析產(chǎn)品從可視化升級到智能化的一個實踐案例,對“今天訂單量為什么下降了”這一問題展開了分析探究,并對過程中存在的問題和解決方法進行了總結(jié),與大家分享。

提到數(shù)據(jù)產(chǎn)品,大家經(jīng)常會想到的可能是tableau、growing io、神策數(shù)據(jù)、諸葛IO等商業(yè)化數(shù)據(jù)產(chǎn)品,也可能是企業(yè)內(nèi)部的報表工具、提取工具等數(shù)據(jù)平臺產(chǎn)品,或者是A/B-test、用戶畫像、埋點系統(tǒng)等數(shù)據(jù)應(yīng)用產(chǎn)品,以及面向業(yè)務(wù)的各類數(shù)據(jù)可視化、Dashboard等數(shù)據(jù)分析產(chǎn)品。

今天我為大家分享下數(shù)據(jù)分析產(chǎn)品從可視化升級到智能化的一個實踐案例。

在企業(yè)發(fā)展初期,最需要的其實是報表工具和提取工具等平臺型數(shù)據(jù)產(chǎn)品,面向分析師和開發(fā)團隊,實現(xiàn)數(shù)據(jù)的提取和加工過程,業(yè)務(wù)側(cè)也基本上只看幾個核心指標。發(fā)展到一定階段,才會有數(shù)據(jù)可視化分析產(chǎn)品的需求,或采購tableau、BDP、網(wǎng)易有數(shù)等商業(yè)化產(chǎn)品,或自研分業(yè)務(wù)主題的Dashboard數(shù)據(jù)產(chǎn)品。

從基礎(chǔ)的報表工具進化到數(shù)據(jù)可視化產(chǎn)品后,在用戶體驗上有了極大地提升,數(shù)據(jù)統(tǒng)一、及時性也可以通過數(shù)據(jù)產(chǎn)品的反推方式,逐步得到保證。但如何更好地提升業(yè)務(wù)團隊的數(shù)據(jù)分析水平,還是會存在一些問題和提升空間。舉例來講:

  • 問題一:方法論不統(tǒng)一和水平參差不齊。有了各類Dashboard,但還是無法保證每個業(yè)務(wù)同學都能按照預想的思路去使用數(shù)據(jù)產(chǎn)品,也無法確保業(yè)務(wù)同學能夠自我探索新的分析思路,以及每位同學分析水平的高低。
  • 問題二:分析過程仍舊很繁瑣耗時。各類Dashboard雖然以自動化的形式提供了數(shù)據(jù),并且不需要再進行數(shù)據(jù)處理,有一定的可視化分析能力,但遇到問題后的分析過程并不能減少,還是需要進行大量的多維度多角度下鉆分析,時間效率上還有待提升。

那如何來解決這個問題呢?答案是數(shù)據(jù)分析產(chǎn)品的分析智能化。我以各大企業(yè)業(yè)務(wù)團隊和分析師團隊經(jīng)常會遇到的問題「今天訂單量為什么下降了」,來分享下數(shù)據(jù)產(chǎn)品應(yīng)該如何快速、高效、直接地回答業(yè)績波動的問題,并且以產(chǎn)品的方式統(tǒng)一方法論、拉齊分析水平。

分析智能化的兩大核心:分析方法抽象化+產(chǎn)品自動化

1. 分析方法抽象化

「今天訂單量為什么下降了」,是高頻出現(xiàn)在每天早上與老板的對話里。一般情況下,都會由數(shù)據(jù)分析師進行跑SQL、整理數(shù)據(jù)、進行問題拆解分析,最后給老板一個回復。效率高的情況下,大概需要花1個小時的時間,效率低、或者趕上數(shù)倉計算排隊壓力時,可能要花費半天甚至一天的時間,來回答這個問題。

對于這個問題,分析方法一般都會有相對固定的思路和過程,在此舉一個例子作為參考,分析方法可抽象為三個部分:

  1. 波動情況如何?是否屬于正常波動?
  2. 影響范圍的細分,哪些城市、哪些時段、哪些類型的業(yè)務(wù)波動影響最大?
  3. 是什么原因引起的?應(yīng)該如何解決?

(1)波動的情況和異常判斷

一般情況下,波動的情況可以用環(huán)同比的數(shù)值和比例進行衡量,比如昨天的訂單量周同比下降了7.36%。日環(huán)比下降了2.48%。異常判斷是一個更難的問題,可以借鑒三個方法:

a. 閾值法:根據(jù)業(yè)務(wù)經(jīng)驗設(shè)定閾值,比如波動范圍[-1%, 1%]屬于平穩(wěn),在[-3%, -1%)和(-1%, -3%]屬于略微波動,超過±3%的波動屬于大幅波動,并判定為業(yè)務(wù)異常;

b. 回歸預測:根據(jù)時序進行訂單量的回歸預測,通過對歷史數(shù)據(jù)的擬合,預測出昨天數(shù)據(jù)的數(shù)值范圍,比如在置信度95%時的置信區(qū)間,如果超出置信區(qū)間,則認為是異常波動;

c. 同級城市排序或相似城市對比法:對于業(yè)務(wù)的局部單元,比如全國開展的業(yè)務(wù),判斷成都市業(yè)務(wù)的波動是否異常,可以通過找到與成都市相似的對標城市或者同級城市,判斷相似或同級城市訂單量的波動差異,如果大家都普遍下降,則認為城市角度的業(yè)務(wù)單元未發(fā)生異常。

波動的異常分析,在數(shù)學和統(tǒng)計學中還有非常多的方法可以使用,大家可自行檢索,在此不做贅述。

(2)影響范圍的細分

有了波動情況的判斷,就需要進一步下鉆分析波動影響的范圍,根據(jù)業(yè)務(wù)場景的不同,會有不同的下鉆方式。比如常見的時空角度,分析哪些城市的業(yè)務(wù)波動對全國影響最大,哪些時段的業(yè)務(wù)波動對全天影響最大,哪些下鉆維度的波動最全局影響最大。這里會涉及一個「影響最大」的量化邏輯,方法有很多,以城市維度下鉆舉例,這里列舉2個簡單規(guī)則:

a.絕對值影響度:將各城市訂單量波動值的絕對值進行降序排列,取TOP5或TOP10進行展示,并輔助以各城市的波動比例;

b.降序累計波動幅度:將各城市的訂單量進行降序排列,用帕累托圖法分析出拐點閾值,求出累計占比前80%或前90%(閾值)的城市,然后對這些城市的波動幅度進行排序,排序規(guī)則與全局波動保持同向,即全國如果同比下降,則波動幅度升序排列,下降最多的城市排在前面,反之把上漲最多的城市排在前面。

影響范圍的下鉆分析,核心點是「下鉆維度」和「影響最大的量化邏輯」,在此基礎(chǔ)上「下鉆維度」還可以疊加,進行多層下鉆,「影響最大的量化邏輯」還可以增加更為復雜的加權(quán)計算等規(guī)則,甚至是算法規(guī)則。

(3)原因定位和解決方案

歸因分析方法和邏輯有很多成熟的經(jīng)驗,但仍然是一個很難的數(shù)學和業(yè)務(wù)問題,大多都只能提供信息參考,后面會專門寫一篇歸因分析的文章進行介紹,這里給大家列舉一種簡單易懂的業(yè)務(wù)拆解邏輯,不能算歸因模型,但足夠?qū)嵱?,適合業(yè)務(wù)落地。

基于業(yè)務(wù)場景的指標拆解

以攜程酒店業(yè)務(wù)為例,核心目標和指標是「消費間夜數(shù)」,從「消費間夜數(shù)」出發(fā),從相加或相乘的兩個思路進行相關(guān)指標的拆解,如下圖:

假設(shè)酒店的消費間夜數(shù)突然上漲13%,屬于異常上漲,其中北京市的上漲影響度最大,時段上沒有明顯的波動。那北京市的消費間夜數(shù)上漲,又是什么影響的呢?

可以從圖中的指標拆解腦圖來分析,先看 消費間夜數(shù) = 當天(購買)消費間夜數(shù) + 預約消費間夜數(shù),可以發(fā)現(xiàn)是當天購買影響的,還是預約消費影響的,如七夕、情人節(jié)等酒店本地消費爆滿的場景,或者旅游季異地人群預約消費爆滿的場景。

進一步可以觀察銷售間夜數(shù)和履約率,是否出現(xiàn)大幅波動,再進一步還可以分析購買用戶數(shù)和人均購買間夜數(shù)的波動,觀察是否出現(xiàn)旅游季的旅游團大單情況。

這就是基于業(yè)務(wù)場景的指標拆解思路,例子不一定嚴謹和準確,大家可以根據(jù)自己公司的業(yè)務(wù)場景進行更實用、嚴謹?shù)牟鸾?,而拆解的目標一定不只是看看而已,最終還是要落到抓手上,如何去解決問題,從哪些方面去解決問題。

2. 產(chǎn)品自動化

有了抽象化的分析方法后,就需要用自動化的產(chǎn)品來承載,將數(shù)據(jù)分析進行產(chǎn)品化之后,才能用產(chǎn)品中內(nèi)含的分析方法實現(xiàn)統(tǒng)一方法論、拉齊分析水平的目標。

那應(yīng)該如何來設(shè)計自動進行數(shù)據(jù)分析的產(chǎn)品呢?整體分三步:首先是針對數(shù)據(jù)分析內(nèi)容和信息的可視化展現(xiàn),其次產(chǎn)品整體交互流程需要遵循數(shù)據(jù)分析的過程和邏輯,最后還需要考慮兩個原則:

1)便于迭代,實現(xiàn)結(jié)構(gòu)化和可擴展;

2)易于理解,符合人的認知習慣。

今天著重為大家分享要考慮的兩個原則。

原則一:便于迭代,實現(xiàn)結(jié)構(gòu)化和可擴展

業(yè)務(wù)時刻在變,分析方法也需要緊跟業(yè)務(wù)去迭代,但產(chǎn)品開發(fā)的成本又很高,所以能否實現(xiàn)結(jié)構(gòu)化的產(chǎn)品設(shè)計,支持分析方法論的快速迭代和擴展,是產(chǎn)品設(shè)計需要考慮的第一因素。

這里列舉一個簡單的產(chǎn)品框架:

產(chǎn)品框架與抽象化的分析方法緊密映射,由「波動和異常判斷結(jié)論區(qū)」+「多維下鉆分析區(qū)」+「歸因分析區(qū)」三部分組成。前兩部分的問題結(jié)合緊密,建議放到一個頁面中進行布局,讓用戶可以快速get到「我的業(yè)績怎么樣」「波動如何」「是否是正常波動」「哪些城市、哪些類型的波動和影響最大」。

歸因分析的部分單獨一個頁面布局,因為歸因分析的邏輯一般比較復雜,可視化展現(xiàn)的形式也很多樣,所以要有足夠大的空間進行產(chǎn)品設(shè)計,與用戶進行交互。

原則二:易于理解,符合人的認知習慣

這一點有兩個方面:

一是要結(jié)論先行,進行結(jié)構(gòu)化表達,這一點在上面結(jié)構(gòu)化設(shè)計中也有體現(xiàn),即先讓用戶看到整體結(jié)論,再看到細分影響,最后看原因和解決方案切入點;

二是措辭上要把數(shù)據(jù)化的描述變成業(yè)務(wù)邏輯的描述,比如用置信區(qū)間來判定波動是否異常,不能寫「昨天的數(shù)值落在置信區(qū)間外,屬于異常數(shù)值」,而要直接寫「昨天的訂單量周同比 +7.62%,屬于異常上漲,請關(guān)注」,這一點在指數(shù)化等復雜判斷方法中需要尤為注意。

結(jié)語

數(shù)據(jù)分析產(chǎn)品從數(shù)據(jù)可視化到分析智能化,對于回答「訂單量為什么下降了」這類問題,其核心是分析方法的抽象化,對于數(shù)據(jù)產(chǎn)品經(jīng)理而言,不一定要完全自研方法論+產(chǎn)品設(shè)計,更好的選擇是跟資深業(yè)務(wù)同學、數(shù)據(jù)分析師、算法工程師一起合作,產(chǎn)品經(jīng)理更多地負責定義用戶問題、定義產(chǎn)品目標和思路,以及提出產(chǎn)品結(jié)構(gòu)化要求等。

 

作者:Probes,微信公眾號:Data To Value,致力于數(shù)據(jù)產(chǎn)品領(lǐng)域的分享和交流,用數(shù)據(jù)創(chuàng)造價值。

本文由 @Probes 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 贊 多年以前就想做 一直沒機會

    來自上海 回復
  2. 弱弱問一句,公眾號里面的應(yīng)用,可以做數(shù)據(jù)埋點嗎

    回復
    1. 可以的,H5、小程序、客戶端都可以。

      回復