「Why-What-How」:數(shù)據(jù)分析的基本方法論

2 評(píng)論 58745 瀏覽 260 收藏 30 分鐘

2017.12.3受「水滴互助」的朋友相邀,分享了個(gè)人在數(shù)據(jù)分析領(lǐng)域的一些基本方法論。數(shù)據(jù)產(chǎn)品以沉淀數(shù)據(jù)分析思路為基本點(diǎn),這兩個(gè)領(lǐng)域略有重合之處。在這里整理成文章分享給大家。

「Why-What-How」在講解概念和執(zhí)行上是個(gè)不錯(cuò)的思維模型,這次依例按此框架來拆分「數(shù)據(jù)分析」。相信很多朋友已經(jīng)有了較豐富的分析經(jīng)驗(yàn),這里權(quán)且從個(gè)人的角度進(jìn)行梳理,以資參考。為了幫助大家更好地理解本文,先貼出一張思維腦圖:

一、WHY:為什么要做數(shù)據(jù)分析

在目前講解數(shù)據(jù)分析的文章里,大多數(shù)會(huì)忽略數(shù)據(jù)分析本身的目的。這會(huì)導(dǎo)致我們?cè)趫?zhí)行時(shí),會(huì)出現(xiàn)動(dòng)作變形的情況。

以終為始,才能保證不會(huì)跑偏。

個(gè)人的理解上:數(shù)據(jù)分析是為了能以量化的方式來分析業(yè)務(wù)問題并得出結(jié)論。

其中有兩個(gè)重點(diǎn)詞語:量化和業(yè)務(wù)。

首先講下量化。

量化是為了統(tǒng)一認(rèn)知,并且確保路徑可回溯,可復(fù)制。統(tǒng)一認(rèn)知后,才能保證不同層級(jí),不同部門的人在平等話語權(quán)和同一個(gè)方向進(jìn)行討論和協(xié)作,才能避免公司內(nèi)的人以「我感覺」「我猜測(cè)」來猜測(cè)當(dāng)前業(yè)務(wù)的情況。

路徑可回溯可復(fù)制指的是:通過量化后的結(jié)果,許多優(yōu)化的方法是可以被找到原因并且可以被復(fù)制的。同樣是轉(zhuǎn)化率優(yōu)化,用 A 方案和 B 方案,誰的效果會(huì)比較好和具體好多少,都是可被預(yù)測(cè)的。

要想做到量化,需要做到三點(diǎn):建立量化體系,明確量化重點(diǎn)和保證數(shù)據(jù)準(zhǔn)確性。

1.1 建立量化體系

建立量化體系,主要是根據(jù)「指標(biāo)設(shè)計(jì)方法」,設(shè)計(jì)業(yè)務(wù)的「核心指標(biāo)+拆解指標(biāo)+業(yè)務(wù)指標(biāo)」,最后落地成全公司通用的「指標(biāo)字典」和「維度字典」。

這種工作一般是由數(shù)據(jù)分析師或數(shù)據(jù) PM 來擔(dān)任完成。通過這種方式,我們就能初步建立面向全公司全面,系統(tǒng)的量化分析框架,保證日常分析可以做到「逐層拆解,不重不漏」

1.1.1 指標(biāo)設(shè)計(jì)方法

講到指標(biāo)設(shè)計(jì)方法,大家可能覺得:之前聽過了產(chǎn)品設(shè)計(jì)方法、程序開發(fā)方法,指標(biāo)這種東西也有設(shè)計(jì)方法么?

確實(shí)有,指標(biāo)設(shè)計(jì)是一套以準(zhǔn)確和易懂為準(zhǔn)則,集合統(tǒng)計(jì)學(xué)和業(yè)務(wù)效果的方法論。

準(zhǔn)確是指能夠準(zhǔn)確滿足衡量目的,易懂是指標(biāo)算法能直觀顯示好與壞,并且指標(biāo)的算法也能夠通俗易懂。這兩者很多時(shí)候需要有所抉擇,準(zhǔn)確是第一位的。舉個(gè)例子:當(dāng)我們想衡量一個(gè)群體收入的差異性時(shí),用方差還是用基尼系數(shù)?

方差好懂,但不能顯示兩個(gè)極端的差異性多大?;嵯禂?shù)算法不好懂,但能準(zhǔn)確描述這個(gè)問題。

具體到指標(biāo)設(shè)計(jì),我們需要使用一些常用的統(tǒng)計(jì)學(xué)工具:

以顧客質(zhì)量分析為例:概況是我們看下顧客的平均支付金額,或者支付中位數(shù),來了解顧客概況。如果我們想了解這批顧客的質(zhì)量是都比較好,還是良莠不齊,則需要通過方差和標(biāo)準(zhǔn)差來描述。如果想知道更詳細(xì)的內(nèi)容,可以了解每個(gè)區(qū)間的用戶數(shù)是多少,來做判斷。

有一些 Tips 供大家參考:

  1. 比率指標(biāo):關(guān)注實(shí)際效果(下單轉(zhuǎn)化率,光看下單數(shù)是沒有用的)
  2. 伴生指標(biāo):既要看新客數(shù)也要看 CAC,確保數(shù)量的前提也要確保質(zhì)量
  3. 防止壞指標(biāo):錯(cuò)誤指標(biāo),虛榮指標(biāo),復(fù)雜指標(biāo)

這里簡單解釋下每個(gè) Tips 的目標(biāo)。

之所以采取比率指標(biāo)和伴生指標(biāo),是因?yàn)槟軌蛎黠@反映業(yè)務(wù)的「效率」且能夠有效防止因?yàn)樽非髥蝹€(gè)指標(biāo)而導(dǎo)致動(dòng)作變形。

如果說這輛車能跑十萬公里,其實(shí)并不能表示這輛車的性能怎么樣;只有「速率=路程/時(shí)間」,才能反映這輛車的效率。

同時(shí),如果片面追求速率,會(huì)導(dǎo)致汽車在設(shè)計(jì)時(shí)劍走偏鋒,給駕駛者帶來危險(xiǎn);因此需要再加個(gè)「故障率」或「事故率」等伴生指標(biāo)來確保安全。

壞指標(biāo)中的「虛榮指標(biāo)」首次出現(xiàn)《精益數(shù)據(jù)分析》一書中,作者簡單把「PV/UV」等指標(biāo)都?xì)w為虛榮指標(biāo)。

剛開始時(shí)我頗為認(rèn)可,但后續(xù)在實(shí)際的應(yīng)用過程中,發(fā)現(xiàn)對(duì)于很多業(yè)務(wù)的監(jiān)控,這些指標(biāo)并避免不了。后續(xù)我便把「虛榮指標(biāo)」更正為「把距離業(yè)務(wù)目標(biāo)過遠(yuǎn)的環(huán)節(jié)定義為核心監(jiān)控指標(biāo)」。

對(duì)于一個(gè)即時(shí)通訊 APP 來講,下載次數(shù)、啟動(dòng)用戶數(shù)、注冊(cè)用戶數(shù)需要監(jiān)控,但不能作為核心監(jiān)控的指標(biāo);更合適的應(yīng)該是消息數(shù)或「進(jìn)行過對(duì)話的用戶數(shù)」。

復(fù)雜指標(biāo)往往是各種「指數(shù)」,用了很多指標(biāo)各種加減乘除,這會(huì)導(dǎo)致此類指標(biāo)在發(fā)生波動(dòng)時(shí),很難分析原因。

擁有對(duì)指標(biāo)的定義權(quán)和解釋權(quán)是個(gè)段位非常高的事情,這要求設(shè)計(jì)者深入了解業(yè)務(wù)和擁有極高的抽象能力。

對(duì)于分析師來講,擁有指標(biāo)定義權(quán)將凸顯出你在業(yè)務(wù)方的重要性——當(dāng)然,這里并不是鼓勵(lì)大家為了定義指標(biāo)而定義指標(biāo)。尋找業(yè)界已有量化方法并在公司內(nèi)推廣,也是件功德無量的事情。

舉個(gè)美女外賣的「美女廚師率加權(quán)指導(dǎo)值」為例。為避免泄露商業(yè)機(jī)密,將這個(gè)原本用來衡量用戶體驗(yàn)的指標(biāo)換成「美女廚師率」,以下背景也稍作修改,大家領(lǐng)會(huì)精神即可:

指標(biāo)的背景是為了保證用戶的用餐體驗(yàn),美女外賣總部提出每個(gè)城市的商家必須配備一定比例的美女廚師。但城市提出異議:不同城市擁有的商家情況不一樣——大型的商家廚師多,美女廚師率會(huì)相對(duì)較低,不能用統(tǒng)一的值來對(duì)比所有城市。因此總部便設(shè)計(jì)出來這么一個(gè)指導(dǎo)值:將全國商家進(jìn)行分層,每個(gè)層次的商家得出全國平均值,然后各個(gè)城市對(duì)標(biāo)平均值產(chǎn)出自身的對(duì)標(biāo)值,即「美女廚師率加權(quán)指導(dǎo)值」。雖然在計(jì)算上稍微復(fù)雜點(diǎn),但在實(shí)際應(yīng)用的過程中,BD 們只需要知道總體的差距和每一層商家的差別,很容易針對(duì)性的落地和優(yōu)化。

1.1.2 建立指標(biāo)體系

在根據(jù)「指標(biāo)設(shè)計(jì)方法」上,如何建立起圍繞業(yè)務(wù)的指標(biāo)體系呢?

核心是根據(jù)業(yè)務(wù)特征確定核心指標(biāo),在核心指標(biāo)的基礎(chǔ)上以不同的角度進(jìn)行拆解,然后再慢慢補(bǔ)充其他業(yè)務(wù)的指標(biāo)情況。。

拆解的時(shí)候,要做到按指標(biāo)拆解而非維度。比如訂單數(shù),也可以拆解為各品類的訂單數(shù)合計(jì),這一點(diǎn)可以通過保持上下兩層指標(biāo)名稱不一致來避免。拆解的過程依照金字塔方法論的「逐層拆解,不重不漏(MECE)」。若拆解出來或業(yè)務(wù)補(bǔ)充的指標(biāo)過多,可借鑒數(shù)據(jù)倉庫的「域」概念來管理這些指標(biāo),如上圖的「交易域」,「商品域」和「用戶域」。

在一個(gè)規(guī)范的指標(biāo)體系中,已經(jīng)涉及到元數(shù)據(jù)管理的領(lǐng)域了。包括針對(duì)指標(biāo)命名的規(guī)范,數(shù)據(jù)存儲(chǔ)和計(jì)算的管理等等。大家有興趣地可以搜下相關(guān)文章,或閱讀阿里巴巴新出的《阿里巴巴大數(shù)據(jù)實(shí)踐之路》。

下面截取一張來自云棲大會(huì)的,關(guān)于指標(biāo)命名規(guī)范的 PPT 給大家:

1.1.3 建設(shè)指標(biāo)維度字典

這里是轉(zhuǎn)轉(zhuǎn)公司早期部分的指標(biāo)維度字典,(Bus Matrix),一定程度上解決了之前公司內(nèi)對(duì)于指標(biāo)定義不清或不統(tǒng)一的問題?,F(xiàn)在這套東西已經(jīng)產(chǎn)品化,可以在可視化產(chǎn)品中查看和顯示了。

對(duì)于暫沒能力產(chǎn)品化的公司,建議可由分析師們通過 Google Docs 或 Wiki 對(duì)一些關(guān)鍵和常用的指標(biāo)進(jìn)行統(tǒng)一的維護(hù)。

對(duì)于維度總線矩陣,主要是在以維度建模的數(shù)據(jù)倉庫,設(shè)計(jì)數(shù)據(jù)產(chǎn)品,多維度交叉分析時(shí)提供框架和基礎(chǔ)。

1.2 明確量化重點(diǎn)

每個(gè)階段,都應(yīng)該明確當(dāng)前的業(yè)務(wù)重點(diǎn);量化體系需要根據(jù)業(yè)務(wù)階段,更改量化重點(diǎn)及方式。

這同時(shí)意味著:有更細(xì)節(jié)的指標(biāo)及更大的監(jiān)控和推廣力度。

比如外賣行業(yè)早期,經(jīng)歷了看重訂單數(shù),到訂單額,到新客數(shù)+補(bǔ)貼率,到新客數(shù)+資金使用效率(交易完成進(jìn)度/費(fèi)用完成進(jìn)度)的歷程。

我們可以看到:隨著戰(zhàn)爭的階段不斷升級(jí)和變化,從不計(jì)成本打下市場份額,到看中訂單質(zhì)量,到存量市場爭得差不多了,開始考慮新客數(shù)量,同時(shí)控制補(bǔ)貼力度,到戰(zhàn)爭趨于常態(tài)化,開始控制整體補(bǔ)貼額度,靠拼效率來戰(zhàn)勝對(duì)手。每個(gè)階段,都需要根據(jù)不同的戰(zhàn)場情況來判斷當(dāng)前重點(diǎn),從而圍繞該重點(diǎn)建立一套360度無死角的分析監(jiān)控體系。

1.3 確保數(shù)據(jù)準(zhǔn)確性

在數(shù)據(jù)準(zhǔn)確性這個(gè)話題里,數(shù)據(jù)產(chǎn)品已經(jīng)有成熟的數(shù)據(jù)質(zhì)量管理方法;涉及了數(shù)據(jù)源,指標(biāo)計(jì)算和數(shù)據(jù)呈現(xiàn)等各個(gè)環(huán)節(jié)的監(jiān)控。

本文主要從分析師的角度闡述確保準(zhǔn)確性的方法,數(shù)據(jù)產(chǎn)品相關(guān)的就先不贅述了。

  1. 采取可信來源:多來源交叉確認(rèn),采用新來源時(shí)需格外小心
  2. 確認(rèn)加工方式:指標(biāo)定義和加工算法
  3. Double Check:量級(jí),計(jì)算邏輯和業(yè)務(wù)常識(shí)

這里著重講下 Double Check 的技巧,這些技巧可以讓很多管理層或投資人在不了解業(yè)務(wù)的前提下,就能判斷出來數(shù)據(jù)是否有問題。

  • 量級(jí) Check:每個(gè)數(shù)據(jù)有它的大概范圍,比如 DAU,WAU 和 MAU。
  • 計(jì)算邏輯 Check:一般對(duì)于整體部分型的分?jǐn)?shù),比如市場份額,那么它必須滿足:1,取值最大不能超過1;2,各部分加和應(yīng)為1;3,兩數(shù)字加和后,和應(yīng)該在中間范圍內(nèi)。
  • 業(yè)務(wù)常識(shí) Check:根據(jù)其他常用數(shù)字推算出該業(yè)務(wù)范圍。如果有人跟你說某某社交 APP DAU 過億,你大概知道是否在吹牛,因?yàn)槿栈钸^億的 APP 就那么幾個(gè)。對(duì)于 DAU/MAU,各個(gè)行業(yè)都有響應(yīng)的范圍值,淘寶為:34.6%,天貓15.5%,京東15.8%。

1.4 站在業(yè)務(wù)方的角度

除了「量化」之外,另外一個(gè)重點(diǎn)詞語是「業(yè)務(wù)」。

只有解決業(yè)務(wù)問題分析才能創(chuàng)造價(jià)值。

價(jià)值包括個(gè)人價(jià)值和公司價(jià)值。

對(duì)于公司來講,你提高了收入水平或者降低了業(yè)務(wù)成本,對(duì)于個(gè)人來講,你知道怎么去利用數(shù)據(jù)解決業(yè)務(wù)問題,這對(duì)個(gè)人的能力成長和職業(yè)生涯都有非常大的幫助。

如何站在業(yè)務(wù)方的角度思考問題呢,總結(jié)起來就是八個(gè)字「憂其所慮,給其所欲」。

這里不僅適用于分析師這個(gè)崗位,在所有以供需為主要關(guān)系的交互過程里,精準(zhǔn)理解對(duì)方需求對(duì)于供給方都是最重要的。比如 PM 對(duì)于用戶,分析師對(duì)于業(yè)務(wù)方,下級(jí)對(duì)于上級(jí)。

在具體的落地過程中,主要是在這以下幾個(gè)環(huán)節(jié)

  1. 溝通充分
  2. 結(jié)論簡明
  3. 提供信息量及可落地建議
  4. 尋求反饋

在溝通上,確定業(yè)務(wù)方想要分析什么,提出更合理專業(yè)的衡量和分析方式,同時(shí)做好節(jié)點(diǎn)同步,切忌一條路走到黑。在分析業(yè)務(wù)需求上,跟很多產(chǎn)品需求分析方法論是類似的,需要明確所要數(shù)據(jù)背后的含義。

舉例來講,業(yè)務(wù)方說要看「頁面停留時(shí)長」,但他實(shí)際想要的,可能是想衡量用戶質(zhì)量,那么「留存率」「目標(biāo)轉(zhuǎn)化率」才是更合適的指標(biāo)。

在闡述分析結(jié)果上,要記得結(jié)論先行,逐層講解,再提供論據(jù)。論據(jù)上,圖 > 表 > 文字。因?yàn)闃I(yè)務(wù)方或管理層時(shí)間都是有限的,洋洋灑灑一大篇郵件,未看先暈,誰都沒心思看你到底分析了啥。需要做到:在郵件最前面,用 1-3 句話先把結(jié)論給出來,即使需求方不看后續(xù)內(nèi)容都可以了解你報(bào)告 80% 的內(nèi)容。

在「提供信息量及可落地建議」上,先要明白什么叫信息量:提供了對(duì)方不知道的信息。太陽明天從東方升起不算信息量,從西方升起才是。在分析的過程中,一定要從專業(yè)的角度,從已知邊界向未知邊界進(jìn)軍,力求角度新穎論證扎實(shí),并且根據(jù)分析內(nèi)容給出可落地的建議。

舉個(gè)簡單例子:

尋求反饋是很多分析過程所缺乏的一步,數(shù)據(jù)分析給出去后便沒有持續(xù)跟進(jìn)。那你就不知道到底做得對(duì)不對(duì)。

反饋猶如一面鏡子,讓你及時(shí)地調(diào)整和優(yōu)化自己的方法論。

二、WHAT:什么是數(shù)據(jù)分析

數(shù)據(jù)分析的本質(zhì)是抓住「變」與「不變」。

「變」是數(shù)據(jù)分析的基礎(chǔ),如果一個(gè)業(yè)務(wù)每天訂單是 10000 單,或者每天都是以 10% 的速度穩(wěn)步增長,那就沒有分析的必要了。而若想抓住「變」,得先形成「不變」的意識(shí)。

積累「不變」,就是養(yǎng)成「數(shù)據(jù)常識(shí)(Data Common Sense)」的過程。「不變」是根據(jù)對(duì)歷史數(shù)據(jù)不斷的觀察和積累而來。一般來說會(huì)是個(gè)范圍,范圍越精準(zhǔn),你對(duì)「變」就越敏感。這里有三個(gè)個(gè)人的習(xí)慣,可以幫助養(yǎng)成「不變」:

  1. 形成習(xí)慣,每天上班第一時(shí)間查看數(shù)據(jù):實(shí)時(shí)&日周月報(bào)
  2. 記住各個(gè)指標(biāo)大數(shù),反復(fù)推算
  3. 記錄關(guān)鍵數(shù)據(jù)(榜單&報(bào)告)

大部分指標(biāo)沒有記住全部數(shù)字的必要,簡單記住大數(shù),萬以下只需要記到萬位,有些數(shù)字只需要記住百分比。?而指標(biāo)之間的推算可以幫助你對(duì)各個(gè)指標(biāo)的數(shù)量級(jí)關(guān)系和邏輯脈絡(luò)梳理清楚,出現(xiàn)波動(dòng)時(shí)便能更加敏感。記錄關(guān)鍵數(shù)據(jù)是將工作生活遇到的比較有趣的榜單或數(shù)據(jù)報(bào)告保存在一個(gè)統(tǒng)一的地方,方便查閱和分析。

在「不變」的基礎(chǔ)上,便能逐漸培養(yǎng)出指標(biāo)敏感性,即意識(shí)指標(biāo)偏離的能力。這主要是通過各種日環(huán)比,周月同比的監(jiān)控以及日常的好奇心來保持。

我們從一個(gè) Questmobile 2017 年春季榜單上,來簡單看下「指標(biāo)偏離」是怎么應(yīng)用到日常的分析上的:

這里先跟大家分享下怎么看這種榜單:

  1. 看整體排行:看哪些 APP 排在前方是出乎你意料之外的
  2. 分行業(yè)看排行:看行業(yè)里排行及其變動(dòng)
  3. 看增長率:哪些 APP 增長比較快
  4. 看使用時(shí)長等其他指標(biāo)

這里我試著拋出幾個(gè)問題:

  1. 新浪新聞竟然比騰訊新聞還高?今日頭條竟然比一點(diǎn)資訊低?
  2. 秒拍竟然比快手高?
  3. 百度地圖在榜單上比高德高,為什么去年俞永福還敢宣稱活躍終端數(shù)第一位?
  4. QQ 的時(shí)長已經(jīng)連續(xù)兩個(gè)季度月活出現(xiàn)下降了,是否意味著什么?
  5. 按增長率排序,最快的王者榮耀,其次是今日頭條,快手,高德地圖。高德既然還算增長得較快的 APP?

數(shù)據(jù)分析的定義,還有國外一本商務(wù)分析的書籍的定義作為注腳:

三、HOW:怎么進(jìn)行數(shù)據(jù)分析

任何數(shù)據(jù)分析都是「細(xì)分,對(duì)比,溯源」這三種行為的不斷交叉。最常見的細(xì)分對(duì)比維度是時(shí)間,我們通過時(shí)間進(jìn)行周月同比,發(fā)現(xiàn)數(shù)據(jù)異常后,再進(jìn)行維度或流程上的細(xì)分,一步步拆解找到問題所在。如果找到了某個(gè)維度的問題,則需要溯源到業(yè)務(wù)端或現(xiàn)實(shí)端,確認(rèn)問題產(chǎn)生的源頭。如果多次細(xì)分對(duì)比下來仍然沒有確認(rèn)問題,則需要溯源到業(yè)務(wù)日志或用戶訪談來更進(jìn)一步摸清楚情況。

3.1 細(xì)分

以下內(nèi)容在上篇《大數(shù)據(jù)與用戶研究》中略有提及,這里再做一個(gè)總結(jié)。在細(xì)分方式上,主要有以下三種方式

  1. 橫切:根據(jù)某個(gè)維度對(duì)指標(biāo)進(jìn)行切分及交叉分析
  2. 縱切:以時(shí)間變化為軸,切分指標(biāo)上下游
  3. 內(nèi)切:根據(jù)某個(gè)模型從目標(biāo)內(nèi)部進(jìn)行劃分

橫切上,以轉(zhuǎn)轉(zhuǎn)舉例,我們對(duì)維度和指標(biāo)做做了分類和交叉,當(dāng)某一類的指標(biāo)出現(xiàn)問題時(shí),我們便知道該從什么維度進(jìn)行分析。在進(jìn)行橫切分析時(shí),經(jīng)常需要多個(gè)維度交叉著使用。這在數(shù)據(jù)分析術(shù)語上叫:交叉多維分析。這也是剛才講的「維度總線矩陣」看到的各維度交叉情況了。

縱切上,有目的有路徑,則用漏斗分析。無目的有路徑,則用軌跡分析。無目的無路徑,則用日志分析。

漏斗分析分為長漏斗和短漏斗。長漏斗的特征是涉及環(huán)節(jié)較多,時(shí)間周期較長。常用的長漏斗有渠道歸因模型,AARRR,用戶生命周期漏斗等等。短漏斗是有明確的目的,時(shí)間短,如訂單轉(zhuǎn)化漏斗和注冊(cè)漏斗。在軌跡分析里,桑基圖是一種常用的方式。常見于各頁面的流轉(zhuǎn)關(guān)系,電商中各品類的轉(zhuǎn)移關(guān)系等等。日志分析,則通過直接瀏覽用戶前后端日志,來分析用戶的每一個(gè)動(dòng)作。

各種手段的細(xì)分往往交叉著使用,如訂單漏斗縱切完可以接著橫切,看看是哪個(gè)維度的轉(zhuǎn)化率導(dǎo)致的問題。

內(nèi)切上,主要是根據(jù)現(xiàn)有市面上常見的分析模型,RFM,Cohort 和 Segment等方式進(jìn)行分析。RFM 即最近購買時(shí)間,頻率及金額三個(gè)指標(biāo)綜合來判定用戶忠誠度及粘性。Cohort,即同期群分析,是通過對(duì)不同時(shí)期進(jìn)入平臺(tái)的新用戶分群分析,來區(qū)分不同新用戶的質(zhì)量,如留存率或目標(biāo)轉(zhuǎn)化率等。Segment 通過若干個(gè)條件對(duì)用戶分層,然后針對(duì)不同用戶進(jìn)行分層分析和運(yùn)營,如用戶活躍度分層等等。

3.2 對(duì)比

對(duì)比主要分為以下幾種:

  1. 橫切對(duì)比:根據(jù)細(xì)分中的橫切維度進(jìn)行對(duì)比,如城市和品類
  2. 縱切對(duì)比:與細(xì)分中的縱切維護(hù)進(jìn)行對(duì)比,如漏斗不同階段的轉(zhuǎn)化率
  3. 目標(biāo)對(duì)比:常見于目標(biāo)管理,如完成率等
  4. 時(shí)間對(duì)比:日環(huán)比,周月同比;7天滑動(dòng)平均值對(duì)比,7天內(nèi)極值對(duì)比

時(shí)間對(duì)比嚴(yán)格來說屬于橫切對(duì)比。但因?yàn)闀r(shí)間這個(gè)維度在數(shù)據(jù)分析和產(chǎn)品中極為重要,所以單拎出來說。橫切對(duì)比中,有個(gè)比較著名的數(shù)據(jù)應(yīng)用方式即是「「排行榜」。通過這種簡單粗暴的方式,來驅(qū)動(dòng)人們完成目標(biāo),或者占領(lǐng)人們的認(rèn)知。前者有銷售完成排行榜。后者有品類售賣暢銷榜。

3.3 溯源

經(jīng)過反復(fù)的細(xì)分對(duì)比后,基本可以確認(rèn)問題所在了。這時(shí)候就需要和業(yè)務(wù)方確認(rèn)是否因?yàn)槟承I(yè)務(wù)動(dòng)作導(dǎo)致的數(shù)據(jù)異常,包括新版本上線,或者活動(dòng)策略優(yōu)化等等。

如果仍然沒有頭緒,那么只能從最細(xì)顆粒度查起了,如

  1. 用戶日志分析
  2. 用戶訪談
  3. 外在環(huán)境了解,如外部活動(dòng),政策經(jīng)濟(jì)條件變化等等

3.4 衍生模型

在「細(xì)分對(duì)比」的基礎(chǔ)上,可以衍生出來很多模型。這些模型的意義是能夠幫你快速判斷一個(gè)事情的關(guān)鍵要素,并做到不重不漏。

這里列舉幾個(gè)以供參考:

  • Why-How-What
  • 5W1H
  • 5Why
  • 4P模型(產(chǎn)品,價(jià)格,渠道,宣傳)
  • SWOT 模型(優(yōu)勢(shì),劣勢(shì),機(jī)會(huì),威脅)
  • PEST 模型(政治,經(jīng)濟(jì),社會(huì),科技)
  • 波士頓矩陣

舉個(gè)例子:

最近京東和美團(tuán)外賣可能會(huì)發(fā)現(xiàn)送貨時(shí)長延長,針對(duì)物流相關(guān)的客訴增加,從 PEST 模型就可以分析出來是否在政治上出了問題。而當(dāng)你在競品做比對(duì)分析時(shí),SWOT 或者 4P 模型能夠給你提供不同的角度。

四、數(shù)據(jù)分析如何落地

以上講的都偏「道術(shù)技」中的「術(shù)」部分,下面則通過匯總以上內(nèi)容,和實(shí)際工作進(jìn)行結(jié)合,落地成「技」部分。

4.1 數(shù)據(jù)分析流程和場景

根據(jù)不同的流程和場景,會(huì)有些不同的注意點(diǎn)和「術(shù)」的結(jié)合

4.2 數(shù)據(jù)分析常見謬誤

控制變量謬誤:在做 A/B 測(cè)試時(shí)沒有控制好變量,導(dǎo)致測(cè)試結(jié)果不能反映實(shí)驗(yàn)結(jié)果?;蛘咴谶M(jìn)行數(shù)據(jù)對(duì)比時(shí),兩個(gè)指標(biāo)沒有可比性。

樣本謬誤:在做抽樣分析時(shí),選取的樣本不夠隨機(jī)或不夠有代表性。舉例來講,互聯(lián)網(wǎng)圈的人會(huì)發(fā)現(xiàn)身邊的人幾乎不用「今日頭條」,為什么這 APP 還能有這么大瀏覽量?有個(gè)類似的概念,叫?幸存者偏差

定義謬誤:在看某些報(bào)告或者公開數(shù)據(jù)時(shí),經(jīng)常會(huì)有人魚目混珠?!妇W(wǎng)站訪問量過億」,是指的訪問用戶數(shù)還是訪問頁面數(shù)?

比率謬誤:比率型或比例型的指標(biāo)出現(xiàn)的謬誤以至于可以單獨(dú)拎出來將。一個(gè)是每次談?wù)摯祟愋椭笜?biāo)時(shí),都需要明確分子和分母是什么。另一方面,在討論變化的百分比時(shí),需要注意到基數(shù)是多少。有些人即使工資只漲 10% ,那也可能是 150萬…

因果相關(guān)謬誤:會(huì)誤把相關(guān)當(dāng)因果,忽略中介變量。比如,有人發(fā)現(xiàn)雪糕的銷量和河溪溺死的兒童數(shù)量呈明顯相關(guān),就下令削減雪糕銷量。其實(shí)可能只是因?yàn)檫@兩者都是發(fā)生在天氣炎熱的夏天。天氣炎熱,購買雪糕的人就越多,而去河里游泳的人也顯著增多。

辛普森悖論:簡單來說,就是在兩個(gè)相差較多的分組數(shù)據(jù)相加時(shí),在分組比較中都占優(yōu)勢(shì)的一方,會(huì)在總評(píng)中反而是失勢(shì)的一方。

最后以幾句話作為總結(jié),也是全文中心:

  1. 數(shù)據(jù)準(zhǔn)確性是第一位的
  2. 站在業(yè)務(wù)方的角度思考問題:憂其所慮,予其所欲
  3. 定義「變」與「不變」
  4. 細(xì)分,對(duì)比,溯源

 

作者:陳新濤,公眾號(hào)ourStone

本文由 @陳新濤 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash ,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 很厲害,謝謝分享

    來自重慶 回復(fù)
  2. 寫的很棒,學(xué)習(xí)了。

    來自北京 回復(fù)