亚洲综合色在线观看,欧美牲交a欧美牲交aⅴ电影,狠狠做深爱婷婷久久综合一区

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

「Why-What-How」：數(shù)據(jù)分析的基本方法論

陳新濤

2017-12-18

2 評(píng)論 58745 瀏覽 260 收藏

30 分鐘

2017.12.3受「水滴互助」的朋友相邀，分享了個(gè)人在數(shù)據(jù)分析領(lǐng)域的一些基本方法論。數(shù)據(jù)產(chǎn)品以沉淀數(shù)據(jù)分析思路為基本點(diǎn)，這兩個(gè)領(lǐng)域略有重合之處。在這里整理成文章分享給大家。

「Why-What-How」在講解概念和執(zhí)行上是個(gè)不錯(cuò)的思維模型，這次依例按此框架來拆分「數(shù)據(jù)分析」。相信很多朋友已經(jīng)有了較豐富的分析經(jīng)驗(yàn)，這里權(quán)且從個(gè)人的角度進(jìn)行梳理，以資參考。為了幫助大家更好地理解本文，先貼出一張思維腦圖：

一、WHY：為什么要做數(shù)據(jù)分析

在目前講解數(shù)據(jù)分析的文章里，大多數(shù)會(huì)忽略數(shù)據(jù)分析本身的目的。這會(huì)導(dǎo)致我們?cè)趫?zhí)行時(shí)，會(huì)出現(xiàn)動(dòng)作變形的情況。

以終為始，才能保證不會(huì)跑偏。

個(gè)人的理解上：數(shù)據(jù)分析是為了能以量化的方式來分析業(yè)務(wù)問題并得出結(jié)論。

其中有兩個(gè)重點(diǎn)詞語：量化和業(yè)務(wù)。

首先講下量化。

量化是為了統(tǒng)一認(rèn)知，并且確保路徑可回溯，可復(fù)制。統(tǒng)一認(rèn)知后，才能保證不同層級(jí)，不同部門的人在平等話語權(quán)和同一個(gè)方向進(jìn)行討論和協(xié)作，才能避免公司內(nèi)的人以「我感覺」「我猜測(cè)」來猜測(cè)當(dāng)前業(yè)務(wù)的情況。

路徑可回溯可復(fù)制指的是：通過量化后的結(jié)果，許多優(yōu)化的方法是可以被找到原因并且可以被復(fù)制的。同樣是轉(zhuǎn)化率優(yōu)化，用 A 方案和 B 方案，誰的效果會(huì)比較好和具體好多少，都是可被預(yù)測(cè)的。

要想做到量化，需要做到三點(diǎn)：建立量化體系，明確量化重點(diǎn)和保證數(shù)據(jù)準(zhǔn)確性。

1.1 建立量化體系

建立量化體系，主要是根據(jù)「指標(biāo)設(shè)計(jì)方法」，設(shè)計(jì)業(yè)務(wù)的「核心指標(biāo)+拆解指標(biāo)+業(yè)務(wù)指標(biāo)」，最后落地成全公司通用的「指標(biāo)字典」和「維度字典」。

這種工作一般是由數(shù)據(jù)分析師或數(shù)據(jù) PM 來擔(dān)任完成。通過這種方式，我們就能初步建立面向全公司全面，系統(tǒng)的量化分析框架，保證日常分析可以做到「逐層拆解，不重不漏」。

1.1.1 指標(biāo)設(shè)計(jì)方法

講到指標(biāo)設(shè)計(jì)方法，大家可能覺得：之前聽過了產(chǎn)品設(shè)計(jì)方法、程序開發(fā)方法，指標(biāo)這種東西也有設(shè)計(jì)方法么？

確實(shí)有，指標(biāo)設(shè)計(jì)是一套以準(zhǔn)確和易懂為準(zhǔn)則，集合統(tǒng)計(jì)學(xué)和業(yè)務(wù)效果的方法論。

準(zhǔn)確是指能夠準(zhǔn)確滿足衡量目的，易懂是指標(biāo)算法能直觀顯示好與壞，并且指標(biāo)的算法也能夠通俗易懂。這兩者很多時(shí)候需要有所抉擇，準(zhǔn)確是第一位的。舉個(gè)例子：當(dāng)我們想衡量一個(gè)群體收入的差異性時(shí)，用方差還是用基尼系數(shù)？

方差好懂，但不能顯示兩個(gè)極端的差異性多大?；嵯禂?shù)算法不好懂，但能準(zhǔn)確描述這個(gè)問題。

具體到指標(biāo)設(shè)計(jì)，我們需要使用一些常用的統(tǒng)計(jì)學(xué)工具：

以顧客質(zhì)量分析為例：概況是我們看下顧客的平均支付金額，或者支付中位數(shù)，來了解顧客概況。如果我們想了解這批顧客的質(zhì)量是都比較好，還是良莠不齊，則需要通過方差和標(biāo)準(zhǔn)差來描述。如果想知道更詳細(xì)的內(nèi)容，可以了解每個(gè)區(qū)間的用戶數(shù)是多少，來做判斷。

有一些 Tips 供大家參考：

比率指標(biāo)：關(guān)注實(shí)際效果（下單轉(zhuǎn)化率，光看下單數(shù)是沒有用的）
伴生指標(biāo)：既要看新客數(shù)也要看 CAC，確保數(shù)量的前提也要確保質(zhì)量
防止壞指標(biāo)：錯(cuò)誤指標(biāo)，虛榮指標(biāo)，復(fù)雜指標(biāo)

這里簡單解釋下每個(gè) Tips 的目標(biāo)。

之所以采取比率指標(biāo)和伴生指標(biāo)，是因?yàn)槟軌蛎黠@反映業(yè)務(wù)的「效率」且能夠有效防止因?yàn)樽非髥蝹€(gè)指標(biāo)而導(dǎo)致動(dòng)作變形。

如果說這輛車能跑十萬公里，其實(shí)并不能表示這輛車的性能怎么樣；只有「速率=路程/時(shí)間」，才能反映這輛車的效率。

同時(shí)，如果片面追求速率，會(huì)導(dǎo)致汽車在設(shè)計(jì)時(shí)劍走偏鋒，給駕駛者帶來危險(xiǎn)；因此需要再加個(gè)「故障率」或「事故率」等伴生指標(biāo)來確保安全。

壞指標(biāo)中的「虛榮指標(biāo)」首次出現(xiàn)《精益數(shù)據(jù)分析》一書中，作者簡單把「PV/UV」等指標(biāo)都?xì)w為虛榮指標(biāo)。

剛開始時(shí)我頗為認(rèn)可，但后續(xù)在實(shí)際的應(yīng)用過程中，發(fā)現(xiàn)對(duì)于很多業(yè)務(wù)的監(jiān)控，這些指標(biāo)并避免不了。后續(xù)我便把「虛榮指標(biāo)」更正為「把距離業(yè)務(wù)目標(biāo)過遠(yuǎn)的環(huán)節(jié)定義為核心監(jiān)控指標(biāo)」。

對(duì)于一個(gè)即時(shí)通訊 APP 來講，下載次數(shù)、啟動(dòng)用戶數(shù)、注冊(cè)用戶數(shù)需要監(jiān)控，但不能作為核心監(jiān)控的指標(biāo)；更合適的應(yīng)該是消息數(shù)或「進(jìn)行過對(duì)話的用戶數(shù)」。

復(fù)雜指標(biāo)往往是各種「指數(shù)」，用了很多指標(biāo)各種加減乘除，這會(huì)導(dǎo)致此類指標(biāo)在發(fā)生波動(dòng)時(shí)，很難分析原因。

擁有對(duì)指標(biāo)的定義權(quán)和解釋權(quán)是個(gè)段位非常高的事情，這要求設(shè)計(jì)者深入了解業(yè)務(wù)和擁有極高的抽象能力。

對(duì)于分析師來講，擁有指標(biāo)定義權(quán)將凸顯出你在業(yè)務(wù)方的重要性——當(dāng)然，這里并不是鼓勵(lì)大家為了定義指標(biāo)而定義指標(biāo)。尋找業(yè)界已有量化方法并在公司內(nèi)推廣，也是件功德無量的事情。

舉個(gè)美女外賣的「美女廚師率加權(quán)指導(dǎo)值」為例。為避免泄露商業(yè)機(jī)密，將這個(gè)原本用來衡量用戶體驗(yàn)的指標(biāo)換成「美女廚師率」，以下背景也稍作修改，大家領(lǐng)會(huì)精神即可：

指標(biāo)的背景是為了保證用戶的用餐體驗(yàn)，美女外賣總部提出每個(gè)城市的商家必須配備一定比例的美女廚師。但城市提出異議：不同城市擁有的商家情況不一樣——大型的商家廚師多，美女廚師率會(huì)相對(duì)較低，不能用統(tǒng)一的值來對(duì)比所有城市。因此總部便設(shè)計(jì)出來這么一個(gè)指導(dǎo)值：將全國商家進(jìn)行分層，每個(gè)層次的商家得出全國平均值，然后各個(gè)城市對(duì)標(biāo)平均值產(chǎn)出自身的對(duì)標(biāo)值，即「美女廚師率加權(quán)指導(dǎo)值」。雖然在計(jì)算上稍微復(fù)雜點(diǎn)，但在實(shí)際應(yīng)用的過程中，BD 們只需要知道總體的差距和每一層商家的差別，很容易針對(duì)性的落地和優(yōu)化。

1.1.2 建立指標(biāo)體系

在根據(jù)「指標(biāo)設(shè)計(jì)方法」上，如何建立起圍繞業(yè)務(wù)的指標(biāo)體系呢？

核心是根據(jù)業(yè)務(wù)特征確定核心指標(biāo)，在核心指標(biāo)的基礎(chǔ)上以不同的角度進(jìn)行拆解，然后再慢慢補(bǔ)充其他業(yè)務(wù)的指標(biāo)情況。。

拆解的時(shí)候，要做到按指標(biāo)拆解而非維度。比如訂單數(shù)，也可以拆解為各品類的訂單數(shù)合計(jì)，這一點(diǎn)可以通過保持上下兩層指標(biāo)名稱不一致來避免。拆解的過程依照金字塔方法論的「逐層拆解，不重不漏（MECE）」。若拆解出來或業(yè)務(wù)補(bǔ)充的指標(biāo)過多，可借鑒數(shù)據(jù)倉庫的「域」概念來管理這些指標(biāo)，如上圖的「交易域」，「商品域」和「用戶域」。

在一個(gè)規(guī)范的指標(biāo)體系中，已經(jīng)涉及到元數(shù)據(jù)管理的領(lǐng)域了。包括針對(duì)指標(biāo)命名的規(guī)范，數(shù)據(jù)存儲(chǔ)和計(jì)算的管理等等。大家有興趣地可以搜下相關(guān)文章，或閱讀阿里巴巴新出的《阿里巴巴大數(shù)據(jù)實(shí)踐之路》。

下面截取一張來自云棲大會(huì)的，關(guān)于指標(biāo)命名規(guī)范的 PPT 給大家：

1.1.3 建設(shè)指標(biāo)維度字典

這里是轉(zhuǎn)轉(zhuǎn)公司早期部分的指標(biāo)維度字典，（Bus Matrix），一定程度上解決了之前公司內(nèi)對(duì)于指標(biāo)定義不清或不統(tǒng)一的問題?，F(xiàn)在這套東西已經(jīng)產(chǎn)品化，可以在可視化產(chǎn)品中查看和顯示了。

對(duì)于暫沒能力產(chǎn)品化的公司，建議可由分析師們通過 Google Docs 或 Wiki 對(duì)一些關(guān)鍵和常用的指標(biāo)進(jìn)行統(tǒng)一的維護(hù)。

對(duì)于維度總線矩陣，主要是在以維度建模的數(shù)據(jù)倉庫，設(shè)計(jì)數(shù)據(jù)產(chǎn)品，多維度交叉分析時(shí)提供框架和基礎(chǔ)。

1.2 明確量化重點(diǎn)

每個(gè)階段，都應(yīng)該明確當(dāng)前的業(yè)務(wù)重點(diǎn)；量化體系需要根據(jù)業(yè)務(wù)階段，更改量化重點(diǎn)及方式。

這同時(shí)意味著：有更細(xì)節(jié)的指標(biāo)及更大的監(jiān)控和推廣力度。

比如外賣行業(yè)早期，經(jīng)歷了看重訂單數(shù)，到訂單額，到新客數(shù)+補(bǔ)貼率，到新客數(shù)+資金使用效率（交易完成進(jìn)度/費(fèi)用完成進(jìn)度）的歷程。

我們可以看到：隨著戰(zhàn)爭的階段不斷升級(jí)和變化，從不計(jì)成本打下市場份額，到看中訂單質(zhì)量，到存量市場爭得差不多了，開始考慮新客數(shù)量，同時(shí)控制補(bǔ)貼力度，到戰(zhàn)爭趨于常態(tài)化，開始控制整體補(bǔ)貼額度，靠拼效率來戰(zhàn)勝對(duì)手。每個(gè)階段，都需要根據(jù)不同的戰(zhàn)場情況來判斷當(dāng)前重點(diǎn)，從而圍繞該重點(diǎn)建立一套360度無死角的分析監(jiān)控體系。

1.3 確保數(shù)據(jù)準(zhǔn)確性

在數(shù)據(jù)準(zhǔn)確性這個(gè)話題里，數(shù)據(jù)產(chǎn)品已經(jīng)有成熟的數(shù)據(jù)質(zhì)量管理方法；涉及了數(shù)據(jù)源，指標(biāo)計(jì)算和數(shù)據(jù)呈現(xiàn)等各個(gè)環(huán)節(jié)的監(jiān)控。

本文主要從分析師的角度闡述確保準(zhǔn)確性的方法，數(shù)據(jù)產(chǎn)品相關(guān)的就先不贅述了。

采取可信來源：多來源交叉確認(rèn)，采用新來源時(shí)需格外小心
確認(rèn)加工方式：指標(biāo)定義和加工算法
Double Check：量級(jí)，計(jì)算邏輯和業(yè)務(wù)常識(shí)

這里著重講下 Double Check 的技巧，這些技巧可以讓很多管理層或投資人在不了解業(yè)務(wù)的前提下，就能判斷出來數(shù)據(jù)是否有問題。

量級(jí) Check：每個(gè)數(shù)據(jù)有它的大概范圍，比如 DAU，WAU 和 MAU。
計(jì)算邏輯 Check：一般對(duì)于整體部分型的分?jǐn)?shù)，比如市場份額，那么它必須滿足：1，取值最大不能超過1；2，各部分加和應(yīng)為1；3，兩數(shù)字加和后，和應(yīng)該在中間范圍內(nèi)。
業(yè)務(wù)常識(shí) Check：根據(jù)其他常用數(shù)字推算出該業(yè)務(wù)范圍。如果有人跟你說某某社交 APP DAU 過億，你大概知道是否在吹牛，因?yàn)槿栈钸^億的 APP 就那么幾個(gè)。對(duì)于 DAU/MAU，各個(gè)行業(yè)都有響應(yīng)的范圍值，淘寶為：34.6%，天貓15.5%，京東15.8%。

1.4 站在業(yè)務(wù)方的角度

除了「量化」之外，另外一個(gè)重點(diǎn)詞語是「業(yè)務(wù)」。

只有解決業(yè)務(wù)問題分析才能創(chuàng)造價(jià)值。

價(jià)值包括個(gè)人價(jià)值和公司價(jià)值。

對(duì)于公司來講，你提高了收入水平或者降低了業(yè)務(wù)成本，對(duì)于個(gè)人來講，你知道怎么去利用數(shù)據(jù)解決業(yè)務(wù)問題，這對(duì)個(gè)人的能力成長和職業(yè)生涯都有非常大的幫助。

如何站在業(yè)務(wù)方的角度思考問題呢，總結(jié)起來就是八個(gè)字「憂其所慮，給其所欲」。

這里不僅適用于分析師這個(gè)崗位，在所有以供需為主要關(guān)系的交互過程里，精準(zhǔn)理解對(duì)方需求對(duì)于供給方都是最重要的。比如 PM 對(duì)于用戶，分析師對(duì)于業(yè)務(wù)方，下級(jí)對(duì)于上級(jí)。

在具體的落地過程中，主要是在這以下幾個(gè)環(huán)節(jié)

溝通充分
結(jié)論簡明
提供信息量及可落地建議
尋求反饋

在溝通上，確定業(yè)務(wù)方想要分析什么，提出更合理專業(yè)的衡量和分析方式，同時(shí)做好節(jié)點(diǎn)同步，切忌一條路走到黑。在分析業(yè)務(wù)需求上，跟很多產(chǎn)品需求分析方法論是類似的，需要明確所要數(shù)據(jù)背后的含義。

舉例來講，業(yè)務(wù)方說要看「頁面停留時(shí)長」，但他實(shí)際想要的，可能是想衡量用戶質(zhì)量，那么「留存率」「目標(biāo)轉(zhuǎn)化率」才是更合適的指標(biāo)。

在闡述分析結(jié)果上，要記得結(jié)論先行，逐層講解，再提供論據(jù)。論據(jù)上，圖 > 表 > 文字。因?yàn)闃I(yè)務(wù)方或管理層時(shí)間都是有限的，洋洋灑灑一大篇郵件，未看先暈，誰都沒心思看你到底分析了啥。需要做到：在郵件最前面，用 1-3 句話先把結(jié)論給出來，即使需求方不看后續(xù)內(nèi)容都可以了解你報(bào)告 80% 的內(nèi)容。

在「提供信息量及可落地建議」上，先要明白什么叫信息量：提供了對(duì)方不知道的信息。太陽明天從東方升起不算信息量，從西方升起才是。在分析的過程中，一定要從專業(yè)的角度，從已知邊界向未知邊界進(jìn)軍，力求角度新穎論證扎實(shí)，并且根據(jù)分析內(nèi)容給出可落地的建議。

舉個(gè)簡單例子：

尋求反饋是很多分析過程所缺乏的一步，數(shù)據(jù)分析給出去后便沒有持續(xù)跟進(jìn)。那你就不知道到底做得對(duì)不對(duì)。

反饋猶如一面鏡子，讓你及時(shí)地調(diào)整和優(yōu)化自己的方法論。

二、WHAT：什么是數(shù)據(jù)分析

數(shù)據(jù)分析的本質(zhì)是抓住「變」與「不變」。

「變」是數(shù)據(jù)分析的基礎(chǔ)，如果一個(gè)業(yè)務(wù)每天訂單是 10000 單，或者每天都是以 10% 的速度穩(wěn)步增長，那就沒有分析的必要了。而若想抓住「變」，得先形成「不變」的意識(shí)。

積累「不變」，就是養(yǎng)成「數(shù)據(jù)常識(shí)（Data Common Sense）」的過程。「不變」是根據(jù)對(duì)歷史數(shù)據(jù)不斷的觀察和積累而來。一般來說會(huì)是個(gè)范圍，范圍越精準(zhǔn)，你對(duì)「變」就越敏感。這里有三個(gè)個(gè)人的習(xí)慣，可以幫助養(yǎng)成「不變」：

形成習(xí)慣，每天上班第一時(shí)間查看數(shù)據(jù)：實(shí)時(shí)&日周月報(bào)
記住各個(gè)指標(biāo)大數(shù)，反復(fù)推算
記錄關(guān)鍵數(shù)據(jù)（榜單&報(bào)告）

大部分指標(biāo)沒有記住全部數(shù)字的必要，簡單記住大數(shù)，萬以下只需要記到萬位，有些數(shù)字只需要記住百分比。?而指標(biāo)之間的推算可以幫助你對(duì)各個(gè)指標(biāo)的數(shù)量級(jí)關(guān)系和邏輯脈絡(luò)梳理清楚，出現(xiàn)波動(dòng)時(shí)便能更加敏感。記錄關(guān)鍵數(shù)據(jù)是將工作生活遇到的比較有趣的榜單或數(shù)據(jù)報(bào)告保存在一個(gè)統(tǒng)一的地方，方便查閱和分析。

在「不變」的基礎(chǔ)上，便能逐漸培養(yǎng)出指標(biāo)敏感性，即意識(shí)指標(biāo)偏離的能力。這主要是通過各種日環(huán)比，周月同比的監(jiān)控以及日常的好奇心來保持。

我們從一個(gè) Questmobile 2017 年春季榜單上，來簡單看下「指標(biāo)偏離」是怎么應(yīng)用到日常的分析上的：

這里先跟大家分享下怎么看這種榜單：

看整體排行：看哪些 APP 排在前方是出乎你意料之外的
分行業(yè)看排行：看行業(yè)里排行及其變動(dòng)
看增長率：哪些 APP 增長比較快
看使用時(shí)長等其他指標(biāo)

這里我試著拋出幾個(gè)問題：

新浪新聞竟然比騰訊新聞還高？今日頭條竟然比一點(diǎn)資訊低？
秒拍竟然比快手高？
百度地圖在榜單上比高德高，為什么去年俞永福還敢宣稱活躍終端數(shù)第一位？
QQ 的時(shí)長已經(jīng)連續(xù)兩個(gè)季度月活出現(xiàn)下降了，是否意味著什么？
按增長率排序，最快的王者榮耀，其次是今日頭條，快手，高德地圖。高德既然還算增長得較快的 APP？

數(shù)據(jù)分析的定義，還有國外一本商務(wù)分析的書籍的定義作為注腳：

三、HOW：怎么進(jìn)行數(shù)據(jù)分析

任何數(shù)據(jù)分析都是「細(xì)分，對(duì)比，溯源」這三種行為的不斷交叉。最常見的細(xì)分對(duì)比維度是時(shí)間，我們通過時(shí)間進(jìn)行周月同比，發(fā)現(xiàn)數(shù)據(jù)異常后，再進(jìn)行維度或流程上的細(xì)分，一步步拆解找到問題所在。如果找到了某個(gè)維度的問題，則需要溯源到業(yè)務(wù)端或現(xiàn)實(shí)端，確認(rèn)問題產(chǎn)生的源頭。如果多次細(xì)分對(duì)比下來仍然沒有確認(rèn)問題，則需要溯源到業(yè)務(wù)日志或用戶訪談來更進(jìn)一步摸清楚情況。

3.1 細(xì)分

以下內(nèi)容在上篇《大數(shù)據(jù)與用戶研究》中略有提及，這里再做一個(gè)總結(jié)。在細(xì)分方式上，主要有以下三種方式

橫切：根據(jù)某個(gè)維度對(duì)指標(biāo)進(jìn)行切分及交叉分析
縱切：以時(shí)間變化為軸，切分指標(biāo)上下游
內(nèi)切：根據(jù)某個(gè)模型從目標(biāo)內(nèi)部進(jìn)行劃分

橫切上，以轉(zhuǎn)轉(zhuǎn)舉例，我們對(duì)維度和指標(biāo)做做了分類和交叉，當(dāng)某一類的指標(biāo)出現(xiàn)問題時(shí)，我們便知道該從什么維度進(jìn)行分析。在進(jìn)行橫切分析時(shí)，經(jīng)常需要多個(gè)維度交叉著使用。這在數(shù)據(jù)分析術(shù)語上叫：交叉多維分析。這也是剛才講的「維度總線矩陣」看到的各維度交叉情況了。

縱切上，有目的有路徑，則用漏斗分析。無目的有路徑，則用軌跡分析。無目的無路徑，則用日志分析。

漏斗分析分為長漏斗和短漏斗。長漏斗的特征是涉及環(huán)節(jié)較多，時(shí)間周期較長。常用的長漏斗有渠道歸因模型，AARRR，用戶生命周期漏斗等等。短漏斗是有明確的目的，時(shí)間短，如訂單轉(zhuǎn)化漏斗和注冊(cè)漏斗。在軌跡分析里，桑基圖是一種常用的方式。常見于各頁面的流轉(zhuǎn)關(guān)系，電商中各品類的轉(zhuǎn)移關(guān)系等等。日志分析，則通過直接瀏覽用戶前后端日志，來分析用戶的每一個(gè)動(dòng)作。

各種手段的細(xì)分往往交叉著使用，如訂單漏斗縱切完可以接著橫切，看看是哪個(gè)維度的轉(zhuǎn)化率導(dǎo)致的問題。

內(nèi)切上，主要是根據(jù)現(xiàn)有市面上常見的分析模型，RFM，Cohort 和 Segment等方式進(jìn)行分析。RFM 即最近購買時(shí)間，頻率及金額三個(gè)指標(biāo)綜合來判定用戶忠誠度及粘性。Cohort，即同期群分析，是通過對(duì)不同時(shí)期進(jìn)入平臺(tái)的新用戶分群分析，來區(qū)分不同新用戶的質(zhì)量，如留存率或目標(biāo)轉(zhuǎn)化率等。Segment 通過若干個(gè)條件對(duì)用戶分層，然后針對(duì)不同用戶進(jìn)行分層分析和運(yùn)營，如用戶活躍度分層等等。

3.2 對(duì)比

對(duì)比主要分為以下幾種：

橫切對(duì)比：根據(jù)細(xì)分中的橫切維度進(jìn)行對(duì)比，如城市和品類
縱切對(duì)比：與細(xì)分中的縱切維護(hù)進(jìn)行對(duì)比，如漏斗不同階段的轉(zhuǎn)化率
目標(biāo)對(duì)比：常見于目標(biāo)管理，如完成率等
時(shí)間對(duì)比：日環(huán)比，周月同比；7天滑動(dòng)平均值對(duì)比，7天內(nèi)極值對(duì)比

時(shí)間對(duì)比嚴(yán)格來說屬于橫切對(duì)比。但因?yàn)闀r(shí)間這個(gè)維度在數(shù)據(jù)分析和產(chǎn)品中極為重要，所以單拎出來說。橫切對(duì)比中，有個(gè)比較著名的數(shù)據(jù)應(yīng)用方式即是「「排行榜」。通過這種簡單粗暴的方式，來驅(qū)動(dòng)人們完成目標(biāo)，或者占領(lǐng)人們的認(rèn)知。前者有銷售完成排行榜。后者有品類售賣暢銷榜。

3.3 溯源

經(jīng)過反復(fù)的細(xì)分對(duì)比后，基本可以確認(rèn)問題所在了。這時(shí)候就需要和業(yè)務(wù)方確認(rèn)是否因?yàn)槟承I(yè)務(wù)動(dòng)作導(dǎo)致的數(shù)據(jù)異常，包括新版本上線，或者活動(dòng)策略優(yōu)化等等。

如果仍然沒有頭緒，那么只能從最細(xì)顆粒度查起了，如

用戶日志分析
用戶訪談
外在環(huán)境了解，如外部活動(dòng)，政策經(jīng)濟(jì)條件變化等等

3.4 衍生模型

在「細(xì)分對(duì)比」的基礎(chǔ)上，可以衍生出來很多模型。這些模型的意義是能夠幫你快速判斷一個(gè)事情的關(guān)鍵要素，并做到不重不漏。

這里列舉幾個(gè)以供參考：

Why-How-What
5W1H
5Why
4P模型（產(chǎn)品，價(jià)格，渠道，宣傳）
SWOT 模型（優(yōu)勢(shì)，劣勢(shì)，機(jī)會(huì)，威脅）
PEST 模型（政治，經(jīng)濟(jì)，社會(huì)，科技）
波士頓矩陣

舉個(gè)例子：

最近京東和美團(tuán)外賣可能會(huì)發(fā)現(xiàn)送貨時(shí)長延長，針對(duì)物流相關(guān)的客訴增加，從 PEST 模型就可以分析出來是否在政治上出了問題。而當(dāng)你在競品做比對(duì)分析時(shí)，SWOT 或者 4P 模型能夠給你提供不同的角度。

四、數(shù)據(jù)分析如何落地

以上講的都偏「道術(shù)技」中的「術(shù)」部分，下面則通過匯總以上內(nèi)容，和實(shí)際工作進(jìn)行結(jié)合，落地成「技」部分。

4.1 數(shù)據(jù)分析流程和場景

根據(jù)不同的流程和場景，會(huì)有些不同的注意點(diǎn)和「術(shù)」的結(jié)合

4.2 數(shù)據(jù)分析常見謬誤

控制變量謬誤：在做 A/B 測(cè)試時(shí)沒有控制好變量，導(dǎo)致測(cè)試結(jié)果不能反映實(shí)驗(yàn)結(jié)果?；蛘咴谶M(jìn)行數(shù)據(jù)對(duì)比時(shí)，兩個(gè)指標(biāo)沒有可比性。

樣本謬誤：在做抽樣分析時(shí)，選取的樣本不夠隨機(jī)或不夠有代表性。舉例來講，互聯(lián)網(wǎng)圈的人會(huì)發(fā)現(xiàn)身邊的人幾乎不用「今日頭條」，為什么這 APP 還能有這么大瀏覽量？有個(gè)類似的概念，叫?幸存者偏差。

定義謬誤：在看某些報(bào)告或者公開數(shù)據(jù)時(shí)，經(jīng)常會(huì)有人魚目混珠?！妇W(wǎng)站訪問量過億」，是指的訪問用戶數(shù)還是訪問頁面數(shù)？

比率謬誤：比率型或比例型的指標(biāo)出現(xiàn)的謬誤以至于可以單獨(dú)拎出來將。一個(gè)是每次談?wù)摯祟愋椭笜?biāo)時(shí)，都需要明確分子和分母是什么。另一方面，在討論變化的百分比時(shí)，需要注意到基數(shù)是多少。有些人即使工資只漲 10% ，那也可能是 150萬…

因果相關(guān)謬誤：會(huì)誤把相關(guān)當(dāng)因果，忽略中介變量。比如，有人發(fā)現(xiàn)雪糕的銷量和河溪溺死的兒童數(shù)量呈明顯相關(guān)，就下令削減雪糕銷量。其實(shí)可能只是因?yàn)檫@兩者都是發(fā)生在天氣炎熱的夏天。天氣炎熱，購買雪糕的人就越多，而去河里游泳的人也顯著增多。

辛普森悖論：簡單來說，就是在兩個(gè)相差較多的分組數(shù)據(jù)相加時(shí)，在分組比較中都占優(yōu)勢(shì)的一方，會(huì)在總評(píng)中反而是失勢(shì)的一方。