盤點(diǎn):數(shù)據(jù)分析中最基本的分析方法

LLL
6 評(píng)論 16349 瀏覽 183 收藏 18 分鐘

編輯導(dǎo)語:在數(shù)據(jù)分析中,有各種各樣的分析方法供我們使用。復(fù)雜的分析方法固然好用,但是日常工作中經(jīng)常用到的還是基礎(chǔ)的分析方法。本文作者為我們介紹了六種常見的分析方法,如果你能熟練的使用它們,相信能夠解決許多的日常數(shù)據(jù)分析問題。

日常數(shù)據(jù)分析中,尤其是業(yè)務(wù)分析中,常用的分析方法論主要是幾大類,本文會(huì)介紹我認(rèn)為比較關(guān)鍵的六大類常用方法,熟練地混合交叉使用這六大類基本方法,80%的日常數(shù)據(jù)分析問題都能解決。

下面我會(huì)介紹這些方法有哪些,并且給出實(shí)例介紹如何使用這些方法。

一、多維分析

所謂多維分析就是細(xì)分分析,做多維分析首先要明確2個(gè)方向:維度和指標(biāo)。

  • 指標(biāo):指的是用來記錄關(guān)鍵流程的,衡量目標(biāo)的單位或方法,如DAU、留存率、轉(zhuǎn)化率等。
  • 維度:指的是觀察指標(biāo)的角度,如時(shí)間、來源渠道、地理位置、產(chǎn)品版本維度等。

多維分析,就是在多個(gè)維度拆解,觀察對(duì)比維度細(xì)分下的指標(biāo)。實(shí)現(xiàn)將一個(gè)綜合指標(biāo)細(xì)分,從而發(fā)現(xiàn)更多問題。

數(shù)據(jù)分析-最基本分析方法介紹

舉個(gè)實(shí)際用途的例子,KPI拆解,制定明年的KPI目標(biāo):

  1. 第一步:指標(biāo)拆解,商品營(yíng)收=(新用戶數(shù)+老用戶數(shù))×商品訂單轉(zhuǎn)化率×客單價(jià);
  2. 第二步:對(duì)指標(biāo)進(jìn)行多維細(xì)分,新老用戶可以再細(xì)分客群,比如孕婦群體、運(yùn)動(dòng)愛好者、學(xué)生、白領(lǐng)等;商品訂單可以細(xì)分商品的類型、商品的價(jià)格、商品的供應(yīng)商、商品的品牌影響力等;
  3. 第三步:根據(jù)歷史業(yè)務(wù)發(fā)展情況,計(jì)算不同用戶維度、不同商品維度下的商品營(yíng)收;
  4. 第四步:求和不同用戶維度、不同商品維度下的商品營(yíng)收,即為商品總營(yíng)收。

在越來越講究精細(xì)化運(yùn)營(yíng)的今天,多維分析的作用越來越重要,管理層通常看的是綜合指標(biāo),總值,但通常這些總值無法真正地發(fā)現(xiàn)問題。對(duì)于一線員工將總值拆解細(xì)分,才能發(fā)現(xiàn)問題,找到可落地的解決問題。

二、趨勢(shì)分析

有對(duì)比才有分析,有對(duì)比數(shù)據(jù)才能產(chǎn)生意義,所以對(duì)比分析在實(shí)際數(shù)據(jù)分析中是非常重要的一種分析手段,最常用的是基于時(shí)間的對(duì)比分析。基于時(shí)間的對(duì)比分析,主要是指同一指標(biāo)在不同時(shí)間周期的對(duì)比,主要分為同比、環(huán)比和定基比。

  1. 環(huán)比是指:與相鄰的上一周期做對(duì)比,周期可以是時(shí)、日、周、月、季、年等。比如周環(huán)比,指的是本周與上一周的對(duì)比;
  2. 同比是指:兩個(gè)周期同一個(gè)時(shí)間點(diǎn)的比較,目的是追蹤周期性的變化;
  3. 定基比是指:和指定的時(shí)間基點(diǎn)對(duì)比。

數(shù)據(jù)分析-最基本分析方法介紹

舉個(gè)數(shù)據(jù)例子:如2017年10月的月同比,指的是2017年10月和2016年10月做對(duì)比,而2017年10月的月環(huán)比,指的是2017年10月和上一周期2017年9月做對(duì)比。

三、轉(zhuǎn)化分析法(漏斗分析)

轉(zhuǎn)化分析也叫漏斗分析,主要是分析分析產(chǎn)品流程或關(guān)鍵節(jié)點(diǎn)的轉(zhuǎn)化效果,常借助漏斗圖展現(xiàn)轉(zhuǎn)化效果。

漏斗圖是一種外形類似漏斗的可視化圖表,該方法可以直觀追蹤產(chǎn)品的整體流程,追蹤業(yè)務(wù)的轉(zhuǎn)化路徑,追蹤不同生命階段下的用戶群體表現(xiàn)。漏斗分析常用的場(chǎng)景主要有:

  1. 產(chǎn)品流程的關(guān)鍵路徑轉(zhuǎn)化追蹤,比如電商常用的購買流程;
  2. 業(yè)務(wù)價(jià)值路徑的轉(zhuǎn)化流程追蹤,比如常用的AARRR模型的價(jià)值轉(zhuǎn)化追蹤;
  3. 虛擬流程類指標(biāo)追蹤,比如按生命周期區(qū)分的不同生命周期階段的用戶流轉(zhuǎn)形態(tài)追蹤。

舉個(gè)例子,針對(duì)AARRR模型轉(zhuǎn)化場(chǎng)景:

AARRR是Acquisition、Activation、Retention、Revenue、Refer這五個(gè)單詞的首字母縮寫。它主要闡述的是用戶從獲取到激活,到留存,到產(chǎn)生營(yíng)收,到口碑認(rèn)可正向傳播的一系列閉環(huán)效應(yīng)。

我們可基于用戶量計(jì)算出這些節(jié)點(diǎn)的轉(zhuǎn)化率,從而判斷哪些節(jié)點(diǎn)的轉(zhuǎn)化率差,哪些節(jié)點(diǎn)還有優(yōu)化的空間,再通過具體的運(yùn)營(yíng)手段來提升節(jié)點(diǎn)轉(zhuǎn)化率。如下圖中的活躍購買率僅33%,是否可以運(yùn)營(yíng)手段將其提升到40%呢?

數(shù)據(jù)分析-最基本分析方法介紹

四、公式拆解法

所謂公式拆解法,就是對(duì)目標(biāo)變量用已知公式進(jìn)行拆解,從而快速找到影響目標(biāo)變量的因素。公式拆解法沒有固定的標(biāo)準(zhǔn),一個(gè)目標(biāo)變量在不同的場(chǎng)景下或者說為解決不同問題,需要利用公式拆解的細(xì)致程度也不一樣。

常見的公式拆解的場(chǎng)景有:

1. GMV計(jì)算

GMV = 下單用戶量*客單價(jià)

=(新用戶+留存用戶+召回用戶)*客單價(jià)

= (廣告觸達(dá)量 * 轉(zhuǎn)化率 + 老用戶*留存率 + 召回觸達(dá)用戶量 * 召回率)* (商品量*商品單價(jià))

2. ROI計(jì)算

ROI = 收益/成本

=(銷售單價(jià)*銷售量)/(固定成本+可變成本)

(收益和成本也可以繼續(xù)根據(jù)業(yè)務(wù)進(jìn)行拆解)

3. DAU預(yù)估

A(n):第n天的新增用戶;R(n):第n天的留存率

DAU(n) = A(n) + DAU(n-1) * R(1)

= A(n) + A(n-1) * R(1) + DAU(n-2) * R(2)

= A(n)+A(n-1)R(1)+A(n-2)R(2)+… …+A(1)R(n-1)

4. 凈資產(chǎn)收益率ROE

ROE = 當(dāng)前凈利潤(rùn)/當(dāng)期平均凈權(quán)益

= 利潤(rùn)率 * 總資產(chǎn)周轉(zhuǎn)率 *財(cái)務(wù)杠桿

= 凈利潤(rùn)/銷售收入 * 銷售收入/總資產(chǎn) * 總資產(chǎn)/權(quán)益

根據(jù)公式對(duì)目標(biāo)變量拆解后,我們通常會(huì)對(duì)拆解后的變量做更精細(xì)的分析,并且提出可落地解決問題的解決手段。

如下圖所示,這是電商/零食行業(yè)最常用的拆解解決問題的框架,為提升銷售額,在實(shí)際解決問題中都要細(xì)化到廣告拉新、用戶分析、商品分析等層面。

數(shù)據(jù)分析-最基本分析方法介紹

五、綜合評(píng)估法

綜合評(píng)估法是將多個(gè)指標(biāo)綜合成一個(gè)指標(biāo)評(píng)估的方法。這種方法是非常常見的,如我們?nèi)粘V械奈浵佇庞梅帧⑽⒉岫?、游戲?zhàn)績(jī)排名等都是基于綜合評(píng)估法實(shí)現(xiàn)的。

綜合評(píng)價(jià)法的特點(diǎn)表現(xiàn)為:

  1. 評(píng)價(jià)過程是通過一些特殊的方法,按指標(biāo)的重要性對(duì)多指標(biāo)加權(quán),多個(gè)指標(biāo)的評(píng)價(jià)是同時(shí)完成的,而非一個(gè)一個(gè)逐次完成的;
  2. 在多指標(biāo)整合進(jìn)行綜合評(píng)價(jià)指標(biāo)的過程中,會(huì)涉及權(quán)重的設(shè)定;
  3. 綜合評(píng)價(jià)法生成的綜合指標(biāo)不再是單純意義上的單個(gè)指標(biāo)的意思,而是多個(gè)指標(biāo)的綜合反映。

因此,對(duì)于綜合評(píng)估法,賦權(quán)是非常重要的環(huán)節(jié)。而賦權(quán)的方法可分為兩類:主觀評(píng)估法和客觀評(píng)估法??陀^評(píng)估法是指:變異系數(shù)、熵分析、主成分分析等;主觀評(píng)估法是指:層次分析法、專家賦權(quán)等。

1. 變異系數(shù)法

變異系數(shù)等于樣本標(biāo)準(zhǔn)差除以樣本均值,是衡量樣本觀測(cè)值變異程度的變量。而且因?yàn)樽儺愊禂?shù)是除以了樣本均值,所以他是忽略了量綱的影響。那具體如何用變異系數(shù)定權(quán)重呢,具體步驟可以看下面:

第一步:對(duì)于每一個(gè)指標(biāo)計(jì)算變異系數(shù)cvcv_i=樣本標(biāo)準(zhǔn)差/樣本均值= σ/μ

第二步:計(jì)算各個(gè)指標(biāo)最終的權(quán)重

數(shù)據(jù)分析-最基本分析方法介紹

基于以上的計(jì)算公式可以看出,對(duì)于變異系數(shù)法定義權(quán)重,如果一個(gè)指標(biāo)可以明顯區(qū)分不同的樣本,那么就會(huì)有更高的權(quán)重;反之,如果樣本在某個(gè)指標(biāo)的表現(xiàn)上沒有特別明顯,即該指標(biāo)區(qū)分樣本的能力較弱,則應(yīng)該給這個(gè)指標(biāo)賦予比較小的權(quán)重。

2. 熵值法

熵的概念來源于熱力學(xué),后來被引入信息論,用以表示對(duì)不確定性的一種度量。信息熵一般用來反映信息量的大小,信息量越大,不確定性越小,熵就越小;反之,信息量越小,不確定性越大,則熵就越大。

信息熵的計(jì)算方式如下:

假設(shè)有隨機(jī)變量X,對(duì)應(yīng)的值分分別為x1, x2, …, xn對(duì)應(yīng)的概率分別為pi,信息熵為:

數(shù)據(jù)分析-最基本分析方法介紹

具體基于信息熵計(jì)算權(quán)重的方法步驟如下:

第一步:計(jì)算指標(biāo)的比重假設(shè)有n個(gè)樣本,m個(gè)指標(biāo),xij為第i個(gè)樣本第m個(gè)指標(biāo)的值。因?yàn)椴恢罉颖緦?duì)應(yīng)的具體指標(biāo)的概率,可以用m指標(biāo)下n樣本對(duì)應(yīng)的指標(biāo)值占該指標(biāo)總值的比率來表示。第xij指標(biāo)的比重pij為:

數(shù)據(jù)分析-最基本分析方法介紹

第二步:計(jì)算第j項(xiàng)指標(biāo)的熵值

數(shù)據(jù)分析-最基本分析方法介紹

第三步:計(jì)算各項(xiàng)指標(biāo)的權(quán)重

數(shù)據(jù)分析-最基本分析方法介紹

第四步:計(jì)算各個(gè)樣本的綜合得分

數(shù)據(jù)分析-最基本分析方法介紹

計(jì)算出的綜合得分是[0,1],可通過開根號(hào)再乘以100的方式,將其映射到[0,100]。

3. 層次分析法

層次分析法(AHP)是運(yùn)籌學(xué)中的概念,是指將與決策總是有關(guān)的元素分解成目標(biāo)、準(zhǔn)則、方案等層次,在此基礎(chǔ)之上進(jìn)行定性和定量分析的決策方法。

如下所示,要計(jì)算總得分,可以將其拆解為質(zhì)量、互動(dòng)、消費(fèi)、發(fā)布、附件這五個(gè)準(zhǔn)則,對(duì)于這五個(gè)準(zhǔn)則有再細(xì)分的方案。

數(shù)據(jù)分析-最基本分析方法介紹

那具體怎么定義權(quán)重,大體思路是:由專家分別在每一個(gè)準(zhǔn)則的細(xì)分方案下,對(duì)細(xì)分方案兩兩之間評(píng)重要程度(如1-9,1是同等重要,9是一方極端重要)。

再基于重要程度,可通過層次分析法的計(jì)算公式計(jì)算出每個(gè)細(xì)分方案的權(quán)重;同理可對(duì)五個(gè)準(zhǔn)則進(jìn)行重要評(píng)估,從而計(jì)算出五個(gè)準(zhǔn)則的權(quán)重。具體方法可百度,百度上有詳細(xì)的計(jì)算公式。

六、結(jié)構(gòu)化分析

所謂結(jié)構(gòu)化分析,其實(shí)就是邏輯樹和MECE的結(jié)合使用。

邏輯數(shù)是麥肯錫推廣的思考問題的工具,就是將目標(biāo)問題像樹一層一層拆解,最左邊是“樹根”(目標(biāo)/問題的起點(diǎn)),朝右是將某已知問題的影響層當(dāng)成已知問題的樹枝,每多一個(gè)影響層,則添加一個(gè)樹枝,直到列出已知問題的所有影響層為止。

且各邏輯樹枝之間的關(guān)系需要“相互獨(dú)立、完全窮盡”(MECE)。

結(jié)構(gòu)化分析是非常好用的一種方法,它能將問題層層有序拆解,有助于思路清晰,同時(shí)可以將復(fù)雜問題由繁化簡(jiǎn)。下面以一個(gè)應(yīng)用場(chǎng)景來舉例說明:

比如要分析某App用戶流失的原因,窮舉用戶流失的影響因素,做出邏輯樹。

數(shù)據(jù)分析-最基本分析方法介紹

雖說結(jié)構(gòu)化分析非常好用,但是構(gòu)建一個(gè)完美的框架(邏輯樹)可不是一件容易事,一般構(gòu)建結(jié)構(gòu)框架有兩種方法:自下而上和自上而下。

1. 自下而上

自下而上的意思是:先頭腦風(fēng)暴羅列可能的影響因素,再對(duì)羅列的影響因素歸類分解形成框架。

數(shù)據(jù)分析-最基本分析方法介紹

下面以一個(gè)應(yīng)用場(chǎng)景來舉例說明,比如如何在2年內(nèi)賺到100萬元?

1)第一步:羅列要點(diǎn)

數(shù)據(jù)分析-最基本分析方法介紹

2)第二步:連線歸類

一般是從時(shí)間、結(jié)構(gòu)、重要性三個(gè)維度進(jìn)行歸類。

3)第三步:形成框架

數(shù)據(jù)分析-最基本分析方法介紹

4)第四步:檢查是否有重復(fù)和遺漏

2. 自上而下

自上而下的意思是:已經(jīng)有可套用解決的框架,將需要解決的問題按照框架拆解,最后形成針對(duì)目標(biāo)問題的結(jié)構(gòu)框架?,F(xiàn)有的成熟的框架特別多,比如4P、4C、SWOT、PEST、5W2H等等。

數(shù)據(jù)分析-最基本分析方法介紹

3. 自上而下和自上而下對(duì)比

從上面的講解很容易看出兩種構(gòu)建框架的區(qū)別,具體的對(duì)比整理如下,日常中可為了提高框架輸出能力而有針對(duì)性的訓(xùn)練。

數(shù)據(jù)分析-最基本分析方法介紹

以上就是我要介紹的常用數(shù)據(jù)分析方法,掌握上述方法,我相信80%的數(shù)據(jù)分析問題都能得到合理的分析思路。但在實(shí)際場(chǎng)景中,很少僅用單一方法就能直接解決問題,大多數(shù)情況下都要綜合上述方法中的多種方法才可。

比如電商場(chǎng)景下的如何提升銷售額問題?就要用到公式法、轉(zhuǎn)化分析法、多維分析法及結(jié)構(gòu)分析法,經(jīng)過這樣一系列分解才能獲得可落地化的解決方案(公式拆解法里貼的示例圖就有比較詳細(xì)的邏輯拆解過程)。

 

本文由 @須臾即永恒 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 這些公式看不懂,太燒腦,也說明博主寫的很專業(yè)

    來自北京 回復(fù)
  2. 請(qǐng)問結(jié)構(gòu)化分析法是不是就是社邦分析法呀

    回復(fù)
    1. 杜邦分析法

      回復(fù)
  3. 很棒??!

    回復(fù)
  4. 作者這篇文章有理論,有案例的將數(shù)據(jù)分析方法講得通俗易懂,學(xué)習(xí)到不少,謝謝了

    來自廣東 回復(fù)
  5. 學(xué)習(xí)了 感謝~~

    來自河南 回復(fù)