做好數據分析的6步曲

2 評論 9464 瀏覽 77 收藏 15 分鐘

本文將圍繞實際的數據分析步驟,細化地來講講具體是如何進行分析。

美國前郵政部長,美國百貨商店之父,約翰·華納梅克(John Wanamaker)感嘆到:“我在廣告上的投資有一半是無用的,但是問題是我不知道是哪一半?!?/p>

這種類似的感嘆現在也經常發生我們身邊。

小A同學:在項目結束后,拿到了項目數據,看看自己的方案是否有帶來數據上的增長,但面對一堆面前Excel表里一堆密密麻麻的數字,卻不知從何下手了……

小B同學:拿到了自己花大精力投入的項目數據,滿懷期待的想來驗證自己在項目中推動落地的好幾個方案,還把項目過往數據也找來進行對比,一頓操作猛如虎之后,看到整體數據上漲了,但因為影響因素特別多,具體是哪些方案產生了作用卻無從知曉……

我們更常遇到的情況是不知道該如何去運用數據,讓數據帶來實際上的作用。在上一篇文章《如何用數據指導設計?》中,已經闡述了設計師看數據的價值、數據是什么、何時看數據、以及數據指導設計的一些基本思路。本文將圍繞實際的數據分析步驟,更細化地來講講具體是如何進行下去的。

一、數據分析6步曲

數據分析主要分為6大步驟:構建X問題 – 提出假設&選擇指標 – 數據采集與整理 – 數據分析 – 數據呈現 – 提出后續建議。

下文將圍繞這6步詳細講解每一步具體是如何做的:

1.1 構建X問題

從本質上來說,數據分析的最終目的在于解決問題。帶著不同的出發點得到的數據結果可能會很不一樣。所以,一切分析的開始必須要先識別要解決的重要問題是什么,以及這個問題為什么是最重要的。這兩個問題將引導我們進入構建問題的過程,也就是明確數據分析的目的。

(1)從哪入手:

①有預判類的分析,可以從已有的策略方案出發,尋找相應定量衡量方法。例如:嘗試通過強化某促銷A頁面利益點等相關信息,從而促進用戶購買,此案例則可以直接預設X問題為:“強化利益信息是否可以提升轉化率”。

②而無預判類(發現問題或機會)的分析,構建問題的起點往往是業務角度的商業目標,通過指標拆解、經驗判斷、橫向對比、邏輯推導等方式來尋找有效的實現方式。例如:某電商促銷頁面B的核心目標是“提升GMV(銷售額)”,而GMV=流量*轉化率*客單價,就可以圍繞提升轉化率、客單價等指標出發去尋找解決方案。

(2)判斷是否重要

①有預判類的的問題,可以直接尋找指標評估驗證結果是否可靠即可。

②無預判類(發現問題或機會)的則可以通過評估該問題解決后,能夠對最重要的商業目標帶來的增益會有多大。例如,上述提升GMV的案例中,通過橫向對比相同類頁面的數據,發現此頁面的轉化率為1.8%,明顯低于同類頁面4.7%的轉化率,而流量和客單價與同類頁面基本持平,故判斷轉化率極有可能是“提升GMV(銷售額)”的關鍵點,所以可定義“提升轉化率的關鍵因素是什么”為此頁面數據分析的重要問題。

(3)定義X問題

可以根據不同的類型用一個問句來表達,如何/哪種/是否/原因是什么……。根據經驗,細化之后的常見問題有以下幾類,每類都可以用一個X問題來描述。

  1. 實驗驗證類,已經有了假設和方案,待驗證效果,如ABC三種策略,哪種效果更有利于提升轉化率或策略A是否有助于提升轉化率。
  2. 尋找原因類,看到了某現象,希望尋找背后的原因,如導致跳失率急劇上升的原因是什么。
  3. 結果呈現類,不帶預判的呈現事實,如通過數據呈現項目D的轉化與售賣情況。
  4. 預測類,通過尋找事物發生的規律,來預測接下來可能發生的事件,如一年之中用戶購買美妝用品是否存在時間上的購買規律,美妝類目運營可依據此規律來制定年度活動計劃。

(4)注意,問題的范圍不可過于寬泛

往往要得出一個可靠且明確的結論,會需要收集數據并將數據應用到一個可檢驗的假設身上。如果問題太寬泛,數據收集就會變得非常困難,舉個反例:“項目D的數據效果是否有變好”,這個例子中,“是否有變好”可能的方向有拉新效果是否有變好/銷售是否有變好/跳失情況有變好……

非常多種方向,每個方向都做探索將使你本次分析駛入無邊大海迷失方向。但也不要過早地限制問題范圍,剛開始時,可以開放性地思考問題,在腦中形成一些可供選擇的方向。例如:“可能帶來D項目的銷售變好的可能情況是1、2、3,通過初步數據來看3的可能性會更高一些”,然后就可以往3的方向深入分析下去了。

1.2 提出假設,選擇指標

在上一步中,我們已經明確了X問題,即數據分析的目標。接下來,我們將圍繞X問題,提出該問題的結論假設,并建立模型(選擇衡量指標)來驗證假設是否成立。

1.2.1 提出假設

針對有預設的問題,假設可以直接來源于問題,如方案A有助于提升轉化率。對于沒有實現預設的問題,則需要我們圍繞問題進行窮舉可能的假設,如頁面E的跳失率急劇下降,可能原因有:

  1. 流量來源的用戶質量變差了;
  2. 流量入口放錯了信息,導致用戶進入后預期不符;
  3. 首屏商品選品問題;
  4. 首屏信息設計用戶無法理解/無吸引力;
  5. 頁面加載出現問題等。

1.2.2 根據假設,選擇衡量指標

不同類型的假設,衡量方式會不一樣,有些假設可能還需要定性調研配合來驗證。在電商定量數據范圍來看,可以參考以下思路:

  1. 關于流量的假設,可選取流量相關的指標如瀏覽UV/PV、各渠道流量來源UV/PV。
  2. 關于銷售類的假設,可選取訂單相關的指標,如引入訂單金額、引入訂單數量、轉化率、UV價值。
  3. 關于用戶行為的假設,可以選取頁面操作相關的指標,如點擊UV/PV、頁面點擊率、曝光點擊率、人均點擊次數、瀏覽深度等。
  4. 關于用戶人群的假設,可以選取用戶畫像數據,如:性別、年齡、城市線級、新老用戶等,且可同時結合頁面操作數據進行細化人群行為分析。

1.3 數據采集與整理

數據源分為定量數據和定性數據,定性數據更偏用研方法,本文將注重講定量數據的采集與整理。

1.3.1 數據采集

各平臺的原始數據正在進入指數級爆炸的階段,僅從電商平臺來看,各類數據指標都非常的多而復雜。在采集之前的一個階段,必不可少的是與數據產品或開發人員明確:

  1. 數據指標的計算規則。
  2. 需要的數據指標列表(包括對應的時間段、平臺端),防止等到要提數的時候結果發現沒有數據 或者數據計算方式不合理。

1.3.2 數據整理

數據整理的第一步是數據清洗,原始的數據表往往含有不少臟數據,如測試數據、異常值、空缺等等,直接用來計算分析可能會導致數據結論有偏差或無法計算。數據清洗就是要將原始數據表處理成可方便計算分析的干凈整潔的數據表。

主要包括:

  1. 刪除重復數據,可通過Excel的COUNTIF函數或者篩選排序來進行操作;
  2. 檢查數據格式,原始數據里可能會有特殊格式如N/A、####、性別為數值等情況,可根據實際情況判斷如何處理;
  3. 檢查異常數據,可以著重關注極小值和極大值,小數點,負數等,明顯不符合實際情況的,可以排查原因,選擇刪除或重新提取數據;
  4. 處理缺失數據,這個最常見的情況,一般情況可接受的標準是缺失值在10%以下,超過就需要酌情看是否有辦法重新提取了;
  5. 檢查數據邏輯錯誤,可以抽樣選取數據進行計算檢查,如計算頁面點擊率=點擊UV/頁面瀏覽UV,假如算出頁面點擊率大于100%,就可能是有數據異常了,需要重新排查指標統計方式是否正確等。

1.3.3 數據加工計算

數據整理好之后,可以進行初始的數據加工了。因為原始數據可能并不符合我們的分析需求,比如:我們想看的是某模塊的數據,但原始數據是拆成每一個點擊位的數據,我們就需要把每個點擊位的數據進行求和等操作,轉化成模塊數據。

還有一些常見的情況是利用標準的行業計算公式,將某幾個指標進行數理計算得到另一個指標,如單UV價值=GMV/頁面UV、訂單轉化率=引入訂單數/頁面UV、人均點擊次數=點擊PV/點擊UV……通過這一步的操作,我們將能初步看到要驗證假設需要的一些基本指標的數據了。

1.4 數據分析

數據整理完之后就到了真正的重頭戲——數據分析了,也是含金量最高的一步。做數據分析有一個非常基礎但又及其重要的思路,那就是對比,基本上90%以上的分析都離不開對比。

沿著2.2假設及衡量指標的思路,我們有了一個假設“X策略可以提升A頁面轉化率”,且定義了此假設的衡量指標為“頁面轉化率”,當我們拿到頁面轉化率指標后,轉化率需要達到多少才算好呢?是否是因為X策略帶來的提升,還是可能是時間規律上的自然上漲?這時就可以通過對比來分析了。

  1. 縱比:在時間維度上,對比頁面A在使用X策略后,頁面轉化率是否提升了?
  2. 橫比:選取同時期的同類頁面-頁面B,橫向對比老頁面A、新頁面A、B三個頁面的轉化率對比情況。
  3. 與經驗值對比:可以拉取更長的時間段,看A頁面的轉化率變化規律,看使用X策略是否高于時間規律上的預期值;可以選取更多同類頁面,選取同時期的轉化率對比,看A的轉化率處于哪個位置?
  4. 與業務目標對比:假如的大的業務目標其實是GMV為2000w,在頁面瀏覽UV和UV價值穩定的情況下,計算目標轉化率=目標GMV/頁面瀏覽UV/UV價值,然后對比目標轉化和目前轉化的差距。

各個角度的對比都能幫助你更清晰的理解目前指標的情況,然后就可以據此繼續做下一步計劃啦~

二、系列預告

因單篇文章篇幅限制,本文只介紹了6步取的前3步,及簡單拋一些基本分析思路出來,后續系列文章將針對后3步——數據分析、數據呈現、及提出后續建議做更加細致詳盡的介紹。

參考資料:

張文霖 劉夏璐 狄松《誰說菜鳥不會做數據分析》電子工業出版社

托馬斯·達文波特;(美)金鎮浩《成為數據分析師》浙江人民出版社

(美)米爾頓(Milton,M.)《深入淺出數據分析》電子工業出版社

 

作者:胡瑤,公眾號:京東設計中心JDC(ID:JDCdesign)

來源:https://mp.weixin.qq.com/s/zurv3PejUz0DlrUgsSb84w

本文由 @京東設計中心JDC 授權發布于人人都是產品經理,未經作者許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 可以

    回復
  2. 總結的非常完善和清晰,感謝!

    來自福建 回復