干貨 | 從業5年,我總結了一套數據分析的實用方法論

18 評論 24913 瀏覽 271 收藏 13 分鐘

本文作者基于自己的經驗,總結出一套標準的數據分析方法論,幫助行業內的小伙伴更清晰的知道該如何做一個完整的數據分析。

寫在前面

數據分析是所有產品經理的必備能力,也是折磨各位產品經理最痛苦的一件事情。

  • 上線前,老板會說:做一個數據分析?評估下預期。
  • 上線中,功能表現的不理想,老板會說:數據往下掉了,做個數據分析看看為啥?
  • 上線中,功能表現的好,老板會說:做的不錯,做個數據報告統一匯報一下。

OMG,你看,不會數據分析,寸步難行!

當然互聯網上有非常多數據分析的心法和教程。我大概總結了一下大致有兩類:

  • 一種是偏純理論形式的;比如如何用spss做主成分分析,專業高大上,怎樣應用勒?完全沒有時間系統學習有木有!
  • 一種是偏形而上的,告訴你數據分析,首先要基于數據調研,然后數據驗證巴拉巴拉的,給你一種道理都懂,依然過不好這一生的錯覺。

因為自己從業數據產品多年,數據產品的一個基本工作就是把分析結論抽象成數據產品,幫助業務進行數據洞察。所以,自己也大大小小做過非常多的數據分析。我就在想,是否可以基于自己的經驗,總結出一套標準的數據分析方法論,幫助行業內的小伙伴更清晰的知道該如何做一個完整的數據分析。

當然,這次對自己的這套方法論也有一些自我要求:

  1. 一定要從實際出發的那種,要有一個案例貫穿始終;
  2. 一定要有可復用的結論,并且是不形而上,夸夸其談的那種。

于是乎便有了此篇文章,本文將以外賣流量分配分析作為案例,深入講解如何完整的做一個數據分析。

目錄

1.數據分析-定義問題

2.數據分析-梳理分析框架

3.數據分析-規范數據內容

4.數據分析-規劃分析方法

5.數據分析-輸出分析報告

6.總結

定義問題

數據分析的本質是解決某一個業務問題。

解決業務問題的前提,一定要想清楚兩件事情:

  1. 理解問題:想清楚這個問題到底是什么
  2. 定義問題:用數據拆解出這個問題

我見過太多小伙伴做數據分析的時候,根本就沒搞明白為什么要分析?要分析的這個問題到底是什么?所以在分析之前,一定要花時間了解這個數據分析到底解決了什么問題。

這個問題,在定義清楚后,需要和業務方、leader去反復溝通,直到對這個問題清楚的達成共識。

以外賣流量分配舉例:

(1)理解什么是流量分配?

從市場收回到外賣業務來看,流量分配其實和布局市場的本質是一樣的:通過更有效的分發商品、更合理的擺放商家,讓用戶與商戶進行更有效率的交易。

那么,如何更有效的分發商品?如何更合理的擺放商家呢?

需要通過一套分發機制去實現,而分發機制必須依賴于分發渠道去實施。

具體來說,分發渠道可以看做我們線上產品的流量渠道。該有哪些流量渠道,流量渠道里該擺放哪些商家,是我們考慮的重點。

流量渠道作為分發渠道,起到連接商家與用戶的作用,同時也是對用戶需求及商家供給進行配對。如下:

  • 用戶群體1——渠道1---商家1、商家2、商家3
  • 用戶群體2---——渠道2---商家4、商家5、商家6
  • 用戶群體3---——渠道3---商家7、商家8、商家9

流量渠道是為分發機制服務的通道,每一個流量渠道必定有不同分發機制的含義。比如:搜索入口,以搜索關鍵詞為分發機制,建立用戶需求與商家供給的匹配。

綜上所述:站在平臺看流量分配是一件什么樣的事情?

以流量渠道作為媒介,通過資源配置實現用戶與商戶進行更有效率的交易,平臺需要做兩件事情:

  1. 分對人(匹配需求):把合理的流量渠道分配給需要的用戶群體,即為現在進行的精準化營銷,千人千面。
  2. 配對貨(匹配供給):每一個流量渠道里分配滿足這個用戶需求的商家。

(2)用數據定義流量分配

首先,思考如何去定義流量?

一般而言,流量是指在某一時間某一地點某一會話從來源到去向的全過程。

其次,思考我們用什么指標去有效的衡量流量:用dau衡量?用頁面去重uv衡量?還是用什么去衡量?

從業務的角度來看,我要統計一天內產生了多少的流量,代表我要統計有多少次用戶使用過我的產品。

每日流量,本質上為每日會話數=每日用戶數*日均用戶使用頻次。

最后,思考我們該從哪些角度去衡量流量?

拆解來看,如下表:

關于外賣流量分配的具體思考,可以參考另外一篇文章,里面會有對流量分配的詳細定義及思考:搭建流量分配體系,這里不再詳細贅述。

梳理分析框架

知道了數據分析的問題是什么后,需要我們去基于這個問題,梳理一個數據分析框架。在這個分析框架里,我們需要明確分析內容的數據范圍以及要分析哪些問題。

(1)明確數據范圍

數據范圍一般分為空間范圍與時間范圍;具體如下:

(2)規劃分析框架

基于定義問題環節中對問題的理解,用詳細的數據拆解問題,并把這些問題進行歸類形成框架。

基于外賣流量分配為例,框架截取如下:

規范數據內容

有了數據分析框架后,需要對數據分析框架里的數據進行詳細定義規范,確保每一項數據的統計口徑是準確無誤的。

數據內容主要分為:

1. 指標維度定義

詳細定義數據分析框架中的每一個指標含義,形成指標字典。這個指標字典的作用,一方面作為需求文檔,是與數據開發評審的依據;另一方面,是一份釋義說明,作為分析報告中指標說明的出口。

基于外賣流量分配為例,截取部分指標說明如下:

2. 指標維度矩陣設計

需要把指標維度用一個矩陣的方式呈現出來,如果該指標在該維度上有關聯,則打勾。

指標維度矩陣的作用是明確指標與維度的關系,也可以幫助我們復驗所有指標與維度的關聯是否可以滿足我們的分析需求。避免后期造成如下badcase:我想從地域的角度觀測交易金額指標,卻發現取出的數據中,交易金額不支持地域維度的下鉆。

基于外賣流量分配為例,截取部分指標維度矩陣如下:

規劃分析方法

接下來基于分析框架,明確每一個分析問題,需要采用什么樣的分析方法進行分析;詳情寫出分析的標題、度量內容、可視化方法、分析方法,并按數據分析報告(以PPT為例)展示的順序組織。

基于外賣流量分配為例,截取部分如下:

那我們到底該選取什么樣的可視化方法去呈現我們的報告呢?這里參照國外大神的經驗,總結了一個萬能圖表,供大家參考:

完成分析方法的規劃后,我們就可以形成一個數據分析的提綱,這個數據分析提綱是非常重要的:

  1. 清楚的闡明我們需要分析的問題。這些問題并不是憑空想象的,而是基于定義問題環節、搭建分析框架環節的邏輯推導得出。
  2. 清楚的知道分析問題中需要的數據內容。
  3. 有一個完整的畫面感,明確數據分析最終呈現的樣式。

以PPT展示形式為例,甚至可以知道這個報告有多少頁,每一頁都有哪些內容。

輸出分析報告

這樣,我們基于以上的準備,就可以按部就班的去輸出我們的分析報告了。

我在這里的建議是,一定要把任何一個數據分析當成自己的作品一樣,高標準高要求的進行產出。這樣,不僅可以鍛煉我們的撰寫報告能力,也可以更好的讓業務方對你形成專業可信賴的印象。

基于外賣流量分配為例,截取分析報告如下:

備注:以上所有具體數據均經過虛構處理,請勿作為行業參考

總結

如上以外賣流量分配為例,詳細介紹了數據分析的全流程。最后,對數據分析的方法論總結如下:

寫在最后,數據分析是每位產品小伙伴日常離不開的一項工作任務。期望這篇文章,可以幫助大家更系統的思考我們做數據分析的目的和流程,如果有好的建議可以留言交流。

歡迎各位小伙伴訂閱關注,一位與數據相愛相殺多年的數據產品汪敬上~

相關閱讀

數據產品的工作本質是什么

如何基于數據統計業務

 

本文由 @ 羅大大 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unspalsh, 基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 世上的感情還有最多的一種,他不愛你你也不愛他

    回復
  2. 都說數據分析完要產生結論,有時候我分析完不知道要怎么指導業務,并不是業務不熟,是不知道怎么著手?這個有好的辦法嗎?

    來自北京 回復
  3. 方便加個微信嗎??,本人想做數據產品經理,但一直沒有體系化的入門學習

    來自重慶 回復
    1. 有的,你沒有找到~
      數據產品經理實戰訓練營就是起點學院出的,你添加qidianxiaoshi咨詢就可以啦~
      我剛好在上第一期課程

      來自廣東 回復
  4. 終于讀到了第二篇流量分配體系的文章,但是這篇屬于流量分配報告,有流量分配系統么?就是流量分配系統,管理了像您說的站外流量渠道,站內流量渠道,這些渠道的用戶標簽。系統中還有商品標簽和店鋪標簽,流量分配系統中可以對這些標簽進行AI學習,也可以人為干預,比如某些新品質優價廉,我可以給它提供能過的流量分配?

    來自北京 回復
  5. 感謝分享,非常有用?。?/p>

    來自湖北 回復
  6. 感謝收藏~

    來自北京 回復
  7. 我認為的流程是:定義問題->規范數據內容->梳理分析框架->…
    因為先整理數據內容(指標維度定義及矩陣),在梳理分析框架的時候就可以根據這些【指標】進行【維度】發散詳細分析。
    如:你這里的 [按照品類分析]、[按照地區分析] 都是屬于【維度+指標】分析

    來自廣東 回復
    1. 一個有趣的思考,數據分析就像是做一道菜;
      1.定義問題像是定義要做什么菜;比如宮保雞丁
      2.數據內容像是原材料
      3.分析框架像是菜譜
      我理解先要有菜譜,才能去菜市場(指標字典)中去選取自己需要的菜;而規范數據內容就像是洗菜切菜。
      這里的邏輯取決于:是先有菜譜,再按照菜譜去買菜?還是先把一大把菜買好,在去想怎么做?可能前者的效率會更高~
      一些見解,歡迎探討~

      來自北京 回復
    2. 您這套流程可以更適用于:
      對業務場景很熟悉,熟悉有哪些指標與維度,能很快把握分析的方向。
      ———————————————————
      而對于我這種做數據入行不久的人小白來說:
      先列出數據字典,可能可以啟發我對數據分析方向的思考,比如可以從哪些維度進行下鉆,再去拆解問題。

      ?? 我還需要慢慢成長。

      來自廣東 回復
  8. 屬實晦澀難懂,過度堆砌辭藻,簡單問題復雜化

    來自廣東 回復
    1. 多謝支持,有好的見解歡迎溝通~

      來自北京 回復
  9. 新增會話數的指標定義,是“若歷史無UUID,算作新增”,還是“若有算作新增”?
    多謝

    來自江蘇 回復
    1. 若歷史無UUID算作新增~

      來自北京 回復
  10. 感謝分享,訂閱了!

    來自廣東 回復
    1. 多謝支持!

      來自北京 回復
  11. 沙發!碼住!

    來自北京 回復
    1. 多謝~

      來自北京 回復