數據分析實戰:數據分析的5大關鍵環節

9 評論 63511 瀏覽 290 收藏 10 分鐘

大數據及移動互聯網時代,每一個使用移動終端的人無時無刻不在生產數據,而作為互聯網服務提供的產品來說,也在持續不斷的積累數據。數據如同人工智能一樣,往往能表現出更為客觀、理性的一面,數據可以讓人更加直觀、清晰的認識世界,數據也可以指導人更加理智的做出決策。

數據驅動的時代,無論你的工作內容是什么,掌握一定的數據分析能力,可以幫助你更好的認識這個世界,更好的提升工作效率。

數據分析流程主要分為五個關鍵環節:明確數據分析目的、明確數據源及數據口徑、數據處理、數據分析、輸出。

一、明確數據分析目的

任何一件事在做之前都是有目的性的,數據分析也是如此,在進行數據分析之前首先要明確數據分析為什么要做?下面通過用戶、需求、場景三要素拆解法來明確數據分析的目的。

1、用戶

這里提到的用戶是指數據分析內容或者結果給誰看?這里的目標用戶主要分三類:你自己、企業內部業務部門、外部客戶。這里主要對后兩種進行解析。

企業內部業務部門:

這類用戶通常會通過制定不同策略提升企業某些指標的提升,可以是市場部門、運營部門或者是維系部門。他們往往指導企業內部積累了大量數據,但是不知道如何使用,如何通過數據分析形成有效的決策。

外部客戶:

這類用戶通常不具有某一領域或多個領域的行業數據,希望通過這些數據了解他的用戶或市場,而恰巧你的企業具備這樣的數據,這種情況下通過數據價值變現,形成對外的數據分析輸出,對外部用戶來說可以更好的了解市場,對于你來說也可以通過數據形成價值變現,為企業帶來收益。

2、需求

你的用戶即數據分析問題提出者為什么要做數據分析,他們是希望通過數據分析發現問題還是希望提升某個業務指標,這些都是在做數據分析前需要了解的,只有了解了需求才能制定更合理的數據分析思路(后面會介紹到數據分析方法)。

3、場景

場景更多體現的是數據分析的場景,如業務部門想了解用戶在注冊流程中的用戶流失原因,那么這就是問題的場景,要根據場景去定義問題,梳理數據分析思路,選擇數據分析的方法。

二、明確數據源及數據口徑

1、數據源

數據的獲取主要有三種方式,第一種通過一些基于前端頁面的數據采集工具獲取,如GrowingIO等可視化的數據采集產品;第二種是在產品設計過程中通過數據埋點的方式,在需要數據時可以進行簡單提取,這種方式的前提是在產品規劃階段就已經對未來的數據獲取提前做好了準備;第三種是如果前期沒有進行功能埋點、可視化的采集工具也無法獲取數據時,找研發團隊通過后臺腳本或技術研發的方式獲取數據。

2、數據口徑

數據口徑,即定義某一個數據指標的含義。舉個簡單栗子來說,針對于用戶流失指標的定義,不同的產品或者不同的領域會有所不同。對于普通電商產品來說,用戶三天之內沒有登錄或購買就是流失,但是對于奢侈品電商來說,僅僅用幾天沒有登錄或購買即算作用戶流失是不合理的。

對于數據口徑的明確,需要結合數據分析任務提出者的需求以及具體業務場景,定義清晰的數據口徑對后面的數據處理以及數據分析具有關鍵的意義。

三、數據處理

數據處理階段主要做的工作是數據清洗、數據補全、數據整合。

1、數據清洗

發現數據中的異常值,如對連續多天的用戶登錄數據進行處理時,如果有一天的登錄數遠遠超過正常值,那么就需要分析,該天是否有重大營銷活動,還是采集數據時出現的錯誤,通過異常值不僅可以發現數據采集方法的問題,同時可能通過異常值找到數據分析的目標。比如對信用卡詐騙的分析,就是通過查找異常數據的方式。

2、數據補全

針對數據缺失的情況如何解決,一種方式是根據數據前后的關聯關系填充平均值等方式,另一種則是直接選擇丟失該條記錄不用于數據分析。兩種方式各有優劣,建議結合具體問題具體分析。

3、數據整合

在采集數據時,不同類型數據之間可能存在潛在關聯關系,通過數據的整合,豐富數據維度,更利于發現更多有價值的信息。如用戶注冊數據與用戶購買數據相關聯,可以通過用戶的基礎屬性信息判斷用戶購買的商品是自己使用還是送人等等。

四、數據分析

數據分析思路又叫數據分析方法,數據分析一定是以目的為導向的,通過目的選擇數據分析的方法。通常來說主要有以下集中分析思路

1、異常分析

通過數據分析發現異常情況,找到解決異常問題的方法。

2、尋找關聯關系

關聯關系也可以成為購物車分析,耳熟能詳的沃爾瑪尿布與啤酒的案例就是關聯關系的最佳實踐,通過分析不用商品或不同行為之間的關系,發現用戶的習慣。

3、分類、分層

通過用戶特征、用戶行為對用戶進行分類分層,形成精細化運營、精準化業務推薦,進一步提升運營效率和轉化率。

4、預測

通過用戶歷史行為預測用戶未來可能的行為,提升用戶感知和使用體驗。

五、輸出

在前面層提到,數據分析的目的是通過數據清晰的了解用戶、產品和當前業務形態,從而得到有效的戰略決策指導下一步的發展。

如何通過數據清晰了解用戶、產品和業務生態?一行行枯燥的數字是無法讓業務部門或外部客戶直觀了解數據背后的含義的,所以需要通過數據可視化的方法,簡單來說就是將一行行的數據轉化為圖表,直觀化展現數據的趨勢、數據之間的關聯關系等等。在對數據可視化時,需要著重考慮數據有幾個維度、數據要向看的人展現什么,這些都影響著數據可視化的形式。

如針對注冊用戶男女性別比例的展現可以用餅狀圖,展現注冊用戶數隨時間變化的增長趨勢可以用曲線圖,展現注冊用戶歸屬地可以通過柱狀圖或地圖等等。在選擇可視化方式時,要充分考慮數據的特點以及希望用圖表展現出來的內涵是什么,這樣才能用合理的方式展現出更直觀的分析結果。

此外,數據分析的輸出通常以數據分析報告的形式展現,數據分析報告的主要結構如下:

  1. 數據分析背景
  2. 數據來源及數據說明
  3. 數據分析方法
  4. 數據可視化
  5. 數據決策

以上是一份較為正式的數據分析報告的大體框架,如果針對日報一類并不要求正式性的數據分析結果展現,則可以具體問題具體分析。

六、總結

數據分析方法論一定是為指導具體工作實踐而服務的,所以僅僅掌握方法論并不夠,還要通過實踐不斷完善優化方法。只有當你真正去做數據分析這件事時,才能發現自己的不足,說再多不如直接去做。

#專欄作家#

記小憶,人人都是產品經理專欄作者,野蠻生長的產品經理,擅長從0-1搭建產品經理知識體系。公眾號:PM龍門陣。

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Pixabay,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 會統計不會分析?滴滴策略運營經理帶你快速入門,15天掌握一套數據分析流程和方法!戳我報名>>http://996.pm/YNG4e

    來自廣東 回復
  2. 簡直水中之神,你的文章真的是用心寫的嗎?

    來自北京 回復
  3. 沒明白 數據口徑是啥意思??!

    回復
    1. 我的理解就是標準,比如定義活躍用戶,可以定義為每天登錄的用戶,也可以定義為每天登錄一小時以上的用戶,根據不同產品或背景,這個定義不同,也就是數據口徑不同。

      回復
  4. 沒有實例,說的都是書上那種概念的東西

    來自北京 回復
  5. 太泛了!

    來自福建 回復
  6. “耳熟能詳的沃爾瑪尿布與啤酒的案例就是關聯關系的最佳實踐”這個案例真實性有待考究,說是最佳實踐就不嚴謹了,現在有很多是把啤酒和尿布放在一起賣的么?

    來自四川 回復
  7. 比較表面,不深入,沒有什么細節

    來自廣東 回復
  8. 太籠統了

    回復