數據分析學習筆記:明確問題與假設檢驗法

0 評論 5832 瀏覽 46 收藏 8 分鐘

大家有沒有發現,隨著數據的積累,對數據的分析顯得越來越重要,數據分析能力也成為了產品經理必備的技能之一。下面分享個人的學習筆記,文末也附上了一些互聯網數據分析相關的名詞解釋。

數據分析前提:確定問題,明確目標

未明確想要解決的問題,想要達成的目標,就進行數據分析,就如下圖中未定下目的地就上路旅行一樣,兜來兜去不知前往何處。

那我們該如何明確問題呢?

步驟:

  1. 明確提出問題方的關注點;
  2. 明確解決問題的目標;
  3. 可用資源有哪些?
  4. 問題拆分。

例子:老板給了你一堆數據,說:看看,然后想個方案,提高下日活。

接到任務后,我們需要:

當前產品所處的背景是?是想提高單一個產品的日活,還是其中的某些功能活躍度?

我們跟老板心中的日活定義是否一致(是對產品進行了任意操作就算活躍用戶,還是需要在產品上使用多少分鐘才算)?

任務是提高多少日活?可調用的數據是否足夠,若不夠,還需要哪些支持?

問題拆分:

  • 導致用戶沉默的原因?
  • 我們的活躍用戶有哪些特征?
  • 簽到功能促活效果如何,存在什么問題?
  • 推送消息后效果如何,存在什么問題?

……

通過以上,我們可以將一個大問題,拆分成一個個明確的、可直接分析的小問題,然后去綜合分析,解決大問題。

數據分析方法:假設檢驗法

世事紛紜、真假難辨。書籍《深入淺出數據分析》中,介紹了一種方法:假設檢驗法。將收集的數據,進行整合評估,對某些事件進行預測分析。

我們先來看一個例子:

智能手機這幾年,迎來了行業爆發的階段,經常會有新型的手機發布,如果讓你來預測某公司的新型手機發布會時間,你會怎么做呢?

我們使用假設檢驗法來試著解答這個問題:

假設有以下幾種可能:

  1. 一周內召開發布會;
  2. 下個月召開發布會;
  3. 半年內召開發布會;
  4. 一年內召開發布會;
  5. 取消發布新產品。

我們搜集到以下資料:

  1. 公關負責人在回應:公司在一個月內不會開發布會;
  2. 新聞已顯示供應商有手機殼產品流出;
  3. 按照慣例,該公司每半年會發布一款新產品,距離上次發布已經過去3個月;
  4. 今年以來,大部分知名手機廠商發布新手機的頻率都提高了;
  5. 據傳:該公司ceo表示一年內不會發布新產品。

然后我們使用證偽法

從第一條資料,我們可證明假設1(一周內召開發布會)不成立。

但是其他資料并無法幫助我們排除選項。

接著我們通過將證據與假設進行推斷,看看該證據是否支持假設成立。支持為“+”,不利為“-”,無法提供支持或不利因素為0

此時,我們得出:下個月或者半年內召開發布會的可能性最高。根據目前的證據,我們還無法得出更精準的數據,所以應該收集更多信息。

本例可能略有不當,但通過以上,我們可以知道如何進行假設檢驗法,對事件進行推測:明確問題-提出假設-收集證據-進行證偽-進行推斷-得出結果。

希望幫助大家能夠了解這種方法,很簡單,也很實用。

附:常見名詞解釋

PV(Page View)頁面瀏覽量:表示頁面被打開的次數,用于評價網站流量的指標之一。

UV(Unique Visitor)獨立訪客:通過互聯網訪問、瀏覽某個網頁的人數。通過ip地址來識別,一個ip地址為一個訪客。計算時間內(00:00-24:00)同一個訪客多次訪問,只算一次。

DAU(Daily Active User)日活躍用戶數量:一般指一日之內啟動或者對產品進行了任意操作的用戶數(去除重復登陸的用戶),用于反映產品的用戶規模。

MAU(Monthly Active Users)月活躍用戶數量:一日之內啟動或者對產品進行了任意操作的用戶數(去除重復用戶數),用于反映產品的用戶規模。

CAC(Customer Acquisition Cost)用戶獲取成本:總營銷費用除以其打來的新增用戶數。表示獲取一個新用戶所花費的成本

ARPU(Average Revenue Per User)每個用戶平均收入:計算時間內,從每個用戶處所得到的收入。

近7日:包括今日,如今天是3月8號,此時統計近7日的數據則為:3月2號-3月8號

過去7日:不包括今日,如今天是3月8號,此時統計近7日的數據則為:3月1號-3月7號

著陸頁(LandingPage):用戶進入目標網站的第一個頁面。用戶訪問的一般過程:站內著陸頁A → 后續受訪頁面B→ 后續受訪頁面……→ 站內出口頁X

會話(Session):用戶從打開到關閉應用/網站,被視為一次會話。

跳出:用戶進入著陸頁就離開。用戶來到網站后,除了瀏覽LandingPage之外,沒有發生其他任何操作就離開了網站,被視為跳出。

跳出率 = 訪問了一個頁面的Session數/總的Session數,用來衡量著陸頁的質量。

退出:當用戶從某個頁面離開了網站,即視為退出。

退出率:某頁面退出率 = 從某頁面離開網站的次數/該頁面瀏覽總次數。當用戶從某個頁面離開了網站,即視為退出。退出率只能用來分析特定流程中的某些頁面能不能滿足用戶的需求的問題。

希望對大家有所幫助。

 

作者:彬,微信公眾號:有個思享,專注讀書與產品心得分享,歡迎交流。

本文由 @彬 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!