產品經理要掌握的數據知識:數據的基本概念、術語、指標,基本技術和分析方法
“數據”這個詞,是產品經理永遠繞不過的話題,但從我多年面試經驗看,很多2-3歲的產品經理對數據的理解仍是模糊無章法的,鑒于本人也有著2年的數據產品經驗,特整理成文,給產品新人普及一下基本的數據知識。
1、基本概念
什么是“移動App的數據分析”?為什么要進行“移動App的數據分析”?
簡單來說,通過在App中進行埋點采集,或讀取App存儲在數據庫中的業務數據,以一定目的,將數據進行“篩選、清洗、加工、解析”,產出對產品設計、運營計劃有幫助的結論的過程,就是“數據分析”的過程。持續的數據分析可監控產品的運營狀態、提升推廣效果、發現產品問題、優化產品體驗。
2、基本術語
這里舉幾個我常遇到的術語,便于同開發和運營進行溝通。
埋點:一般意義上的埋點,是利用如友盟、Talkingdata等第三方公司的SDK,通過在App中嵌入一段SDK代碼,設定觸發條件,當滿足條件時,SDK會記錄日志,并將日志發送到第三方服務器進行解析,并可視化地呈現給我們。這一過程就叫埋點。
埋點方式也分“簡單埋點”和“自定義埋點”,所謂“簡單埋點”就是直接拿到第三方key,寫到App代碼的配置文件中即可。而“自定義埋點”則對應一種叫“自定義事件”的功能,一般第三方統計工具都支持,我們可通過設置“自定義事件”查看App特定的操作行為數據,如點擊按鈕次數、打開指定頁面次數等。
通常創建“自定義事件”都需要產品經理告知開發App的哪些條件下需要觸發“自定義事件”,以及觸發時要如何通過不同參數區分不同的點擊行為。
如同樣是點擊按鈕事件,可通過設置參數“Action”,來區分Action=Yes和Action=No這兩個按鈕分別點擊的次數。整個埋點流程如下圖所示:
維度:維度就是指我們平時看事物的角度,也可理解成分析一個數據能從哪些方面去分析,這些“角度”都是有值且可被枚舉的。比如我們注冊用戶數有10萬,那可分析的維度有:用戶所在省份、用戶性別、用戶角色、用戶來源等。不同維度來觀察數據,可以得出不同結論,能否拓展觀察維度,也是評估數據分析能力的一個關鍵。
度量:度量和維度相輔相成,是指可量化的數值,用于考察不同維度觀察的效果,也可理解成“數據指標”。觀察度量值可總體查看,如App總用戶數,也可配合“維度”分層查看,如不同省份的注冊用戶數、活躍用戶數,不同來源的App啟動次數、平均日使用時長等。
渠道:指App的不同安裝來源,如通過第三方應用市場安裝,通過廣告點擊安裝,通過地推二維碼掃碼安裝,通過官網下載安裝等?;ヂ摼W公司的商務工作一般就是拓展渠道,觀察不同渠道帶來的數據表現,不斷優化渠道質量。
3、基本指標
注:以下所說的指標,均以移動App常見的核心指標為主,不涉及業務相關指標。目的是希望產品經理在談起某個數據時,能統一認識。
新增用戶:安裝App后,首次啟動App的設備數,需要按“設備號”去重。新增用戶主要為了衡量推廣效果,以及當前產品在整個生命周期所處階段。
活躍用戶:時間段內,啟動過App的設備數,需要按“設備號”去重。活躍用戶主要為了衡量運營效果,以及產品使用情況。
啟動次數:時間段內,啟動App的次數,無需去重。啟動次數主要為了衡量推送效果,以及App的內容是否足夠吸引人。
留存率:時間段內的新增用戶,經過一段時間仍啟動App的用戶,占原新增用戶的比例?!皶r間段”的劃分方式有:按日、按周、按月,對應指標還可細分為“日留存率、周留存率、月留存率”。而“經過一段時間”的劃分方式有:次日、7日、14日;次周、+2周;次月、+2月等。一般一款App的次日留存率為30-40%,次月留存率為20%,已經算是不錯的成績了。
使用時長:時間段內,從啟動到結束App使用的總時長。所謂“結束App”,通常指殺掉進程,或者將App退到后臺超過30秒。一般會按“人均使用時長、次均使用時長、單次使用時長”分析,衡量產品粘性和活躍情況。
使用頻率:用戶上次啟動App的時間,與再次啟動的時間差。使用頻數分布,可觀察到App對用戶的粘性,以及運營內容的深度。
4、基本技術
數據采集技術——抓包
所謂“抓包”,一般指觀察App上傳到服務器上的數據都有哪些。
通過“抓包”觀察,一方面可判斷自家App是否正確上傳了想要統計的數據,另一方面還可抓取到手機上安裝的其他App的上傳數據,用來分析競品內容更新情況。
一般在Mac系統上,我習慣用Charles工具,Windows系統可以用Wireshark。當然抓到的數據如果想進行詳盡分析,需要一點基本的http協議知識和json格式知識。
數據提取技術——sql語言。sql語言一般用于從數據庫中進行數據的增刪改查,需要企業運維人員或DBA人員開啟權限才可訪問,大公司的產品經理基本沒機會用到,但如果你是小公司的高級產品經理,且和技術商議僅開啟只讀權限,還是可以嘗試使用的。
以我個人經驗,掌握sql只是基本要求,更關鍵的在于了解數據庫表結構和關聯關系,以及你提取數據的思路,sql只是工具而已。sql語言本身也和數據庫軟件相關,推薦學習mysql的sql語法,簡單易試。至于語句,只要掌握group by的維度,where的限制條件,還有join語句的表連接邏輯,基本就能應對80%的數據查詢需求,剩下的就是熟能生巧了。
數據處理技術——Excel、Python、JS。提取出來的數據,要深入分析,肯定得進行二次加工。按使用的難度高低,需要掌握工具如下:
Excel:大名鼎鼎的office工具,有著極其強大的數據處理能力。常用數據分析功能有透視表和命令行。推薦一個我喜歡的處理命令:
VLOOKUP:這是一個查找函數,給定一個查找目標,它就能從指定的查找區域中返回想要查找到的值。它的基本語法為:
VLOOKUP(查找目標,查找范圍,返回值的列數,false)
我們可在一堆數據中,根據指定條件,進行二次篩選,非常方便。當然這個函數的作用還不止如此,有興趣的同學可以深入研究一下。
此外,包括COUNTIF、IF等判斷語句,也是篩選數據非常好用的函數。
Python、JS:Python、JS其實是一種通用腳本語言,不止適用于數據分析,但由于其安裝、使用方便,函數庫豐富,特別適合有開發基礎的同學嘗試。舉個例子,mysql提取出來的數據,DBA通常會以Excel格式提供,簡單的二次處理可用Excel完成,但涉及根據業務不同,要根據Excel做數據的條件判斷計算,以及循環處理,就要借助第三方開發語言了(當然Excel自帶的VBA也很強大)。此外,如果希望以更可視化的方式查看數據,還可通過JS技術,調取第三方開發庫,如百度地圖的API,進行更豐富的呈現。比如之前我在e代駕做的車輛運行軌跡圖:
5、基本分析方法
介紹幾個常用的數據分析思路:
對比:字面上理解,就是非孤立地看數據,而是多個數據提取進行比較。根據對比方法不同,分為“橫向對比”和“縱向對比”。
- 橫向對比:指空間維度的對比。相當于一個指標,在不同條件下的對比,但每個條件都屬于一個層級。舉個例子,App功能的A/B測試數據對比,各個渠道的新增用戶對比,都屬于橫向對比。
- 縱向對比:指時間維度的對比。一般的對比方法有:同比、環比。同比一般指是指本期數據與上年同期數據對比,環比則是本期統計數據與上期比較。觀察時間軸上的數據折線圖來判斷產品運營狀態也是一種縱向對比。
拆分:分析這個詞,從字面意義上理解,就是“拆分”和“解析”,當某個維度對比后發現問題需要找原因時,就需要進一步“拆分”了。舉個例子,如果發現某日的銷售額只有昨日的50%,就需要對銷售額指標拆分為:成交用戶數 x 客單價,而成交用戶數 = 訪客數 x 轉化率。那么我們接下來就可分別針對:訪客數、轉化率、客單價,觀察今日和昨日相比的數據變化,找出原因。
降維:當維度太多時,我們不可能全部分析,這時就要篩選出有代表性的關鍵維度,去除掉那些無關數據,這就是“降維”。比如“成交用戶數 = 訪客數 x 轉化率”,當同時存在這三個指標時,其實我們只要三選二就能得出結論了。
增維:增維和降維是相對的,如果當前觀察的維度無法解釋當前問題,就需要對數據進行運算,多增加一個指標。在可視化分析領域,也可將不同類型的圖表嵌套使用,能達到增加信息展現維度,擴展分析廣度的目的,如下圖所示:(將環形圖和折線圖進行增維嵌套)。
分組:也可叫聚類,合適的分組能更好地理解業務和場景。例如用戶畫像過程,就是一個按不同維度對數據分組的過程。通過用戶畫像,可以很清晰地知道產品的用戶地區、用戶興趣、用戶年齡、用戶性別等屬性占比,產品經理可通過畫像進一步了解用戶需求。
漏斗分析:主要用于分析產品使用的關鍵路徑,通過設定一系列操作步驟,統計每一步中的操作用戶數,并將用戶數以柱狀圖縱向排列,就可形成用戶流失漏斗,我們可分析漏斗每個環節的流失率,并觀察改進環節交互體驗后,流失用戶的變化情況,以此來驗證改動效果。
AARRR模型:該模型一般用于游戲數據分析,是Acquisition、Activation、Retention、Revenue、Refer,這五個單詞的縮寫,分別對應一款移動應用生命周期中的5個重要環節。AARRR本身是一個循環,使用者需觀察每個環節的數據情況,以此來分析產品是否在執行一個正循環過程。這其中的任一環節除了問題,都會導致產品數據的異常。
6、總結
以上內容,從“基本概念、基本術語、基本指標、基本技術、基本分析方法”這幾個方面,講解了產品經理應了解的基本數據知識,其實每個方面都可再深入講解,但由于篇幅有限,只能擇期再開新話題,有興趣的同學可私信或微信溝通~加微信請備注來源哦~
作者:申悅,6年產品汪,現紅演圈公司產品VP,微信號:s2dongman
本文由 @申悅 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
干貨
拆分和增維還是不同的,增維是增加一個維度去分析,2個維度看不清楚,再變成3個維度去看,增加一個時間上的維度。
目前這些方法只用過對比,太淺薄了,嘖嘖
繼續學習
謝謝分享
數據分析的基本方法:1、對比,時間上對比,不同事件前后對比,不同渠道,不同表現的橫向對比;2、拆分,感覺和增維有點類似,一個指標看不清楚問題時候,可以對指標進行拆解,拆解后再分別比較分析;3、降維,去除不重要的指標,把一些指標經過計算變成一個指標等方式,還沒怎么用過;4、分組,這個方法不錯,按照用戶屬性分組去討論指標,更有針對性,什么樣的用戶喜歡什么樣的,什么變動對這類用戶比較有效?;蛘邎鼍?,這個場景下用哪個方式比較有用。更加精細化的分析。
蠻不錯的
抓包很難啊
學到了
??
看來能用好EXCEL真的是一件硬本領啊 ??
好棒 蟹蟹
有一種沖動去做運營然后轉產品,求推薦,哈哈
嗯,做過數據分析類的產品,很可惜的是,數據量太少了,出來的漏斗圖的效果真的是無法直視。心疼自己1秒
棒
干貨,很贊
太贊了,我正在分專題學習,提高產品經理能力,感謝你的分享,希望有機會可以進行向你學習~
很贊的干貨知識,頂
很棒。
干貨! 很有幫助
干貨滴干活
O(∩_∩)O謝謝
很深刻,受教了。
謝謝~
??
有趣