產品經理要懂的數據分析——指標建模(上)
編輯導語:在產品經理的工作中,要結合具體業務、數據分析、數據工程這三個方面來進行數據分析,而其中所涉及的步驟工具又可以分為6個模塊。本文作者對其中的一個模塊——指標建模進行分析闡述,一起來看一下吧。
產品經理所要進行的數據分析要結合3個方面來進行——具體業務、數據分析、數據工程,而整個數據分析所涉及的步驟工具等又可以分為6個模塊——指標建模、數據工具、數據處理、數據分析基礎、數據分析進階、數據采集。今天我們來講一下指標建模模塊。
一、指標建模概述
筆者先提出幾個問題作為本文的引子——什么是數據指標?常用的數據指標有哪些?它們是怎么定義的?日常工作中查看這些指標會碰到哪些坑?如何選擇數據指標?選擇數據指標會遇到哪些坑呢?
選好數據指標的常用方法論:
如果老板問到:“剛上線的社區產品,最近表現如何?”
新人產品:“很不錯——日活每天都在漲,新增也很多?!?/p>
資深產品:“現狀堪憂——日活按設備數看一直在漲,但如果按注冊用戶數看并不樂觀。新增用戶轉化成注冊用戶的只有20%,說明我們社區現在還沒有促使用戶注冊的動機?!?/p>
三個月后,老板想知道是否要開始推廣?
新人產品:“最近日活平穩,新增用戶減少,要不要推廣拿不準?!薄憩F平平
資深產品:“最近日活雖然上漲趨勢不大,但:1. 用戶人均發帖量相比剛上線時翻了一番,2. 用戶間的好友密度月環比上漲30%,我覺得社區氛圍已經形成,3. 這個從新用戶次日留存由上個月的35%增長到50%也能得到驗證。因此,認為可以開始大規模推廣?!薄挚孔V
二、認識常見的數據指標
什么是數據指標?即對當前業務有參考價值的統計數據。進一步說明,當前業務+有價值——不是所有的數據都叫指標,與當前業務無關的,也意義不大;可統計——數據不是憑空產生的,不能脫離現實。
舉一個直白的小例子,老板為了提高自己小賣部的營業額搞了促銷活動,為了衡量促銷效果,他首先記錄了一天中小賣部門口的路過人數為3,進店人數為2,購買人數為1,這些即是統計數據(可被觀測、統計、記錄);隨后計算出進店率為67%,購買率為50%,這就是對業務有參考價值的數據(衡量活動是否有效)。
常見的數據指標有哪些?即如何量化“誰干了什么,結果怎樣”這句話,誰——用戶數據,干了什么——行為數據,結果怎樣——業務數據。
1. DAU/MAU
DAU/MAU=Daily/Monthly Active User
1)理解Daily/Monthly
2)理解Active
方法一:數據統計系統的定義
基于事件上報判定活躍:有事件上報->該用戶活躍。
tips:上報可能有坑——假定了事件上報一定來自用戶主動操作;謹防活躍暴增,其他數據并無顯著增加的情況。
預制報表的統計系統(友盟、百度統計、GA、……)都是基于事件上報進行統計,其統計邏輯是:今天上報過事件(->用戶進行了主動操作)->這個用戶是活躍的。
然而有時上報并不說明用戶的真實行為,如手機收到PUSH后上報事件,這屬于后臺回報消息,并非用戶行為。
這個坑的終極來源可能是運營一周前向RD提出需求:“我要統計發下去的PUSH,的指導有多少條PUSH是到達了用戶設備上的,不然無法優化推送轉化?!盧D采用如下解決方案:“我在后臺給你寫一個Service,APP收到PUSH的時候,我就給友盟上報一個事件說我收到了?!?/p>
方法二:業務上的定義
基于關鍵事件上報:用戶執行了關鍵事件->該用戶活躍。
tips:存在維護成本——需不斷維護日活事件列表;存在溝通成本——團隊內外對[活躍]的認知需統一。
這需要制作日活事件列表,定義哪些事件需要上報。比如:
3)理解User
認人:每位注冊用戶一個唯一ID,但未登錄的用戶會被漏掉。
具體操作:給每位用戶一個唯一的專屬ID,只適合強注冊/登錄環境,用戶數=訪問過服務的ID數。
認設備:每臺設備一串唯一標識符,但無法對對應設備背后的用戶。
具體操作:在網頁cookie中買下一段長隨機字符串,作為設備唯一標識符,用戶數=訪問過服務的設備數。
關于到底是認人還是認設備,筆者總結方法如下:
2. 如何定義新增
每個人都在提[新增],每個人嘴里面講的新增其實都不一樣。
- 渠道商:“只要點了你們產品的下載按鈕,就算一次新增了”
- 運營:“總得下載成功了才算吧,而且一個用戶一天最多算一次”
- 產品:“我們按啟動算吧。沒打開APP也算,數據質量太差了”
- RD:“注冊了才叫新增[用戶],否則后臺根本沒這條數據”
所以需要根據具體業務統一[新增的定義]。
1)增——選擇合適地節點,定義[增]
因為渠道商往往強勢,所以在哪個節點結算應該談清楚。
2)新——用適當的方法,判別[新]
- 基于設備:IOS、Android、web各有門道
- 基于賬號關聯:與后臺已有賬號比對匹配
3. 如何理解留存
為什么要看留存,這個表格可以簡明概括留存的作用。
舉例:以7日日留存的三種算法為例來評估某渠道的質量。
算法一:(第七天/第一天)x100%——7日日留存,只關心到特定日的留存情況,避免了其他日數據的干擾。比如比較渠道在Day7的留存情況時,引入Day2~Day7的用戶數據,反而影響判斷。
算法二:(第二天~第七天去重后/第一天)x100%——7日內留存,引入了其他日數據,適用于有固定使用周期,且周期較長的業務。有些時候恰恰需要引入Day2~Day7的數據,比如,有些情況下用戶訪問特別集中(如kfc瘋狂星期四,大量肯德基APP訪問集中在星期三、四),只看Day7來評價,往往不能反映真實情況。此時,關注7日內活躍情況,更能描述渠道質量。
算法三: ( 第七天/第0天)x100%——7日日留存,新增當日為第0日,下一日為1日,使第7日與新增當日對齊,某種程度上能抵消某些星期級別的周期性差異。
同理,當不再以日為統計單位,而是以更長時間周期來統計時,就得到了周留存/月留存,此時可以更好觀察整個大盤。注意,在計算時務必將用戶去重,公式如下:
無論使用哪一種算法,公司內部結合業務特性達成彼此認同時最重要的。
4. 渠道來源怎么看?
關于“用戶從哪兒來的?”這個問題,我們通常可以看渠道來源這一指標解決。在實際工作中,產品經理會通過公司合作的數據機構給出的各類報表查看。在這里筆者簡單總結幾種主要渠道。
不同的網站統計工具與分析工具對網站流量獲取的渠道各有差異,但基本上可分為幾個渠道:
- 直接訪問(Direct)
- 引薦流量(Referral)
- 搜索引擎自然流量(Organic Search)
- 付費搜索流量(Paid Search)
- 社交媒體(Social)
直接訪問(Direct):指的是用戶直接訪問網站,而不是從其他網站或搜索引擎進入。包括但不限于:用戶在地址欄輸入網址訪問網站、從瀏覽器收藏夾訪問、用戶點擊聊天工具里的鏈接如QQ聊天記錄里的鏈接。
引薦流量(Referral):從用戶非搜索引擎與社交網站點擊進入網站。比如友鏈互惠網站、百度貼吧等站外社區論壇。
搜索引擎自然流量(Organic Search):從搜索引擎自然搜索結果鏈接進入網站的流量。區別于Paid Search,自然流量時搜索引擎自然排名結果的鏈接,通俗講就是非競價非付費的搜索引擎排名頁面鏈接。另外值得一提的是,某些有中國特色的搜索引擎如百度,出了提供搜索引擎服務外,也提供很多的內容產品服務比如百度貼吧、百度知道等,從這些非搜索引擎搜索頁面進入的流量并不歸屬于自然流量,而是引薦。
付費搜索(Paid Search):即搜索引擎競價,很多沒有搜索引擎優化資源的網站,短平快的流量獲取方式。在國內,競價流量已經成為眾多網站流量獲取的主要渠道。
社交媒體(Social):社交網站流量在絕大多數國產網站統計工具中并沒有單獨列出來。但是,全球最大的搜索引擎谷歌搜索的排名因素中,社交媒體因素已經占有超過10%的權重,所以也要引起重視。
還有在國內互聯網圈不太提的幾類:Email、展示廣告、其他廣告。另外,許多數據工具如果統計不到用戶的渠道來源,會默認其為直接訪問(Direct)。
5. PV UV 轉化率 訪問深度
PV(Page Views),即次數;UV(Unique Visitors),即人數。然而在衡量完成目標行為的潛力時,通常會用PV/PV表示該頁面引發下一行為的能力;UV/UV表示用戶的行為傾向;PV/UV表示人均行為次數。
1)PV/PV;UV/UV
2)PV/UV
3)訪問深度
算法一:用戶對某些關鍵行為的訪問次數。
算法二:將網站內容/功能分成幾個層級,以用戶本次訪問過最深的一級計算。
6. 訪問時常
1)為何要統計訪問時長
通過統計特殊事件,支持業務需求。比如,記錄暫停/關閉頁面后、播放器中視頻進度條當前的位置,可以統計視頻被消費程度,評價內容質量。
2)如何統計訪問時長
- Web時代,直接統計頁面打開時長(但如果我一直沒關,或是上了個洗手間……)
- APP時代,統計前臺駐留時常(如果我開著APP中途被叫去聊天……)
- 通過瞳孔與注意識別,即攝像頭觀察,瞳孔是否注視屏幕(需要外設和隱私授權……)
總之,采用何種方式統計訪問時長一定要回歸業務本身。
7. 業務相關的數據指標
舉例:小賣部老板想知道,一共賣了多少錢?消費水平怎么樣?來了多少人?有多少人買東西了?有多少人是老顧客?我們的商品好不好賣?……這些涉及總量、人均、付費數、付費率,通常要看業務數據指標。
8 彈出率(Bounce Rate)
通俗理解即,用戶一點開某個頁面就馬上退出,不進行任何下一步操作的比率。一般統計的是整個網站產生的所有會話的彈出率。
本文由 @DarcyAI 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
大部分產品不是缺少數據分析能力,而是缺乏數據分析和洞察的習慣。
覺得您說的很有道理,看來成為能長期管理產品的PM真的是思維要進步哇~
您好,這篇文章的兩個大標題分別為 概述以及認識指標,正文標題表示這篇文章未完待續。不過感謝閱讀??
說了和沒說一樣。停留時長上廁所問題怎么解決呢
網頁一般看幾秒后沒動作了 比如鼠標 焦點之類的
真厲害
看完文章后有點懵懵的,原來數據分析那么難的嗎
作者對數據分析中的指標建模分析得詳細專業,邏輯條理清晰。