一文了解用戶數(shù)據(jù)分析常見(jiàn)指標(biāo)與原理

4 評(píng)論 5952 瀏覽 49 收藏 17 分鐘

我們要通過(guò)數(shù)據(jù)分析對(duì)業(yè)務(wù)進(jìn)行診斷,找到當(dāng)中的問(wèn)題所在,就需要我們?cè)谑褂脭?shù)據(jù)分析之前,對(duì)其分析指標(biāo)和原理有充足的了解,才能夠應(yīng)對(duì)更多復(fù)雜的問(wèn)題。作者總結(jié)了用戶數(shù)據(jù)分析常見(jiàn)指標(biāo)和原理,與你分享。

本著知其然知其所以然的原則,本篇給大家介紹用戶數(shù)據(jù)分析常見(jiàn)指標(biāo)以及原理。

一、原理

1. HTTP協(xié)議

超文本傳輸協(xié)議(HTTP)是一種通信協(xié)議,指計(jì)算機(jī)通信網(wǎng)絡(luò)中兩臺(tái)計(jì)算機(jī)之間進(jìn)行通信所必須共同遵守的規(guī)定或規(guī)則,我們平時(shí)上網(wǎng)訪問(wèn)某個(gè)網(wǎng)站就是在http協(xié)議支持下進(jìn)行服務(wù)器端和客戶端的數(shù)據(jù)交互。但它是一種無(wú)狀態(tài)的協(xié)議,一旦數(shù)據(jù)交換完畢,客戶端與服務(wù)器端的連接就會(huì)關(guān)閉,再次交換數(shù)據(jù)需要建立新的連接。

通常情況下會(huì)有很多請(qǐng)求同時(shí)向服務(wù)器發(fā)送,那么服務(wù)器怎么才能知道這些請(qǐng)求的歸屬吶,所以就需要會(huì)話跟蹤技術(shù)來(lái)實(shí)現(xiàn)這個(gè)目的,其中cookie&session就是常用的會(huì)話跟蹤技術(shù)之一。

2. 會(huì)話

定義:會(huì)話是用戶在指定的時(shí)間段內(nèi)在網(wǎng)站(APP)上發(fā)生的一系列行為,是由多次http請(qǐng)求完成的。例如,一次會(huì)話可以包含多個(gè)網(wǎng)頁(yè)的瀏覽或者一次社交互動(dòng)或者一次電子交易。

重要性:會(huì)話是行為數(shù)據(jù)記錄的必要維度,會(huì)話的準(zhǔn)確性直接影響對(duì)用戶行為的解讀以及部分關(guān)鍵統(tǒng)計(jì)指標(biāo)的準(zhǔn)確性,例如常用數(shù)據(jù)統(tǒng)計(jì)指標(biāo):使用頻次、使用時(shí)長(zhǎng)、平均使用時(shí)長(zhǎng)、平均交互深度、跳出率、轉(zhuǎn)化分析、用戶路徑等都是依據(jù)會(huì)話統(tǒng)計(jì)的。

例如平均使用時(shí)長(zhǎng)的定義是在一定統(tǒng)計(jì)時(shí)間內(nèi),瀏覽網(wǎng)站的一個(gè)頁(yè)面或整個(gè)網(wǎng)站時(shí)用戶所逗留的總時(shí)間與該頁(yè)面或整個(gè)網(wǎng)站的訪問(wèn)次數(shù)的比。

平均使用時(shí)長(zhǎng)=所有用戶產(chǎn)生的所有會(huì)話總時(shí)長(zhǎng)/所有用戶產(chǎn)生的會(huì)話總數(shù)

平均訪問(wèn)時(shí)長(zhǎng)越久,證明 Web/APP 越有吸引力,如果用戶停留的平均時(shí)間非常低,那么可能內(nèi)容不夠有趣,或界面優(yōu)化較差導(dǎo)致真正有價(jià)值的內(nèi)容無(wú)法吸引用戶,影響用戶體驗(yàn)。

切割原理:

①按照時(shí)間切割:web 產(chǎn)品建議切割時(shí)間為 30 分鐘,所以王小明兩次瀏覽頁(yè)面的時(shí)間超過(guò)了 Web 端的 30 分鐘,被記錄為兩個(gè)會(huì)話。APP 產(chǎn)品建議切割時(shí)間為 1 分鐘,那么就代表著如果用戶在做了某個(gè)行為1 分鐘后沒(méi)有任何其他動(dòng)作,前面的 “會(huì)話” 便會(huì)被 “切割” 并結(jié)束。

②按照事件切割:在某些情況下,我們也可以設(shè)置特定的 “會(huì)話” 開始和結(jié)束事件,一旦用戶做了某個(gè)操作就會(huì)自動(dòng)開始/結(jié)束會(huì)話。例如付款成功、或者發(fā)表內(nèi)容成功。具體的切割規(guī)則應(yīng)該根據(jù)業(yè)務(wù)規(guī)則靈活設(shè)置,不同的數(shù)據(jù)分析工具有不同的 Session 切割規(guī)則。例如諸葛的切割規(guī)則如下:

  • iOS用戶:屏熄、home鍵切到后臺(tái)、殺掉進(jìn)程即判斷為會(huì)話結(jié)束;
  • Android用戶:當(dāng)應(yīng)用重新進(jìn)入活躍狀態(tài)與上次活躍狀態(tài)相隔30秒以上時(shí),會(huì)計(jì)為一次新的會(huì)話;
  • web、小程序:會(huì)話的開始是用戶打開產(chǎn)品的某個(gè)頁(yè)面,如果用戶在30分鐘內(nèi)沒(méi)有任何操作或關(guān)閉頁(yè)面,則會(huì)話結(jié)束。技術(shù)上,諸葛io通過(guò)cookies(小程序通過(guò)storage)追蹤用戶的會(huì)話。

3. 會(huì)話跟蹤

定義:會(huì)話(Session)跟蹤是Web程序中常用的技術(shù),用來(lái)跟蹤用戶的整個(gè)會(huì)話。常用的會(huì)話跟蹤技術(shù)是Cookie與Session

工作原理:客戶端請(qǐng)求服務(wù)器,如果服務(wù)器需要記錄該用戶狀態(tài),檢查這個(gè)客戶端的請(qǐng)求里面是否包含了sessionId。

①如果已包含則說(shuō)明以前已經(jīng)為此客戶端創(chuàng)建過(guò)session,服務(wù)器就按照sessionId把這個(gè)session檢索出來(lái)使用(檢索不到,會(huì)新建一個(gè)),服務(wù)器還可以根據(jù)需要修改Cookie的內(nèi)容,響應(yīng)給客戶端

②如果客戶端請(qǐng)求不包含sessionId,則為此客戶端創(chuàng)建一個(gè)session并且生成一個(gè)與此session相關(guān)聯(lián)的sessionId,把sessionID放在cookie中,使用response返回給客戶端瀏覽器cookie,cookie將被在客戶端保存。

客戶端攜帶sessionid的常見(jiàn)方式:cookie(服務(wù)器生成的,傳給客戶端體積很小的純文本文件)中攜帶sessionID,會(huì)附在請(qǐng)求資源的HTTP請(qǐng)求頭上發(fā)送給服務(wù)器,服務(wù)器通過(guò)相應(yīng)方法獲得該cookie。對(duì)于不支持cookie的手機(jī)瀏覽器,有另一種解決方案:URL地址重寫。URL地址重寫的原理是將該用戶session的id信息重寫到URL地址中,服務(wù)器能夠解析重寫后的URL獲取session的id。這樣即使客戶端不支持cookie,也可以使用session來(lái)記錄用戶狀態(tài)。

cookie:

①會(huì)話cookie:若不設(shè)置過(guò)期時(shí)間,則表示這個(gè)cookie的生命期為瀏覽器會(huì)話期間,關(guān)閉瀏覽器窗口,cookie就消失。這種生命期為瀏覽器會(huì)話期的cookie被稱為會(huì)話cookie。會(huì)話cookie一般不存儲(chǔ)在硬盤上而是保存在內(nèi)存里。

②持久cookie:若設(shè)置了過(guò)期時(shí)間,瀏覽器就會(huì)把cookie保存到硬盤上,關(guān)閉后再次打開瀏覽器,這些cookie仍然有效直到超過(guò)設(shè)定的過(guò)期時(shí)間。存儲(chǔ)在硬盤上的cookie可以在不同的瀏覽器進(jìn)程間共享,這種稱為持久Cookie。如果cookie沒(méi)有失效的前提下,游客身份多次訪問(wèn)會(huì)判斷為同一用戶。

應(yīng)用場(chǎng)景舉例:登錄網(wǎng)站時(shí)用戶第一天輸入用戶名密碼登錄了,第二天再打開很多情況下就直接打開了。因?yàn)榈谝淮蔚卿洉r(shí)就把身份認(rèn)證信息通過(guò)加密的方式保存在了cookie中。

session相當(dāng)于程序在服務(wù)器上建立的一份用戶的檔案,在用戶第一次訪問(wèn)服務(wù)器的時(shí)候自動(dòng)創(chuàng)建,后續(xù)來(lái)訪時(shí)只需要查詢用戶檔案表就可以了。只要用戶繼續(xù)訪問(wèn),服務(wù)器就會(huì)更新Session的最后訪問(wèn)時(shí)間,并維護(hù)該session。為防止內(nèi)存溢出,服務(wù)器會(huì)把長(zhǎng)時(shí)間內(nèi)沒(méi)有活躍的session從內(nèi)存中刪除。這個(gè)時(shí)間就是session的超時(shí)時(shí)間。如果超過(guò)了超時(shí)時(shí)間沒(méi)訪問(wèn)過(guò)服務(wù)器,session就自動(dòng)失效了。后續(xù)用戶再訪問(wèn)時(shí)會(huì)創(chuàng)建一個(gè)新的session。

應(yīng)用場(chǎng)景舉例:一個(gè)未登錄的用戶添加了商品之后客戶端處可以知道添加了哪些商品,而服務(wù)器端如何判別呢,所以也需要存儲(chǔ)一些信息就用到了session。每次用戶添加商品時(shí),都會(huì)根據(jù)cookie和session的對(duì)應(yīng)關(guān)系把該商品添加到session中。如果用戶手動(dòng)清除了cookie,那么購(gòu)物車也會(huì)同步清空。

4. 原理小結(jié)

客戶端和服務(wù)器端通過(guò)http協(xié)議進(jìn)行數(shù)據(jù)傳遞,按照一定的規(guī)則把所有的請(qǐng)求和響應(yīng)分割成一定數(shù)量會(huì)話,通過(guò)會(huì)話能分析出用戶訪問(wèn)網(wǎng)站的頻次、路徑、時(shí)長(zhǎng)等關(guān)鍵信息。因?yàn)閔ttp協(xié)議是無(wú)狀態(tài)的,所以引用會(huì)話跟蹤技術(shù)進(jìn)行不同用戶訪問(wèn)網(wǎng)站完整流程的記錄,其中cookie和seession是常用的會(huì)話跟蹤技術(shù)之一。

cookie是通過(guò)在客戶端記錄信息確定用戶身份的,而session則通過(guò)在服務(wù)器端記錄信息確定用戶身份。

二、用戶數(shù)據(jù)分析常見(jiàn)指標(biāo)

不同業(yè)務(wù)的產(chǎn)品需要關(guān)注的數(shù)據(jù)指標(biāo)有所差異。在這里從用戶角度來(lái)分析從首次使用產(chǎn)品到最后離開產(chǎn)品的整個(gè)流程——新增(首次使用)、活躍(如何使用)、留存(繼續(xù)使用)、流失(不再使用)。

1. 新增(首次使用)

首次使用產(chǎn)品的用戶稱為新增用戶,可以按照不同的屬性進(jìn)行群體的劃分,例如不同性別、不同年齡段、不同地區(qū)的用戶群體。

常用的新增用戶群體為新增實(shí)名用戶和新增匿名用戶。新增實(shí)名用戶指的是新注冊(cè)并在數(shù)據(jù)庫(kù)中生成賬號(hào)的用戶。新增匿名用戶指的是對(duì)比數(shù)據(jù)庫(kù)沒(méi)有出現(xiàn)過(guò)的cookie或者設(shè)備的游客,一般來(lái)說(shuō),JS的新增是只要打開網(wǎng)站就會(huì)記為新增,而app只有下載打開后才會(huì)被記為新增。

新用戶數(shù)量的快速增長(zhǎng),是產(chǎn)品增長(zhǎng)的基礎(chǔ)。通常一個(gè)運(yùn)營(yíng)活動(dòng)上線或者進(jìn)行渠道投放后,會(huì)產(chǎn)生比較多的新增用戶,業(yè)務(wù)會(huì)關(guān)注后續(xù)的日增、周增、月增。

2. 活躍(如何使用)

活躍用戶的定義取決于業(yè)務(wù)本身,登錄、消費(fèi)、瀏覽指定模塊的內(nèi)容、使用時(shí)長(zhǎng)達(dá)到一定的時(shí)間等行為都能成為判斷活躍用戶的標(biāo)準(zhǔn)。只有活躍用戶才有可能會(huì)產(chǎn)品帶來(lái)流量或者營(yíng)收價(jià)值,是投資人關(guān)注的重要指標(biāo)。

活躍用戶的統(tǒng)計(jì)需要去重。例如某款產(chǎn)品把登錄做為活躍用戶的判斷標(biāo)準(zhǔn),在某段時(shí)間內(nèi)使用過(guò)產(chǎn)品的用戶被記錄下來(lái),多次啟用過(guò)產(chǎn)品的不會(huì)重復(fù)計(jì)算。場(chǎng)景舉例:如A公司6月23日~7月4日期間的活躍用戶位1890,那么就是在6月23日~7月4日期間一共有1890人使用過(guò)產(chǎn)品,但是其中340名用戶在此期間使用5次以上,但是記在計(jì)算活躍用戶時(shí)不會(huì)重復(fù)計(jì)算,只會(huì)計(jì)算為1個(gè)。

使用會(huì)話技術(shù)跟進(jìn)用戶的行為路徑,可以統(tǒng)計(jì)更多的數(shù)據(jù)了解用戶對(duì)產(chǎn)品使用情況,從而針對(duì)性地去優(yōu)化產(chǎn)品功能設(shè)計(jì)或者內(nèi)容本身。

  • PV(訪問(wèn)量):即Page View, 即頁(yè)面瀏覽量,用戶每次刷新即被計(jì)算一次。
  • UV(獨(dú)立訪客):即Unique Visitor,訪問(wèn)網(wǎng)站的不同IP地址的訪客數(shù)。在同一天內(nèi),uv只記錄第一次進(jìn)入網(wǎng)站的具有獨(dú)立IP的訪問(wèn)者,在同一天內(nèi)再次訪問(wèn)該網(wǎng)站則不計(jì)數(shù)。
  • 訪問(wèn)次數(shù):產(chǎn)生會(huì)話的次數(shù),會(huì)話時(shí)長(zhǎng)的計(jì)算為同一次訪問(wèn)內(nèi)觸發(fā)的最后一個(gè)事件的時(shí)間減去會(huì)話開始的時(shí)間。
  • 平均使用時(shí)長(zhǎng):會(huì)話的總時(shí)長(zhǎng) / 會(huì)話次數(shù)。
  • 使用時(shí)長(zhǎng)分布:劃分不同的時(shí)間區(qū)間,查看對(duì)應(yīng)區(qū)間的訪問(wèn)人數(shù)情況。
  • 退出率:該網(wǎng)頁(yè)是會(huì)話中“最后一頁(yè)”的瀏覽次數(shù)占該網(wǎng)頁(yè)總瀏覽次數(shù)的百分比。退出率=退出次數(shù)/總訪問(wèn)量*100%
  • 跳出率:該網(wǎng)頁(yè)是會(huì)話中“唯一網(wǎng)頁(yè)”的會(huì)話次數(shù)占由該網(wǎng)頁(yè)開始的所有會(huì)話次數(shù)的百分比。跳出率=會(huì)話的開始和結(jié)束都是該頁(yè)的次數(shù)/會(huì)話的開始是該頁(yè)的次數(shù)*100%

3. 留存(繼續(xù)使用)

留存指的是某種類型的用戶在經(jīng)過(guò)一段時(shí)間后仍舊滿足某種條件或者保持某個(gè)狀態(tài)。常見(jiàn)的留存為新增用戶留存和活躍用戶留存。

新增用戶留存指的是某段時(shí)間內(nèi)的新增用戶,經(jīng)過(guò)一段時(shí)間后,仍然繼續(xù)使用產(chǎn)品被稱為新增留存;這部分用戶占當(dāng)時(shí)新增的比例就是留存率。場(chǎng)景舉例:某產(chǎn)品,1月份新增用戶10000人;2月時(shí)10000人中還有8000人使用產(chǎn)品,則新增留存人數(shù)為8000,新增留存率為80%;3月份10000人中還有7000人使用產(chǎn)品,則新增留存人數(shù)為7000,新增留存率為70%。

活躍用戶留存的定義:某段時(shí)間內(nèi)的活躍用戶,經(jīng)過(guò)一段時(shí)間后,仍然繼續(xù)活躍的用戶被稱為活躍留存;這部分活躍留存用戶占當(dāng)時(shí)活躍用戶的比例就是活躍留存率。場(chǎng)景舉例:某產(chǎn)品,1月份的活躍用戶數(shù)是10萬(wàn)人,2月時(shí)10萬(wàn)人中還有5萬(wàn)人活躍,則活躍留存人數(shù)為5萬(wàn),活躍留存率為50%;3月份,10萬(wàn)人中還有4萬(wàn)人活躍,則活躍留存人數(shù)為4萬(wàn),活躍留存率為40%。

用戶留存率需要較長(zhǎng)的時(shí)間去觀察,所以能更多地反應(yīng)產(chǎn)品體驗(yàn)、用戶需求滿足程度、市場(chǎng)競(jìng)爭(zhēng)力等問(wèn)題。產(chǎn)品的留存率足夠高,新增用戶投入的成本才有價(jià)值,才能促進(jìn)業(yè)務(wù)更好地持續(xù)發(fā)展,是投資人關(guān)注的重要指標(biāo)。

4. 流失(離開)

理論上只要用戶沒(méi)有注銷,就可以認(rèn)為用戶沒(méi)有流失。但實(shí)際上一般會(huì)根據(jù)業(yè)務(wù)情況給定一個(gè)主觀的判斷標(biāo)準(zhǔn),用戶多久沒(méi)有活躍來(lái)判定用戶是否流失。例如3個(gè)月未登錄, 6個(gè)月沒(méi)有消費(fèi)等。對(duì)于流失的用戶,會(huì)定制用戶的召回策略,例如發(fā)優(yōu)惠劵、電話訪問(wèn)溝通、贈(zèng)送會(huì)員等。當(dāng)然有些用戶流失和用戶本來(lái)的生命周期相關(guān),這是無(wú)法避免的。例如考研產(chǎn)品的用戶已經(jīng)考研成功之后便不再使用該產(chǎn)品。

三、用戶數(shù)據(jù)分析小結(jié)

通過(guò)用戶屬性和行為數(shù)據(jù)分析,可以根據(jù)業(yè)務(wù)需求統(tǒng)計(jì)出具有***屬性,新增/活躍于***時(shí)間段,做過(guò)/沒(méi)做過(guò)****的用戶群體,針對(duì)不同特性的群體進(jìn)行針對(duì)性的營(yíng)銷策略從而達(dá)成業(yè)務(wù)目標(biāo)。

目前常見(jiàn)的第三方數(shù)據(jù)分析工具,例如諸葛IO、友盟都支持不同終端的數(shù)據(jù)統(tǒng)計(jì),只需要接入SDK就能自動(dòng)統(tǒng)計(jì)用戶以及行為數(shù)據(jù)。不同的平臺(tái)統(tǒng)計(jì)的數(shù)據(jù)的標(biāo)準(zhǔn)會(huì)稍有差異。對(duì)于精細(xì)化運(yùn)營(yíng)的需求,可以在借助第三方平臺(tái)進(jìn)行精準(zhǔn)化埋點(diǎn)或者在資源的支持下開發(fā)自研數(shù)據(jù)統(tǒng)計(jì)平臺(tái)。

指標(biāo)的是否需要關(guān)注以及指標(biāo)的定義等需要根據(jù)業(yè)務(wù)情況具體分析~好啦,本次分享到此結(jié)束,后續(xù)有機(jī)會(huì)給大家詳細(xì)漏斗模型、歸因模型等常見(jiàn)的數(shù)據(jù)分析模型~

本文由 @Grace 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 一旦數(shù)據(jù)交換完畢,客戶端與服務(wù)器端的連接就會(huì)關(guān)閉,再次交換數(shù)據(jù)需要建立新的連接。
    您好,請(qǐng)問(wèn)如何判斷數(shù)據(jù)交換完畢了?

    來(lái)自廣東 回復(fù)
    1. 我理解是用戶跳出頁(yè)面了 就算

      來(lái)自上海 回復(fù)
  2. 雖然但是,支持一下

    來(lái)自上海 回復(fù)
  3. 有點(diǎn)兒泛

    來(lái)自江蘇 回復(fù)