為什么要做數(shù)據(jù)埋點(diǎn)?

15 評論 22730 瀏覽 309 收藏 14 分鐘

編輯導(dǎo)語:數(shù)據(jù)埋點(diǎn)是一種常用的數(shù)據(jù)采集方法,在如今這個大數(shù)據(jù)時代,用戶的行為路徑等等都會被記錄,形成用戶畫像,以此進(jìn)行分析;本文作者分享了關(guān)于數(shù)據(jù)埋點(diǎn)的定義以及為什么我們要做數(shù)據(jù)埋點(diǎn),我們一起來了解一下。

產(chǎn)品經(jīng)理小強(qiáng)負(fù)責(zé)的產(chǎn)品,最近上線了“意外險”的保險業(yè)務(wù):用戶在下單時,可選擇購買意外險,若發(fā)生意外事件,造成了損失,可向保險公司理賠。

上線1周后,用戶購買意外險的數(shù)據(jù)遠(yuǎn)低于預(yù)期;領(lǐng)導(dǎo)詢問相關(guān)頁面的瀏覽、點(diǎn)擊和轉(zhuǎn)化數(shù)據(jù),以便通過數(shù)據(jù)分析,找到優(yōu)化方向;小強(qiáng)找到開發(fā),要求導(dǎo)出相關(guān)數(shù)據(jù),卻被告知只有意外險訂單信息;由于缺少該數(shù)據(jù),無法通過漏斗分析計(jì)算轉(zhuǎn)化率,從而找到問題點(diǎn)。

一、缺失的數(shù)據(jù)

用戶在使用產(chǎn)品的過程中,一般會產(chǎn)生兩種類型的數(shù)據(jù):過程數(shù)據(jù)、結(jié)果數(shù)據(jù)。過程數(shù)據(jù)是用戶完成某個目標(biāo)前的操作記錄,結(jié)果數(shù)據(jù)是用戶一系列操作的最后結(jié)果。

在意外險業(yè)務(wù)中,用戶瀏覽保險介紹頁面、勾選購買保險等行為,是用戶操作過程的記錄,屬于過程數(shù)據(jù)。

用戶完成支付,生成保單,是業(yè)務(wù)執(zhí)行的結(jié)果,屬于結(jié)果數(shù)據(jù)。

結(jié)果數(shù)據(jù)是用戶在產(chǎn)品中執(zhí)行某個操作的結(jié)果,當(dāng)用戶要做某個任務(wù)時,需要查看或使用,對功能使用和業(yè)務(wù)的正常開展有直接關(guān)系。

當(dāng)用戶理賠時,必須要查看用戶購買保單信息,作為憑證;產(chǎn)品方需要根據(jù)該數(shù)據(jù),跟保險公司結(jié)算費(fèi)用,或考核業(yè)務(wù)發(fā)展情況。

為了方便調(diào)用,研發(fā)在開發(fā)功能時,一般都會建立業(yè)務(wù)數(shù)據(jù)表,用于存儲結(jié)果數(shù)據(jù);為方便回溯,業(yè)務(wù)數(shù)據(jù)表一般會永久保存,不會定期清除。

一個結(jié)果數(shù)據(jù)的產(chǎn)生,可能有多個操作,產(chǎn)生多條過程數(shù)據(jù);為了滿足存儲所有過程數(shù)據(jù)的額外需求,研發(fā)就需要開發(fā)更多功能,成本大幅增加。

若只保存用戶購買保險的結(jié)果數(shù)據(jù),研發(fā)只需要創(chuàng)建一張保單信息表;但若要保存購買保險的過程數(shù)據(jù),研發(fā)需要創(chuàng)建為“瀏覽保險記錄、勾選購買保險等多個操作,創(chuàng)建多張數(shù)據(jù)表,開發(fā)量增加了很多倍。

相對于只存儲必要的結(jié)果數(shù)據(jù),用業(yè)務(wù)數(shù)據(jù)表保存過程數(shù)據(jù),導(dǎo)致開發(fā)成本大幅增加。因此,大部分過程數(shù)據(jù),都會在開發(fā)時被直接舍棄。

然而,過程數(shù)據(jù)雖不會被接口調(diào)用,也不需要顯示,但過程數(shù)據(jù)依然有很高的分析價值。

通過分析過程數(shù)據(jù),能更好地了解用戶對頁面的瀏覽和功能的使用情況,進(jìn)而找出容易出現(xiàn)用戶流失的環(huán)節(jié),為產(chǎn)品的優(yōu)化和迭代提供重要的決策依據(jù)。

因此,為滿足過程數(shù)據(jù)的分析價值,需要有一個低成本記錄操作過程的方案。

數(shù)據(jù)埋點(diǎn)——就是最常見的解決方案。

二、數(shù)據(jù)埋點(diǎn)的定義

在數(shù)據(jù)分析領(lǐng)域,通常將用戶在產(chǎn)品中的行為稱為事件,如搜索商品、滾動商品列表、瀏覽商品詳情頁、將商品加入購物車、支付訂單。

用戶在產(chǎn)品中的所有行為,都會有相關(guān)的代碼運(yùn)行,如用戶打開了一個頁面,該頁面的代碼就會加載;只要研發(fā)在開發(fā)功能時,為事件植入一段監(jiān)控代碼,當(dāng)事件被觸發(fā)時,讓事件的監(jiān)控代碼同步執(zhí)行,就可以按約定的方式和結(jié)構(gòu),采集該事件的相關(guān)信息,并上報到服務(wù)器。

針對產(chǎn)品需要關(guān)注的特定事件進(jìn)行數(shù)據(jù)采集和上報的解決方案,就是數(shù)據(jù)埋點(diǎn)。

在設(shè)計(jì)數(shù)據(jù)埋點(diǎn)方案時,根據(jù)業(yè)務(wù)和數(shù)據(jù)分析的需要,設(shè)計(jì)需要監(jiān)控的若干個事件,并交由開發(fā)實(shí)現(xiàn);為方便使用和管理埋點(diǎn),每一個事件埋點(diǎn),都會定義一個名稱,稱為“事件名”。

產(chǎn)品想要采集“保險介紹頁曝光”事件的信息,可以讓研發(fā)為該事件植入埋點(diǎn)代碼;當(dāng)該頁面曝光時,埋點(diǎn)代碼就就會同步按要求采集相關(guān)信息,如來源頁面、點(diǎn)擊時間等,并上報服務(wù)器。

三、數(shù)據(jù)埋點(diǎn)的能力

通過植入到對應(yīng)位置的監(jiān)控代碼,我們可以準(zhǔn)確地記錄用戶對應(yīng)行為的相關(guān)信息。這些信息可以用what、who、when、where、how5個單詞來概括。

1. what:什么事件

采集事件的具體內(nèi)容,一般有以下5種類型:

1)曝光

頁面或元素因?yàn)橛脩舻哪硞€行為而被展示出來,如用戶點(diǎn)擊活動鏈接,進(jìn)入活動詳情頁,該頁面就得到了一次曝光。

曝光量可以幫助產(chǎn)品經(jīng)理尋找迭代方向,相對于日曝光量100的頁面,曝光量10w的頁面,有更高的用戶價值或商業(yè)價值,更值得進(jìn)一步優(yōu)化。

2)點(diǎn)擊

用戶點(diǎn)擊了某個元素,如點(diǎn)擊按鈕、鏈接、圖片等。

點(diǎn)擊率(點(diǎn)擊量/曝光量)反映了用戶對元素的興趣,指導(dǎo)產(chǎn)品設(shè)計(jì)人員優(yōu)化低點(diǎn)擊率低內(nèi)容的表達(dá)。

3)啟動

用戶通過各種方式啟動app,如點(diǎn)擊通知欄消息、點(diǎn)擊app圖標(biāo)、多任務(wù)界面。

結(jié)合日活數(shù),計(jì)算出每日人均使用次數(shù)(即平均每個用戶每天打開app的次數(shù),日啟動數(shù)/日活躍用戶數(shù)),可用于評估活動效果。

從某一天開始,每日人均使用次數(shù)從2次增加到4次,而當(dāng)天只上線了一個運(yùn)營活動,沒有其他干擾事件,說明該運(yùn)營活動有效提升了用戶使用頻次。

分析不同時段的啟動次數(shù),得到用戶使用時段分布,即不同時間段內(nèi)的使用次數(shù),如中午12點(diǎn)到13點(diǎn)使用次數(shù)高,凌晨1點(diǎn)到7點(diǎn)使用次數(shù)低。

可用于確定通知最優(yōu)運(yùn)營時間:使用時段分布反映了用戶集中活躍的時間段,在這些時段內(nèi)推送特定的營銷信息或開啟運(yùn)營活動,更容易獲得更多用戶的關(guān)注,從而得到更好的轉(zhuǎn)化效果。

4)退出

用戶退出app,如用戶在雙十一活動詳情頁退出了app。

退出數(shù)據(jù)能定位用戶操作斷點(diǎn),即一個完整的業(yè)務(wù)流程中,用戶在哪些節(jié)點(diǎn)退出app的次數(shù)多;如果能優(yōu)化這些節(jié)點(diǎn),降低退出率,即可提高對應(yīng)流程節(jié)點(diǎn)的轉(zhuǎn)化率,從而更好地達(dá)成業(yè)務(wù)目標(biāo)。

保險購買業(yè)務(wù)上線后,保險購買量很低。分析退出數(shù)據(jù),發(fā)現(xiàn)大量用戶在保險介紹頁退出了app。

經(jīng)調(diào)研確認(rèn),原因是保險介紹頁中的理賠范圍不夠明確,導(dǎo)致用戶失去耐心后直接退出app;重新整理并上線后,保險訂單得到了很大的改善。

5)報錯

app出現(xiàn)了錯誤,如崩潰、閃退等。

報錯數(shù)據(jù)能幫助研發(fā)定位產(chǎn)品漏洞。對環(huán)境的依賴很高的偶發(fā)性報錯,往往很難重現(xiàn);若沒有及時記錄報錯信息,研發(fā)很難定位到問題,最終可能只能選擇暫不修復(fù),不利于改善用戶體驗(yàn);研發(fā)獲得了報錯信息后,能更快定位到問題,大幅提高bug修復(fù)的效率。

新版本上線后,有用戶反饋頻繁閃退,但測試嘗試了所有機(jī)型,都未重現(xiàn);從報錯數(shù)據(jù)中找到該用戶的報錯信息后,研發(fā)很快就找到了原因,并修復(fù)上線。

2. who:哪個用戶

參與事件的用戶是誰,即用戶身份,通常會從人(用戶ID)和設(shè)備(設(shè)備ID)兩個角度,來標(biāo)識用戶身份,即:哪一個用戶,在哪一臺設(shè)備上,參與了該事件。

準(zhǔn)確識別參與事件的用戶身份,有兩個重要價值:

1)統(tǒng)計(jì)去重

在做數(shù)據(jù)分析時,我們不僅想要知道次數(shù),還想知道人數(shù)(即UV),以便計(jì)算功能受眾范圍的大小。通過標(biāo)識用戶身份,我們能準(zhǔn)確判斷多次操作是同一個用戶所為,即可實(shí)現(xiàn)去重。

去重后的用戶量,可用于評估功能影響范圍。用戶量越大,越值得投入資源繼續(xù)優(yōu)化。

兩個相同目的的功能,A的UV只有1000,B的UV是10萬。在團(tuán)隊(duì)資源有限的條件下,B明顯更值得繼續(xù)優(yōu)化。

2)分析留存

留存是指某個周期內(nèi)有使用的用戶,下一個周期依然有使用的用戶數(shù)量;只有準(zhǔn)確標(biāo)識用戶身份,才能實(shí)現(xiàn)留存統(tǒng)計(jì)。

留存是衡量功能黏性的重要指標(biāo),當(dāng)新功能上線時,使用了功能的用戶中,下個周期繼續(xù)使用的用戶量越大,新功能的用戶粘性越高;而用戶黏性高的功能,商業(yè)價值更大。

為提升用戶活躍,以獲得更多的廣告收入,app上線了兩個小游戲;上線第一天均獲得了1000個用戶,7日留存分別是800、100。

很明顯,前者的用戶黏性更好,對廣告收入的貢獻(xiàn)更高。

3. when:發(fā)生時間

事件是什么時候發(fā)生的。一般都統(tǒng)一使用時間戳來表示。

記錄發(fā)生時間,可按周期對數(shù)據(jù)作匯總,統(tǒng)計(jì)某段時間內(nèi)事件發(fā)生的次數(shù),得到時間分布情況,了解用戶的行為習(xí)慣,進(jìn)而在用戶活躍高峰期開展特定的運(yùn)營活動,以提高轉(zhuǎn)化率。

對用戶下單行為的發(fā)生時間按小時進(jìn)行匯總后,發(fā)現(xiàn)用戶8點(diǎn)后開始活躍,12點(diǎn)-14點(diǎn)是高峰,晚上20點(diǎn)到23點(diǎn)是另一個高峰;在這兩個時間段推送活動通知,更容易獲得用戶的關(guān)注,從而更好地達(dá)成活動目標(biāo)。

4. where:發(fā)生地點(diǎn)

事件發(fā)生時,用戶所在的地理位置。如經(jīng)緯度、所在省市區(qū)。

記錄發(fā)生地點(diǎn),可按所在地的行政單位對數(shù)據(jù)作匯總,分析活躍用戶的地區(qū)分布情況;結(jié)合時間周期,可分析出不同地區(qū)的業(yè)務(wù)增長情況,指導(dǎo)運(yùn)營工作方向。

新功能上線后,發(fā)現(xiàn)一線城市的業(yè)務(wù)量遠(yuǎn)超其他線城市,但從最近幾周的數(shù)據(jù)看,三線城市的增幅很高,如投入一定的運(yùn)營資源,可能會獲得更快的增速。

5. how:發(fā)生方式

用戶使用功能的環(huán)境,包括硬件環(huán)境和軟件環(huán)境,如手機(jī)廠商、型號、分辨率、網(wǎng)絡(luò)條件、手機(jī)操作系統(tǒng)、app版本等。

環(huán)境數(shù)據(jù)提供了用戶使用功能的軟硬件條件,幫助我們選擇與環(huán)境匹配的功能實(shí)現(xiàn)方法來開發(fā)功能,更好地滿足用戶需求,提高用戶體驗(yàn)。

若大部分用戶使用的是低配置手機(jī),則應(yīng)該降低客戶端的功能復(fù)雜度,避免運(yùn)行卡頓;反之,則可以在客戶端設(shè)計(jì)更炫酷的交互效果、開發(fā)對手機(jī)性能要求高的功能,讓用戶得到更好的使用效果。

四、總結(jié)

數(shù)據(jù)埋點(diǎn)將有數(shù)據(jù)分析價值、但沒有存儲到業(yè)務(wù)數(shù)據(jù)表的數(shù)據(jù)以日志的形式存儲下;埋點(diǎn)采集到的每一種類型的數(shù)據(jù),對產(chǎn)品設(shè)計(jì)優(yōu)化、迭代方向選擇、業(yè)務(wù)目標(biāo)達(dá)成等有很高的價值。

數(shù)據(jù)埋點(diǎn)是數(shù)據(jù)產(chǎn)生價值的起點(diǎn),值得產(chǎn)品研發(fā)團(tuán)隊(duì)當(dāng)成一個重要工作來推進(jìn)。

#專欄作家#

誓博,微信公眾號:產(chǎn)品慎思錄。人人都是產(chǎn)品經(jīng)理專欄作家。5年產(chǎn)品經(jīng)驗(yàn),電商售后平臺后端產(chǎn)品負(fù)責(zé)人。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 您好!兩個相同目的的功能,A的UV只有1000,B的UV是10萬。在團(tuán)隊(duì)資源有限的條件下,為什么B明顯更值得繼續(xù)優(yōu)化?不應(yīng)該優(yōu)化UV更多的嗎?

    來自廣東 回復(fù)
    1. 因?yàn)锽的用戶價值更大。就像有兩條路,一條只有1個人在走,另一條有100個人在走。既然只有1個人走,那就將就著走吧。另一條有100個人,在路上放個賣水的路邊攤都能提供很多的用戶價值。

      來自廣東 回復(fù)
  2. 對B端產(chǎn)品哪?埋點(diǎn)的意義是什么 大神!

    來自北京 回復(fù)
    1. 本質(zhì)是一樣的。埋點(diǎn)是要以終為始,先想清楚要分析什么,然后再去采集什么,而不是所有的都采集,這樣成本太高了。

      來自廣東 回復(fù)
  3. 你好,請教個問題。購買是個自定義事件,購買的商品類型是屬性。假如用戶一次購買多個類型的商品,是不是一個事件對應(yīng)多個屬性值呀?

    回復(fù)
    1. 是的,屬性值可以是多個值。

      來自廣東 回復(fù)
  4. 寫的很好

    回復(fù)
  5. yyds

    來自上海 回復(fù)
  6. 點(diǎn)贊!對埋點(diǎn)有了清晰認(rèn)識,感謝

    回復(fù)
  7. 小白表示非常的清晰,明了棒

    來自香港 回復(fù)
  8. 說的很對,如果沒有基礎(chǔ)的過程數(shù)據(jù),無法進(jìn)行任何深入的分析,更不用說產(chǎn)品的迭代與改進(jìn)。

    來自浙江 回復(fù)
  9. 對埋點(diǎn)的使用又多了新多認(rèn)識,點(diǎn)贊

    來自廣東 回復(fù)
  10. 收藏!

    來自浙江 回復(fù)
  11. ??!優(yōu)秀

    來自北京 回復(fù)
  12. 贊贊贊。

    來自重慶 回復(fù)