埋點(diǎn),數(shù)據(jù)產(chǎn)品經(jīng)理必備的技能!
編輯導(dǎo)語:埋點(diǎn)是數(shù)據(jù)產(chǎn)品經(jīng)理必備的工作技能之一,對于實(shí)際工作十分重要。本文作者介紹了有關(guān)數(shù)據(jù)埋點(diǎn)的相關(guān)內(nèi)容,從數(shù)據(jù)采集的流程、埋點(diǎn)方案的類型和選擇等展開分析,一起來學(xué)習(xí)一下吧,希望對你有幫助。
數(shù)據(jù)是數(shù)據(jù)產(chǎn)品的根基,而埋點(diǎn)是數(shù)據(jù)的起點(diǎn);如果沒有埋點(diǎn),那數(shù)據(jù)產(chǎn)品則是無源之水。
可以說埋點(diǎn)是互聯(lián)網(wǎng)行業(yè)里遇到的關(guān)鍵且無法繞過的問題。
以下是企業(yè)不同位置的同學(xué)內(nèi)心OS:
- 業(yè)務(wù)產(chǎn)品:埋什么,怎么埋?
- 數(shù)據(jù)產(chǎn)品:埋點(diǎn)不規(guī)范,錯(cuò)埋、漏埋;
- 業(yè)務(wù)開發(fā):開發(fā)成本高,不懂?dāng)?shù)據(jù),代碼冗余;
- 數(shù)據(jù)分析:埋點(diǎn)規(guī)則找不到,數(shù)據(jù)分析成本高。
業(yè)務(wù)同學(xué)對于埋點(diǎn)是什么都不知道,也不清楚要埋什么;所以往往會(huì)做了功能但是沒有做埋點(diǎn),在需要進(jìn)行數(shù)據(jù)分析的時(shí)候去找數(shù)據(jù)團(tuán)隊(duì)要數(shù)據(jù),數(shù)據(jù)團(tuán)隊(duì)會(huì)反問:“你們埋點(diǎn)了嗎?”
數(shù)據(jù)產(chǎn)品,因?yàn)樗麄儗τ跇I(yè)務(wù)的認(rèn)知并不深刻,所以經(jīng)常會(huì)出現(xiàn)漏埋、錯(cuò)埋的情況,導(dǎo)致最后無數(shù)可取的結(jié)果。
業(yè)務(wù)開發(fā),本質(zhì)上他們是解決業(yè)務(wù)相關(guān)問題,數(shù)據(jù)開發(fā)對他們來說一個(gè)比較額外的工作,所以他們的開發(fā)成本會(huì)隨著埋點(diǎn)需求而增加,也有可能伴隨項(xiàng)目延期的風(fēng)險(xiǎn);其次過得的埋點(diǎn)開發(fā)需求也會(huì)導(dǎo)致代碼的冗余。
數(shù)據(jù)分析,他們更多地是用數(shù)據(jù),數(shù)據(jù)埋點(diǎn)的規(guī)則找不到,以至于無法很好的通過數(shù)據(jù)驅(qū)動(dòng)進(jìn)行分析。
一、數(shù)據(jù)采集的流程是什么?數(shù)據(jù)從何而來呢
- 瀏覽軌跡:用戶在使用我們的產(chǎn)品時(shí)候,會(huì)在頁面上產(chǎn)生一個(gè)行為路徑、交互的動(dòng)作,比如訪問某個(gè)頁面,點(diǎn)擊某個(gè)商品等等,那這些數(shù)據(jù)的核心來源就是我們的埋點(diǎn)代碼采集相關(guān)行為動(dòng)作;
- 業(yè)務(wù)系統(tǒng):比如訂單交易、數(shù)據(jù)表等,通過數(shù)據(jù)庫同步的方式,將數(shù)據(jù)同步給下游相關(guān)系統(tǒng)進(jìn)行使用;
外部數(shù)據(jù)的交互:比如API數(shù)據(jù)的傳輸、 數(shù)據(jù)文件的傳輸?shù)?;目前某平臺(tái)的大數(shù)據(jù)標(biāo)簽系統(tǒng)就是通過這種方式傳輸補(bǔ)齊企業(yè)的人群標(biāo)簽等。而數(shù)據(jù)產(chǎn)品在整個(gè)數(shù)據(jù)鏈路上來說,基本可以劃分為以下流程:
首先數(shù)據(jù)采集我們要從不同的端采集不同的數(shù)據(jù),然后進(jìn)行數(shù)據(jù)清洗加工處理(ETL),然后匯總到數(shù)據(jù)倉庫中,供用戶分析、用戶畫像、精準(zhǔn)營銷等使用;
我們知道數(shù)據(jù)采集、數(shù)據(jù)埋點(diǎn)的重要性后,在實(shí)際的業(yè)務(wù)功能需求提出的時(shí)候,一定是要提相關(guān)埋點(diǎn)需求的,那在做數(shù)據(jù)采集我們需要遵循怎么樣的流程呢?
- 業(yè)務(wù)方確認(rèn)功能,并發(fā)起埋點(diǎn)需求:提交包括所在頁面、觸發(fā)控件、觸發(fā)場景等;
- 由專門的埋點(diǎn)團(tuán)隊(duì)來進(jìn)行系統(tǒng)校驗(yàn),確保命名規(guī)范、一致性,BI審核埋點(diǎn)申請和統(tǒng)計(jì)需求是否合理缺失等;
- 審核通過后,開發(fā)進(jìn)行埋點(diǎn)采集框架的設(shè)計(jì),開發(fā)埋點(diǎn),完成埋點(diǎn)后進(jìn)行測試;
- 測試預(yù)先編寫能夠覆蓋所有場景的業(yè)務(wù)場景,測試通過更新需求狀態(tài);
- 業(yè)務(wù)驗(yàn)證埋點(diǎn),數(shù)據(jù)開發(fā)和數(shù)據(jù)分析;
以上環(huán)節(jié)缺一不可,只有規(guī)范的流程,才可以在最后的分析中發(fā)現(xiàn)正確的現(xiàn)狀問題。
二、如何選擇埋點(diǎn)方案呢
現(xiàn)在互聯(lián)網(wǎng)行業(yè)主流的埋點(diǎn)方案主要分為四種:
1. 第一種:代碼埋點(diǎn),代碼埋點(diǎn)又分為前端埋點(diǎn)和后端埋點(diǎn);前端埋點(diǎn)是通過前端的代碼埋點(diǎn)來監(jiān)控用戶觸發(fā)某個(gè)頁面的數(shù)據(jù)采集
前端埋點(diǎn)的優(yōu)點(diǎn)很明顯,但是缺點(diǎn)也很明顯,由于前端埋點(diǎn)的數(shù)據(jù)是通過延遲上報(bào)的機(jī)制,比如用戶點(diǎn)擊某個(gè)頁面按鈕它不會(huì)立刻上報(bào),而是累計(jì)到一定的值以后才會(huì)按批上班,受限于當(dāng)前網(wǎng)絡(luò)情況,如果遇到網(wǎng)絡(luò)堵塞等問題就會(huì)數(shù)據(jù)丟包,因此前端埋點(diǎn)丟失率比較高,一般在5%~10%。
而且前端埋點(diǎn)如果有漏埋和錯(cuò)埋的情況,那就要通過app發(fā)版進(jìn)行優(yōu)化,而客戶端發(fā)版就要很久的時(shí)間。
2. 第二種:服務(wù)端埋點(diǎn):在API的接口里植入埋點(diǎn)代碼段
優(yōu)點(diǎn)是在每次用戶觸發(fā)這次請求,都會(huì)觸發(fā)埋點(diǎn)代碼進(jìn)行數(shù)據(jù)統(tǒng)計(jì),所以無需發(fā)版,及時(shí)觸發(fā)及時(shí)更新。
缺點(diǎn)是服務(wù)端埋點(diǎn)需要依賴服務(wù)請求,無法覆蓋所有前端交互,以及對于用戶路徑采集也比較弱。
3. 第三種:全埋點(diǎn);是目前互聯(lián)網(wǎng)做用戶增資的企業(yè)提出的一種埋點(diǎn)思路,通過埋點(diǎn)SDK接入,針對頁面所有的采集頁面元素的瀏覽和點(diǎn)擊行為做統(tǒng)一的收集,不是按次和需求采集,而是提前全部采集
優(yōu)點(diǎn)是開發(fā)成本高,SDK接入后后期維護(hù)成本也低,且埋點(diǎn)流程也很簡單;先采集后定義,在一定程度上能避免漏埋錯(cuò)埋。
缺點(diǎn)是數(shù)據(jù)的冗余,導(dǎo)致很多數(shù)據(jù)并無用處,且數(shù)據(jù)采集范圍僅僅是頁面可見元素,比如像曝光這種就無法采集到;數(shù)據(jù)準(zhǔn)確性也有問題。
4. 第四種:可視化埋點(diǎn);也是接入埋點(diǎn)SDK,但是并不是隨時(shí)隨地采集,而是按需采集,通過可視化圈選觸發(fā)埋點(diǎn)采集
優(yōu)點(diǎn)是操作簡單,且按需埋點(diǎn)不會(huì)采集無效數(shù)據(jù),開發(fā)成本比較低;并且數(shù)據(jù)埋點(diǎn)是可支持撤銷操作的,總體來說比全埋點(diǎn)數(shù)據(jù)量會(huì)小很多。
缺點(diǎn):歷史數(shù)據(jù)是無法恢復(fù)的,因?yàn)樵谖覀內(nèi)x動(dòng)作之前的數(shù)據(jù)是無法進(jìn)行采集的;統(tǒng)計(jì)范圍僅支持頁面前端的動(dòng)作,比如曝光也是無法采集到的。
三、了解各種埋點(diǎn)方案以后,如何在實(shí)際工作中選擇埋點(diǎn)方案呢
選擇埋點(diǎn)方案的參考主要基于三點(diǎn):
- 業(yè)務(wù)發(fā)展階段:開發(fā)投入成本、業(yè)務(wù)迭代速度
- 業(yè)務(wù)屬性:交互應(yīng)用類、業(yè)務(wù)交易類
- 分析深度:用戶行為分析、業(yè)務(wù)分析、業(yè)務(wù)應(yīng)用
比如我們可以根據(jù)業(yè)務(wù)發(fā)展階段來定,比如說現(xiàn)在業(yè)務(wù)發(fā)展較快,版本迭代速度快、開發(fā)投入成本高,那我們做客戶端埋點(diǎn)和服務(wù)端埋點(diǎn)是不太適合的,因?yàn)榭赡軟]過多久版本就更新了,所以全埋點(diǎn)和可視化埋點(diǎn)比較適合;
那對于比較強(qiáng)的業(yè)務(wù)數(shù)據(jù)分析場景來說,需加上前端客戶端埋點(diǎn);以及需要考慮分析深度,如果僅僅是想看用戶前端行為路徑的,那全埋點(diǎn)和可視化埋點(diǎn)就能滿足需求,但是如果分析業(yè)務(wù)全流程那一定是需要配合上代碼埋點(diǎn)。
我是比較推薦全埋點(diǎn)+代碼埋點(diǎn)組合,如何服務(wù)端能做,優(yōu)先服務(wù)端做,這樣數(shù)據(jù)準(zhǔn)確度會(huì)更高。
四、確定埋點(diǎn)選型后,那我們就要開始具體設(shè)計(jì)埋點(diǎn)了
事件是埋點(diǎn)里最核心的要素,如果我們要清晰的定位埋點(diǎn),就要從6個(gè)維度進(jìn)行定義,我們可以總結(jié)為who、when、where、what、why、How;這幾個(gè)元素就構(gòu)建了事件的基本要素。
那對于埋點(diǎn)事件主要可分為三類:
- 交互事件:瀏覽、點(diǎn)擊、收藏、支付、曝光、關(guān)閉;
- 系統(tǒng)事件:APP啟動(dòng)、APP crash;
- 業(yè)務(wù)狀態(tài):支付成功、用戶續(xù)期等(這種強(qiáng)依賴服務(wù)端的返回)。
通過以上我們基本就可以判斷出我們需要記錄用戶什么行為,采集什么數(shù)據(jù),for后續(xù)的什么分析了。
寫在最后,在工作生涯中,過往的坑告訴我,一個(gè)好的埋點(diǎn)管理平臺(tái)是多么的重要。
首先流程線上化,我們往往在一封封埋點(diǎn)的郵件中迷失自我,但是如果是線上申請,那需求申請、處理、接入、驗(yàn)證、測試就非常方便和快捷,規(guī)避信息溝通中的缺失;
其次可以管理規(guī)范,埋點(diǎn)都統(tǒng)一管理,信息集中管理,方便后期的分析和使用;
最重要的是監(jiān)控實(shí)時(shí)化,減少漏埋、錯(cuò)埋的問題。
當(dāng)然如果沒有埋點(diǎn)管理平臺(tái),確定下規(guī)范的埋點(diǎn)流程,選擇適合當(dāng)下業(yè)務(wù)的埋點(diǎn)方案,我相信你也一定也可以做好埋點(diǎn)以及通過數(shù)據(jù)完成豐富的場景分析!
作者:Goodnight;專注用戶、產(chǎn)品等運(yùn)營領(lǐng)域。
本文由 @Goodnight. 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash ,基于 CC0 協(xié)議
【首先數(shù)據(jù)采集我們要從不同的端采集不同的數(shù)據(jù),然后進(jìn)行數(shù)據(jù)清洗加工處理(ETL),然后匯總到數(shù)據(jù)倉庫中,供用戶分析、用戶畫像、精準(zhǔn)營銷等使用】其中“E”就是extract抽取采集的意思,其次數(shù)據(jù)倉庫ODS就是業(yè)務(wù)系統(tǒng)數(shù)據(jù),而不是清洗完才匯集到數(shù)倉哦,這是我個(gè)人的小理解哈
你好,請問本文是否可授權(quán)我們在微信公眾號(hào)轉(zhuǎn)載呢,謝謝,ID是TMarketing~
可以的,煩請標(biāo)注出處和文章末尾我的聯(lián)系方式,thx