探尋one piece的埋點之旅:初識埋點,二檔技能開啟
本篇文章主要介紹埋點的基本概念、操作流程,目的是能讓大家對數(shù)據(jù)埋點有個基本的認識。
一、引言
動漫《海賊王》中,曾經(jīng)擁有世界上一切的男人,海賊王哥爾·D·羅杰,在臨行前說:“想要我的財寶嗎,去找吧,我把世界上的一切都放在那里了”。全世界的人們都趨之若鶩奔向大海,尋找one piece,大海賊時代由此開啟!17歲的路飛也遵循了與香克斯的約定,出海航行,立志成為海賊王。
而在2012年初,世界經(jīng)濟論壇發(fā)布的大數(shù)據(jù)和大影響報告指出,大數(shù)據(jù)已成為黃金和貨幣等經(jīng)濟資產(chǎn)。在未來,數(shù)據(jù)將成為商業(yè)競爭最重要的資源,誰能更好的使用了大數(shù)據(jù),誰將領導下一代商業(yè)潮流,大數(shù)據(jù)時代已經(jīng)到來!
期待你與奇數(shù)/草帽小子做一個約定,探尋神奇數(shù)據(jù)中的one piece,成為數(shù)據(jù)產(chǎn)品大牛。
二、數(shù)據(jù)生命周期
想要成為數(shù)據(jù)產(chǎn)品大牛,對數(shù)據(jù)就要了如指掌,那我們先來認識一下數(shù)據(jù)的人生之路吧。數(shù)據(jù)生命周期包含四個階段:數(shù)據(jù)采集、數(shù)據(jù)預處理、數(shù)據(jù)挖掘/分析、數(shù)據(jù)應用。
從數(shù)據(jù)的產(chǎn)生到最后應用,存在著許許多多的知識與技巧,本文主要介紹數(shù)據(jù)產(chǎn)生的方式之一:數(shù)據(jù)采集中的數(shù)據(jù)埋點。
埋點數(shù)據(jù)作為可以記錄用戶行為的數(shù)據(jù),在商業(yè)經(jīng)營中能幫助企業(yè)快速定位分析用戶群體,實現(xiàn)更好的企業(yè)效益,就像是路飛的二檔技能,幫助他在航行過程中乘風破浪。像草帽小子一樣,開啟你的二檔技能吧!
(1)數(shù)據(jù)采集:盡可能細而全的收集初始數(shù)據(jù),便于后期進行數(shù)據(jù)分析與應用
- 埋點行為數(shù)據(jù):通過埋點的方式,采集到的一些行為數(shù)據(jù),如瀏覽、點擊、停留時長等;
- 業(yè)務數(shù)據(jù):伴隨著業(yè)務產(chǎn)生的數(shù)據(jù),核心是生產(chǎn)系統(tǒng)內存儲的業(yè)務表單數(shù)據(jù);
- 日志數(shù)據(jù):一般是web端日志記錄的數(shù)據(jù);
- 外部接入數(shù)據(jù):從第三方獲得的數(shù)據(jù)。
(2)數(shù)據(jù)預處理:對一些不符合標準的數(shù)據(jù)進行清洗、轉換,得到標準數(shù)據(jù)
(3)數(shù)據(jù)挖掘/分析:對預處理后的標準數(shù)據(jù)進行統(tǒng)計學分析,得到數(shù)據(jù)特性或普適規(guī)律
(4)數(shù)據(jù)應用:將數(shù)據(jù)特性或規(guī)律應用于業(yè)務,賦予數(shù)據(jù)業(yè)務價值
三、數(shù)據(jù)埋點
1. 常見問題
在了解完埋點在數(shù)據(jù)生命周期里扮演的角色之后,我們開始探討埋點的滴滴點點吧。在做埋點的過程中,大部分人通常會遇到以下問題:
- 不知道埋點的全生命周期是怎樣的,只有片段概念?
- 如何將業(yè)務需求轉換為數(shù)據(jù)需求?
- 埋點文檔怎么寫?事件、參數(shù)是什么?
- 埋點管理如何進行,管理平臺如何搭建?
- 埋點數(shù)據(jù)如何進行可視化展現(xiàn)?
- 埋點數(shù)據(jù)準確性如何保障?
下面我們先來了解一下埋點的基本概念與生命周期,其他的問題將在后續(xù)幾期的文章中逐一解答,本文不再詳細說明。
2. 埋點概念
數(shù)據(jù)埋點是數(shù)據(jù)采集的一種重要方式,主要用來記錄終端用戶的操作行為,后續(xù)用于進一步優(yōu)化產(chǎn)品以及給運營提供數(shù)據(jù)支撐。
接下來介紹埋點的三種方式:
(1)全埋點
通過加載一段定義好的SDK代碼,前端會自動全量采集全部事件并上報埋點數(shù)據(jù),能夠呈現(xiàn)用戶行為的每一次點擊、每一次跳轉、每一次登錄等全量、實時用戶行為數(shù)據(jù)。
- 優(yōu)勢:簡單、快捷;開發(fā)工作量少;
- 劣勢:數(shù)據(jù)維度單一(如點擊、加載、刷新);數(shù)據(jù)準確性不高;上傳數(shù)據(jù)多,消耗服務器資源多;
- 適用場景:運營階段初期,產(chǎn)品功能相對簡單,主要分析活動頁、著陸頁、關鍵頁面設計體驗。
2010年,百度MP3 團隊做了一個叫作Click Monkey 的產(chǎn)品,只要頁面上嵌入SDK,就可以采集頁面上所有的點擊行為,并可以繪制出用戶點擊的熱力圖,這種方式對于一些探索式的調研還是非常有用的。
到2013 年,國外一家數(shù)據(jù)分析公司Heap Analytics,將這種方式更近一步,將APP 的用戶行為盡可能地全面采集,然后通過界面配置的方式對關鍵行為進行定義,這樣便完成了所謂的“無埋點”的數(shù)據(jù)采集。
(2)代碼埋點
純手動寫代碼,調用埋點SDK的函數(shù),在需要埋點的業(yè)務邏輯功能位置調用接口上報埋點數(shù)據(jù),讓使用者可以方便地設置自定義屬性、自定義事件。
- 優(yōu)勢:按需采集、對數(shù)據(jù)分析更精細化,數(shù)據(jù)采集能力較強,包含服務器、數(shù)據(jù)庫、第三方數(shù)據(jù);
- 劣勢:項目工程量大,開發(fā)成本及溝通成本高;
- 適用場景:運營階段中后期,追求精細化運營,需要進行多維數(shù)據(jù)分析。
在Google Analytics 年代,就已出現(xiàn)代碼埋點。目前,國內的主要第三方數(shù)據(jù)分析服務商,如百度統(tǒng)計、友盟、TalkingData等都提供了這一方案。
(3)可視化埋點
產(chǎn)品及運營可在可視化界面上圈選定義事件,來追蹤用戶行為,相比于手動埋點更新困難,埋點成本高的問題,可視化埋點優(yōu)化了移動運營中數(shù)據(jù)采集的流程,能夠支持產(chǎn)品運營隨時調整埋點,無需再走發(fā)版流程,直接把配置結果推入到前端,數(shù)據(jù)采集流程更簡化,也更方便產(chǎn)品的迭代。
- 優(yōu)勢:開發(fā)工作量少,使用成本低;
- 劣勢:數(shù)據(jù)精準度不高、針對頁面上點擊可見元素、數(shù)據(jù)維度單一(如點擊);
- 適用場景:運營階段初期,頁面簡單,主要分析點擊事件。
國外比較早做可視化的是Mixpanel,國內較早支持可視化埋點的有TalkingData、諸葛IO,2017年騰訊的MTA也宣布支持可視化埋點。
3. 埋點生命周期
如同數(shù)據(jù)的產(chǎn)生與應用存在一個生命周期,埋點從需求提出到質量管理,也有一個完整的生命周期:
埋點的生命周期主要分為以下三個階段:
(1)需求階段:進行需求采集和需求分析,保證埋點滿足核心業(yè)務需求
- 數(shù)據(jù)需求池:對數(shù)據(jù)需求進行整體維護,記錄需求業(yè)務場景、需求內容、提出者、時間等
- 產(chǎn)品信息架構:梳理產(chǎn)品結構,熟悉產(chǎn)品
- 用戶行為路徑:分析用戶路徑,得到核心業(yè)務指標
(2)設計階段:進行埋點版本規(guī)劃和埋點設計
- 埋點版本規(guī)劃:根據(jù)需求優(yōu)先級,分版本上線,快速迭代;
- 埋點文檔:詳細描寫版本記錄、數(shù)據(jù)流程圖、埋點事件等內容;
- 后臺原型設計:埋點管理后臺、數(shù)據(jù)可視化平臺原型。
(3)質量管理階段:保障埋點數(shù)據(jù)的準確及有效
- 數(shù)據(jù)準確性驗證:埋點數(shù)據(jù)的準確性需要及時得到驗證,以保證后續(xù)數(shù)據(jù)質量;
- 數(shù)據(jù)監(jiān)控:定期監(jiān)控埋點數(shù)據(jù)的產(chǎn)生情況;
- 埋點下線:沒有價值、不符合當前需求的埋點進行下線。
四、總結
本篇文章主要介紹埋點的基本概念、操作流程,目的是能讓大家對數(shù)據(jù)埋點有個基本的認識。埋點學習就像路飛打CP9,需要在實戰(zhàn)去訓練,才能在最后戰(zhàn)勝CP9首領路奇。而在這個實戰(zhàn)的過程中,路飛的身價從一億貝利漲到了三億貝利,相信你也能在學習的過程中,像草帽小子一樣身價翻番。
作者:草帽小子;公眾號:一個數(shù)據(jù)人的自留地,wx:luckily304
本文由 @草帽小子 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉載
題圖來自Unsplash,基于CC0協(xié)議
不錯
有個疑問,數(shù)據(jù)的準確性校驗有什么好的方法分享嗎
后續(xù)會寫數(shù)據(jù)質量相關的內容,可以在我的公眾號上看