聚焦用戶的追蹤與分析——跨屏追蹤

0 評論 6020 瀏覽 3 收藏 16 分鐘

小編按:隨著用戶手持移動設備的增多,基于cookie的網站用戶分析已經逐步彰顯弊端(太依賴瀏覽器,被插件影響,本文作者分析了熱門的跨屏用戶追蹤手段以及原理。跨平臺用戶追蹤,不再是心病。

1,我們為什么需要跨屏追蹤?

在開始談論跨屏分析的重要性和價值之前,我們先來簡單的回顧一些背景信息。這就是我們的網站分析工具是如何來定義,區分和計算唯一身份訪問者?下面我們逐一來回顧下這些基礎知識。

訪問者定義

網站分析工具依靠IP或Cookie來定義訪問者。一個IP地址或一個Cookie就代表一個訪問者。早期的日志分析工具依靠IP地址,但由于存在多個人公用一個IP地址的情況,例如網吧,或者學校機房等等。因此現在大部分的網站分析工具都是以Cookie來定義訪問者。Cookie是存儲在訪問者瀏覽器中的一個文本文件,用來記錄訪問者的身份信息。當然也有一些分析工具可以進行定制,當訪問者瀏覽器禁用Cookie時通過IP地址繼續定義并追蹤訪問者。

訪問者區分

用于定義訪問者的Cookie中有一串唯一的數字,這串唯一的數字就是訪問者的ID。訪問者ID會在訪問者每次訪問網站或瀏覽頁面時跟隨其他指標一起返回網站分析工具的服務器。網站分析工具通過這串Cookie中的唯一數字ID來區分訪問者的身份。如果發現多條日志中的訪問者ID都相同,則判斷這些訪問或頁面瀏覽行為來自同一個訪問者。

唯一身份訪問者的計算方法

網站分析工具對于訪問者采取排重的計算方法。換句話來說網站分析工具提供的是唯一身份訪問者數據。以下三個測試可以說明網站分析工具是如何對訪問者進行排重計算的。

測試1,按時間維度對訪問者進行排重。

將一周內網站訪問者的數據按天分別取出進行匯總,并與網站分析工具提供的一周匯總訪問者數據進行對比,你會發現以天作為維度的訪問者匯總數據要大于以周作為維度的訪問者數據。原因很簡單,一個訪問者連續一周7天都訪問了你的網站。這時以天作為維度,每一天中這個訪問者都是唯一的。按天匯總的訪問者數據為7。而以周作為維度,在這7天中只有1個唯一訪問者,到訪過網站7次。從數據準確性的角度考慮,排重后的訪問者數據更為準確。

測試2,按來源維度對訪問者進行排重。

按來源維度對訪問者進行排除與前面按時間維度進行排除的例子相似,將不同來源維度的訪問者數據分布取出進行匯總,并與同一個時間段的網站訪問者數據進行對比,你會發現按來源匯總的訪問者數據要大于網站的訪問者數據。因為同一個訪問者在一段時間內可能會通過多個不同的渠道或媒體到訪你的網站。如果僅從渠道或媒體維度來看,這個訪問者是唯一的。但擴大視角從網站的維度來看,無論訪問者的來源渠道有幾個,唯一身份的訪問者都只有1個。

測試3,按內容或頁面對訪問者進行排重。

除了按時間和來源對訪問者進行排重以外,還有一個在數據統計中最容易被誤解的方法,就是按網站的頁面對訪問者進行排重。這類排重的方法與前面的兩類測試非常相似,只不過將時間維度和來源維度替換為了網站頁面。因此,如果你將訪問每一頁或每個頻道的訪問者單獨取出并進行匯總,那么這個數據會明顯大于網站維度下的訪問者數量。因為一個訪問者可能看過多個頻道或頁面,從每個頻道或頁面的維度來說,這個訪問者都是唯一的,但從網站這個更高一級的維度看來,只有一個唯一的訪問者。

啰嗦到這里你可能已經發現了,為了保證唯一身份訪問者的數據準確,網站分析工具會從整個網站的維度對訪問者進行排重計算。而這一切的前提都是網站分析工具能夠在不同維度下識別并區分出這個訪問者。但在實際的訪問場景中,有一些維度網站分析工具沒有辦法進行排重操作。例如不同的瀏覽器,和不同的終端設備。因為網站分析工具賴以定義訪問者的ID存儲在Cookie中,而Cookie是基于瀏覽器端的。換句話說就是訪問者在不同的瀏覽器或設備中會擁有不同的訪問者ID。這就導致了網站分析工具沒有辦法在瀏覽器和設備維度下對訪問者進行排重。

從技術和指標計算的角度來看,跨屏追蹤的這個新功能的主要作用就是用來在不同瀏覽器及設備間精確定義和識別訪問者,并對訪問者進行跨屏幕,跨設備的識別和排重。使我們獲得的唯一身份訪問者數據更加精確。

2,跨屏追蹤的原理與實施方法

目前大部分網站分析工具實現跨屏追蹤的原理大致相同,都是通過訪問者的唯一身份標識在不同的設備間定義和識別訪問者。然后在服務器端按照唯一身份對訪問者使用的設備,訪問行為進行排除和匯總處理。但在跨屏追蹤中,這個唯一身份標識不再來自于Cookie中的訪問者ID。而是依賴于訪問者在網站中的唯一身份標識。換句話說,網站分析工具把跨屏幕跨設備識別用戶唯一身份的工作交給了網站。而這個唯一身份標識,通常也就是訪問者的登陸賬號。當訪問者在網站中完成登陸操作后,就會以此作為訪問者的唯一身份ID。

kua2

以Universal Analytics為例,如果要對訪問者進行跨屏追蹤,需要在全局代碼中添加一行代碼用于獲取這個訪問者在網站中的唯一身份ID。并將這個ID返回給Google分析服務器。進行后續的排重和匯總處理。

ga('set', '&uid', '訪問者唯一身份標識');

我們以bluewhale_test作為訪問者唯一身份標識為例。這段代碼在你的頁面全局代碼中應該是下面的樣子。

<script>
  (function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){
  (i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),
  m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)
  })(window,document,'script','//www.google-analytics.com/analytics.js','ga');

  ga('create', 'UA-12347890-11', 'bluewhale.cc');
  ga('set', '&uid', 'bluewhale_test');
  ga('send', 'pageview');
</script>

當代碼被執行,我們可以發現和驗證兩件事情,第一,訪問者被成功的賦予了唯一身份標識后,我們可以在返回數據中看到本次的訪問和頁面瀏覽行為屬于用戶bluewhale_test。第二,這個訪問者唯一身份標識并沒有存儲在Cookie中,而是直接發送到Google分析的服務器。

kua3

當這個訪問者在其他設備登陸網站時,我們也將同樣為他賦予bluewhale_test的標識。這樣在服務器端我們就可以對這個訪問者進行識別,并將他在不同設備間的訪問行為進行歸并計算,以實現跨越屏幕和終端的訪問者追蹤。但這里有個問題,就是訪問者必須完成登陸操作才可以被標識。如果訪問者僅僅到訪網站而沒有完成登陸操作呢?這里我們介紹跨屏追蹤的一個加強版,webtrekk中以唯一身份ID+cookie的標識方法來解決未登錄的用戶標記問題。

3,Webtrekk增強版跨屏追蹤

當一個訪問者在網站進行了注冊或者登陸操作,那么webtrekk系統會將訪問者的用戶名作為唯一身份訪問者ID對訪問者進行標識。這和之前介紹的方法和流程沒有區別。但webtrekk在后臺還會做一件事情,就是將當前訪問者的唯一身份ID與他cookie中的訪問者ID進行關聯。那么在不刪除Cookie的情況下,下次這位訪問者到訪網站時無論是否進行登陸操作,webtrekk都能再次識別出他,并且將他與之前的歷史行為進行關聯。

kua4

上面的圖表清晰展示了這個過程。當這名訪客登錄后,webtrekk將cookie中的訪問者ID與URM的唯一身份ID進行關聯。URM唯一身份ID用來識別用戶,基于cookie的不同訪問者客ID就會賦予到唯一身份ID中。如果任何一個唯一身份ID發送到Webtrekk,相關的cookie訪問者ID也會添加到其中。URM唯一身份ID只在第一次關聯(綠色箭頭)的時候用到。之后,關聯機制便獨立于URM唯一身份ID(灰色箭頭)。這樣當訪問者不再進行登陸操作時,我們也能根據之前建立起來的關聯關系對訪問者進行識別。

4,跨屏報告概覽及指標的變化

使用跨屏追蹤功能后,我們可以在網站分析工具的報告中看到更精確的訪問者數據和訪問者在不同終端設備間的使用路徑。下面我們分別以Universal Analytics的跨設備報告和webtrekk的跨屏報告為例,來看下工具是如何計算訪問者數量和呈現終端設備路徑的。

第一個是Universal Analytics跨設備報告中的設備路徑報告。在這個報告中我們可以看到兩個重要的信息。第一個信息是設備路徑。這里顯示了訪問者先后分別通過兩個不同的設備訪問網站,分別是Desktop和Mobile。第二個信息是用戶數和會話數。在沒有使用跨屏追蹤功能時,會被記錄為兩個訪問者和3次會話。而在使用跨屏追蹤后,通過跨設備排除只顯示了1個用戶和三次會話。數據更加準確。

kua9

第二個是Webtrekk的跨屏報告。通過這個報告我們可以發現每一個唯一身份訪問者在不同時間中對不同設備的使用情況和順序。這比之前Universal Analytics報告中的提供的內容要更加豐富和詳細。
kua9

5,跨屏追蹤從業務上解決了哪些問題?

?前面我們一直都在從技術角度介紹跨屏追蹤功能的作用。但他最大的價值還是體現在業務層面。下面我們分別從網站主,網站分析工具和廣告主三個不同的角色出發,來看下跨屏追蹤在業務上解決了哪些問題。

網站主角色:

kuai6

從網站主的角度來看,跨屏追蹤最大的價值是可以精準的定位和追蹤人的數據,而不是瀏覽器的數據。訪問者的數據不再是割裂在不同瀏覽器和設備間的數據孤島。我們可以有效的將訪問者在不同設備間的訪問行為進行關聯,并獲得完整的訪問行為和設備路徑。

網站分析工具角度:

從網站分析工具角度來看,跨屏追蹤非常有希望擺脫依賴Cookie來定位和獲取訪問者數據。Cookie一直都是網站分析工具獲取訪問者行為中的重要一環,但這一環又是如此的脆弱。訪問者,瀏覽器,和各種插件都會對Cookie以及數據的準確性造成影響。而現在,網站分析工具已經在改變方法,減少對Cookie的依賴,將大部分的數據記錄和匹配工作轉移到服務器端來進行。目前唯一還需要用Cookie來記錄的就是訪問者的身份ID。而通過跨屏追蹤功能的普及,大部分訪問者都會被網站進行標記。這將大大減少Cookie被刪除造成的數據準確性問題。

廣告主角度:

最后,還需要從廣告主角度來看一下跨屏追蹤的價值。我們不知道網站分析工具所獲得的數據和信息是否會被用于精準廣告投放。但從廣告主角度來看,更精準的唯一身份訪問者以及跨設備的長期訪問歷史行為數據對于精準廣告投放來說確實是非常有價值的。

來源:藍鯨

 

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!