路徑分析:如何將用戶的網站行為軌跡可視化呈現?
編輯導語:用戶行為路徑分析是根據用戶在 APP 或網站中的訪問行為,分析用戶在各模塊中跳轉規律與特點,挖掘出用戶的群體特征,進而實現業務指標;本文作者分享了關于用戶路徑的分析,我們一起來了解一下。
“路徑分析,對于理解用戶的流量行為特點,是最直觀、高效的分析方式之一?!?/p>
關于BI分析系統中的各類特殊分析項,很久之前分享過《用戶歸因分析》、《用戶行為漏斗分析》,今天和大家聊聊流量分析中常用的用戶的路徑分析,以及如何在BI系統中產品化。
01?什么是路徑分析
首先,什么是用戶路徑分析呢?
1. 路徑分析的概念
似乎這個從表述上來講,就很容易理解了。其實就是用戶在站內或者App內的不同頁面、不同模塊、不同操作事件之間,流轉來及流轉去的分析。
通過路徑分析,我們可以很好地發現用戶的流轉特點,發現用戶是從哪些環節、哪些頁面流失、或者發生了阻礙,從而有針對性地優化產品,提升業績。
比如,我們發現很多用戶在加購后沒有進行支付,我們就可以通過路徑分析,看看用戶加購后,都去哪里了、發生了什么操作。如此,有可能找到支付率低的原因所在。
2. 和漏斗分析的區別
由于之前分享過《漏斗分析》,那路徑分析和漏斗分析有啥區別呢?
上圖左邊是漏斗分析,右邊是典型的路徑分析。大家有看出差別嗎?
對,漏斗分析是固化了具體的分析過程或者業務環節,然后分析這幾個大的業務環節的轉化;而路徑分析,是固化了用戶的路徑順序,在每個路徑次序中,都包含了各個主要業務環節,因此在每一步中,出現的業務環節很有可能都是類似的。
總而言之,漏斗分析看重的是業務環節之間的留存關系,而路徑分析看重的是用戶在不同業務環節中的順序及流失關系。
理論上講,漏斗分析可以作為路徑分析的一個概況來看。
02?路徑分析的可視化呈現
用戶的路徑分析中,比較常見的可視化呈現,就是?;鶊D。
關于?;鶊D,這里簡單說兩句。其實是因1898年Matthew Henry Phineas Riall Sankey繪制的“蒸汽機的能源效率圖”而聞名,此后便以其名字命名為“桑基圖”。
桑基圖主要是用來顯示流向和數量。最大的特點,就是開始與結束是保持總量守恒的。
比如下面的這個例子,就是桑基圖:
從這個圖里,我們能清晰看出全體用戶是從哪個地方來,經過一步一步的環節后,到了哪里去。
另外一種和?;鶊D比較相似的圖,是和弦圖。如下示例:
和弦圖主要是呈現從一個內容轉移到另外所有內容的情況,呈現不了?;鶊D多層環節的內容,僅僅是一個環節。
03?路徑分析的產品設計
上面講到了路徑分析主要的可視化呈現是桑基圖。其實對于做分析報告而言,有一張恰當的?;鶊D就可以呈現很多信息了。
但產品化和做分析報告不一樣。產品化要滿足的是更豐富的應用場景,實現靈活的交互式分析。這是BI系統中路徑分析的基本要求。
那么關于BI分析系統中的路徑分析模塊,該如何進行產品設計呢?我們看看行業的產品設計。
(1)谷歌分析的路徑分析
下圖是GA的路徑分析模塊:
首先,GA支持節點類型的選擇。用戶可以選擇事件、也可以選擇頁面,并且針對詳細程度、聚合程度進行自定義調整。
其次,點擊某個節點,可以進行更深入的分析。
- 突出顯示途經此處的流量:突出顯示該部分流量在整個流程中產生的所有連接
- 僅查看此細分(僅限維度節點):僅顯示來自該維度/細分的流量
- 查看通過此處的流量:顯示來到該節點或出自該節點的所有連接。在此模式中,可以在路徑中的該節點之前或之后添加其他步驟。
- 群組詳細信息:顯示該節點中組合到一起的元素,如各個網頁或事件。此選項用于查看詳細信息(出站流量、排名靠前的網頁、入站流量、渠道進入次數、渠道退出次數等)。
(2)神策數據的路徑分析
下圖是神策數據的路徑分析模塊:
其實大的邏輯,和GA的?;鶊D沒有本質的區別,細節上,比GA還是會有一些減少。但從體驗上,不得不說還是挺不錯的。起碼比較容易上手。GA可能還是翻譯或者文化不同吧,總需要一個適應的過程。
神策的路徑分析中,支持了多種方式的篩選操作。
這里包括以下:
- 事件范圍的篩選
- 起始事件的確定
- 用戶細分的篩選
- session的時長設置
這些篩選其實能滿足正常分析人員絕大部分的分析訴求了。尤其是session的間隔設置,這個我覺得還是挺驚艷的?;仡^仔細調研一下技術的實現。畢竟session間隔的隨意設置,個人覺得對計算的要求還是很高的。
04?路徑分析的數據邏輯
上面講了很多產品設計側面的內容。很便捷的交互式操作背后,是大量的數據處理邏輯,這里可以簡述一二。
1. 良好的序列數據及會話切割
想象一下,要實現路徑分析,數據該如何處理?
首先,要對所有的行為日志進行會話(session)的劃分。劃分的目的是為了實現區分一次次獨立的行為。通常的劃分方式是,30分鐘或者多久沒有操作,本次會話就結束了。
其次,基于劃分成一段段的會話,進行數據處理和匯總分析。
以作者之前的經驗,在每個session中的事件記錄,會按照時間順序標記序列號。如此可以實現序列的分析。但對于神策分析中的自由設置session間隔是如何實現的,我確實也沒想到。因為正常情況下,session的劃分邏輯是固定的。
2. 數據計算要求較高
通過剛才的示例我們也看到了,在分析過程中,有可能進行各種條件的篩選、各種人群的細分、各種邏輯的設置,這對于計算的要求無疑是很高的。
具體背后的技術架構層的設計,是很重要的內容。
3. 涉及的主要算法
路徑分析的主要算法包括以下幾種:
社會網絡分析方法:也叫鏈接分析,在社會網絡分析方法中,最常見最成熟的一種方法就是中心性分析方法,中心性是對于社會關系網中參與者的著名成都進行度量的標準,與網絡搜索和超鏈接分析有非常緊密的關系
基于序列的關聯分析:又稱序列分析,這種分析方法時在關聯分析的基礎上,進一步考慮了關聯品之間的先后順序,即只分析先后順序的關聯關系。
最樸素的遍歷方法:因為最直觀、最直接、最容易讓人理解,把某個頁面的所有來源以及相應的流量大小整理出來,同時把瀏覽該頁面的下一個頁面的所有去向和相應的流量整理出來
關于路徑分析,今天先分享到這里吧。
本文由 @首席數據科學家 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
只能路徑分析真的很棒