數(shù)據(jù)產(chǎn)品經(jīng)理:從歸因模型延伸到轉(zhuǎn)化漏斗

9 評(píng)論 15908 瀏覽 119 收藏 14 分鐘

歸因是個(gè)有意思的問題,許多領(lǐng)域都在研究,比如心理學(xué)中就有“基本歸因錯(cuò)誤”(Fundamental Attribution Error,F(xiàn)AE);而廣告和金融領(lǐng)域更是對(duì)歸因進(jìn)行了深入研究,來輔助廣告主和投資人獲得更大的收益,避免損失。

一、歸因問題

在前一篇《數(shù)據(jù)產(chǎn)品經(jīng)理:6大數(shù)據(jù)分析平臺(tái)的“世界觀”》中主要講解了6個(gè)數(shù)據(jù)分析平臺(tái)的數(shù)據(jù)模型,這6個(gè)平臺(tái)都是大家耳熟能詳?shù)模貏e是對(duì)于中小型企業(yè)和團(tuán)隊(duì),在保證數(shù)據(jù)分析效果的同時(shí),能有力的減少創(chuàng)業(yè)初期階段在數(shù)據(jù)上的成本投入。

但在結(jié)尾的地方,我們留下了一個(gè)沒有展開的問題——?dú)w因。

事情是這樣發(fā)生的:

我們使用了LinkedIn經(jīng)典的“魔法數(shù)字”案例,也就是“1周內(nèi)增加5個(gè)社交好友的用戶更容易留存”。

但是這個(gè)結(jié)論是如何的出來的呢?

1周內(nèi)可能發(fā)生很多事情,比如用戶年齡段的改變、地理位置的改變、偏好的改變等等,我們是如何將最終的留存率“歸功于”社交好友數(shù)量的呢?而且這5位社交好友是否同等重要呢?

這就是歸因問題。

歸因的正面作用,它可能是全部數(shù)據(jù)分析要解決的唯一問題——解釋“為什么”,但反面作用,歸因不當(dāng)將會(huì)摧毀整個(gè)分析的可信度。而且,很可能我們從原始數(shù)據(jù)的收集和整理方法中,就已經(jīng)定下了一個(gè)大敗局——終將“潰于蟻穴”。

為了解決這樣的問題,在數(shù)據(jù)平臺(tái)上通常會(huì)提供幾種歸因的方案供客戶選擇:

1. 首次互動(dòng)歸因模型

也就是用戶第一次做某件事,在數(shù)據(jù)中通常表現(xiàn)為時(shí)間最早、順序號(hào)最小等等。當(dāng)然,這是理想情況。在現(xiàn)實(shí)中由于種種原因,我們無法從用戶的最終轉(zhuǎn)化一直向前追溯,直至真實(shí)的“首次互動(dòng)”。遇到這種情況,也就只好采用能追溯到的、并且與業(yè)務(wù)相關(guān)的首次行為了。

比如:在用戶的一次購買轉(zhuǎn)化中,我們可以用訂單號(hào)追蹤;沒有訂單號(hào),可以用賬號(hào);賬號(hào)沒有,可以用訪問會(huì)話(Session ID);會(huì)話沒有,可以用設(shè)備ID;如果實(shí)在是什么都沒有了,那么用戶以前的行為,我們只好當(dāng)它不存在。

2. 最終互動(dòng)歸因模型

也就是用戶最后一次做某件事,對(duì)應(yīng)的在數(shù)據(jù)中就表現(xiàn)為時(shí)間最近、順序號(hào)最大等等。同樣,在最終互動(dòng)中也存在“數(shù)據(jù)問題”——直接訪問流量(Direct Traffic),也就是那些找不到前置行為卻完成了轉(zhuǎn)化的流量。為了排除它們的干擾,有時(shí)也采用最終非直接互動(dòng)歸因

3. 線性歸因模型

也就是平均分。比如前面的LinkedIn的例子,如果用戶添加了5個(gè)社交好友并留存下來,那么前面的5個(gè)社交好友“同等重要”,全都是促成最終結(jié)果的重要因素。

4. 加權(quán)歸因模型

也就是給多個(gè)促成因素分配一定的權(quán)重。

比如:如果用戶從某商城中看了許多商品才下單,在訂單頁點(diǎn)擊了提交按鈕,在支付頁點(diǎn)擊了支付按鈕,在訂單完成頁點(diǎn)擊了查看訂單詳情按鈕。一套動(dòng)作下來,這筆訂單應(yīng)當(dāng)歸功于那個(gè)按鈕呢?

顯然在隨意瀏覽的過程中,點(diǎn)擊行為沒有那么重要。相比之下,后邊的三個(gè)按鈕就重要得多。

那么怎么定權(quán)重呢?前面的線性相當(dāng)于等權(quán),還有時(shí)間衰減模型、U型/W型/Z型模型。這方面文章很多,不再展開。

以上幾種方法是比較簡單易懂的,而且可以想象計(jì)算量與計(jì)算復(fù)雜度都不大。但是對(duì)于歸因這么重要的一件事,只有這些簡單粗暴的辦法么?

當(dāng)然不是。

比如下面這個(gè):

5. 馬爾科夫歸因

這是把用戶的轉(zhuǎn)化行為比作“馬爾科夫鏈”,來計(jì)算各個(gè)狀態(tài)之間的轉(zhuǎn)化概率。簡單來說,就是“明天只與今天有關(guān),而與昨天無關(guān)”。這樣,我們也就可以計(jì)算出用戶轉(zhuǎn)化路徑中的各個(gè)步驟之間的概率,并最終算出權(quán)重。如果我們用這個(gè)權(quán)重來代入前面的加權(quán)歸因,是不是瞬間感覺高大上了么?(如果對(duì)概率論還有印象的同學(xué),可能會(huì)想起一個(gè)十分類似的東西——貝葉斯公式。)

二、歸因模型的選擇

Well,不知道各位小伙伴是什么感覺,反正我每次看到這種“N種方法”的狀況是很頭疼的,究竟怎么選呢?

這是個(gè)問題。

我們?cè)榻B:GrowingIO只提供了兩種歸因模型——首次和最后(在手冊(cè)中“埋點(diǎn)事件”的“歸因方式”一節(jié),參考:https://docs.growingio.com/docs/),而Google Analytics for Firebase則提供了歸因模型。

至于其他沒有“明說”的平臺(tái),為了節(jié)(lan)?。╝i)時(shí)(wan)間(qi),我是沒有驗(yàn)證。

這樣看,似乎不同的平臺(tái)都有自己在模型上的取舍。那是否存在一套通用的模型呢?為什么我們不直接采用看上去就很高大上的馬爾科夫鏈,而還是要用最簡單粗暴的歸因方式呢?

這里主要考量兩個(gè)因素:

1. 業(yè)務(wù)形態(tài)

說是業(yè)務(wù)形態(tài),但其實(shí)是個(gè)比較抽象的概念。落實(shí)到數(shù)據(jù)上,就是我們究竟能拿到什么樣的數(shù)據(jù)。(數(shù)據(jù)內(nèi)容是《數(shù)據(jù)產(chǎn)品經(jīng)理:6大數(shù)據(jù)分析平臺(tái)的“世界觀”》這篇的主題,有興趣的同學(xué)可以翻回去看看)。

第三方平臺(tái)通常以行為分析為重,但與業(yè)務(wù)相關(guān)的數(shù)據(jù)就不那么容易拿到了,比如商品ID、交易金額、支付渠道等等。

因此:即使我們把事件模型收集到的數(shù)據(jù)拼成一個(gè)長長的鏈條,但是除了直接導(dǎo)致最終轉(zhuǎn)化的這個(gè)環(huán)節(jié)以外,前面的環(huán)節(jié)很可能根本沒有上報(bào)業(yè)務(wù)相關(guān)的數(shù)據(jù),或者上報(bào)的信息不完整、不準(zhǔn)確。所以我們可以輕松地追蹤行為,卻不太容易從促成轉(zhuǎn)化的角度追蹤所有相關(guān)的行為,除非詳細(xì)地配置了各種自定義事件。

因此,除非在業(yè)務(wù)形態(tài)(產(chǎn)品形態(tài))上以用戶行為為主(比如短視頻類的瀏覽、點(diǎn)贊、收藏、轉(zhuǎn)發(fā)),否則只好在歸因方面采用相對(duì)簡單的歸因方法。

而企業(yè)內(nèi)部的數(shù)據(jù)則更加貼近自己的核心業(yè)務(wù),可以方便的拿到核心業(yè)務(wù)數(shù)據(jù)。這就適合業(yè)務(wù)形態(tài)(產(chǎn)品形態(tài))比較復(fù)雜的情況了。我們也可以相對(duì)容易地追蹤到促成轉(zhuǎn)化的整個(gè)流程。比如電商中的“逛”就是個(gè)挺難分析的過程,還有金融中的投資行為等等。它們都需要與業(yè)務(wù)數(shù)據(jù)深度結(jié)合進(jìn)行分析,也適合使用相對(duì)復(fù)雜的歸因模型。比如用來分析投資組合的Brinson模型。

2. 計(jì)算量

第二個(gè)要考慮的因素就是計(jì)算量。計(jì)算量主要來源于兩個(gè)方面:數(shù)據(jù)量與計(jì)算復(fù)雜度。

數(shù)據(jù)量比較好理解,典型的數(shù)據(jù)量爆發(fā)場景,就是每每有企業(yè)自豪地宣布日活數(shù)據(jù)、留存數(shù)據(jù)、交易額/交易人數(shù)等數(shù)字的時(shí)候。這些數(shù)字的背后,都是浩如煙海的數(shù)據(jù)內(nèi)容。

那么什么叫計(jì)算復(fù)雜度?這個(gè)概念可繁可簡。比如,我們拿到的數(shù)據(jù)是3和10兩個(gè)數(shù)字,你來體會(huì)一下心算“3×10”與“3的10次方”之間的區(qū)別吧,大概就是這個(gè)感覺。

三、歸因的延伸

前面講到的基本都是歸因模型的直接應(yīng)用,也就是“給轉(zhuǎn)化找原因”。

但是既然我們說了歸因是分析的全部目的也不為過,那么歸因模型也應(yīng)該有一些延伸應(yīng)用。比如看看下面這個(gè)問題:

既然歸因是給轉(zhuǎn)化找原因,而說到轉(zhuǎn)化大家一定會(huì)想起漏斗模型,那么歸因與漏斗之間是什么關(guān)系?還有前面提到的轉(zhuǎn)化路徑,難道不是漏斗么?嗯……我已經(jīng)表達(dá)過對(duì)于N多模型的厭惡之情,所以這幾個(gè)之間的關(guān)系一定要弄明白。

我們從各種數(shù)據(jù)采集中得到的信息是很有限的,它們不會(huì)超過我們預(yù)先能想到要看的那些指標(biāo),包括頁面上元素的曝光、點(diǎn)擊、滑動(dòng)等基本行為,以及與業(yè)務(wù)相關(guān)的發(fā)布內(nèi)容、拍攝視頻、點(diǎn)贊、收藏、下訂單、完成支付等等行為。即使是“無埋點(diǎn)”方案,能夠采集到的內(nèi)容也是預(yù)先設(shè)計(jì)好的,并且是更基礎(chǔ)、更通用的指標(biāo)。

很顯然,這些基本的指標(biāo)決不能跟“用戶行為”劃等號(hào),充其量是用戶行為的子集,并且是很小的一個(gè)子集。這其中有技術(shù)問題,有認(rèn)知問題,有各種各樣的問題。那么用戶行為到底是什么樣的呢?

其實(shí)這個(gè)問題不重要,重要的是,我們究竟關(guān)心哪些行為。這就是漏斗。

在當(dāng)今的分析中,大多數(shù)人會(huì)采使用轉(zhuǎn)化漏斗,來描繪一個(gè)對(duì)于業(yè)務(wù)或產(chǎn)品來說最關(guān)鍵的路徑。用戶在這個(gè)路徑上如何流動(dòng),決定了業(yè)務(wù)或產(chǎn)品是否存在問題、是否還有發(fā)展空間。而這個(gè)轉(zhuǎn)化漏斗背后,則是一個(gè)價(jià)值產(chǎn)生的過程(消費(fèi)、投資、……),或者是用戶的一個(gè)心理過程(學(xué)習(xí)、表達(dá)、……)。

所以雖然都是行為,漏斗與行為軌跡的出發(fā)點(diǎn)就是不同的——漏斗是業(yè)務(wù)或產(chǎn)品的角度,行為軌跡是用戶的角度。兩個(gè)往一起一碰,這就有意思了——我希望用戶趕快買,但是用戶就是轉(zhuǎn)轉(zhuǎn)悠悠的不下單。TA在干什么呢?拼出來一個(gè)行為路徑看看TA到底在干什么。

總結(jié)起來,漏斗是從業(yè)務(wù)或產(chǎn)品自身的形態(tài)出發(fā),在所有用戶可能產(chǎn)生的行為路徑中,尋找出真正重要的節(jié)點(diǎn);而歸因則是將漏斗進(jìn)行橫向拆解,研究促成每一個(gè)節(jié)點(diǎn)的真正原因是什么,以及如何加強(qiáng)。

比如下面這張圖,綠色圓圈才是我們的轉(zhuǎn)化漏斗,與藍(lán)色箭頭則找出了每一段的“直接因素”。當(dāng)然,這畫的是理想情況。如果我們的產(chǎn)品設(shè)計(jì)出現(xiàn)問題了,則會(huì)看到越來越多的用戶經(jīng)過了其他的路徑。

不知道你有沒有這種感覺,面對(duì)表現(xiàn)不佳的漏斗,只能干著急而不知道從何下手。因?yàn)槁┒繁旧砭筒惶邆淇刹僮餍裕ˋctionable),畢竟節(jié)點(diǎn)是你選的,除非你承認(rèn)自己選錯(cuò)了。而行為路徑和歸因則給漏斗模型補(bǔ)上了可操作性。

所以真的有很多模型要學(xué)么?我沒覺得。

這個(gè)話題我們放在下一篇,嘿嘿……

 

本文由 @御豪同學(xué) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 下一篇在哪里??

    回復(fù)
  2. 回復(fù)
  3. 請(qǐng)問下鏈接還有沒有可能更新呀,現(xiàn)在都是404

    來自四川 回復(fù)
    1. 謝謝反饋,已經(jīng)更新鏈接

      來自北京 回復(fù)
  4. 太理論了,看不下去,先Mark下,后面再讀吧,大神微信多少,加下微信吧:neutyz

    來自江蘇 回復(fù)
  5. 現(xiàn)在GrowingIO有線性歸因了~

    來自北京 回復(fù)
  6. 做數(shù)據(jù)產(chǎn)品的需要具備的基本技能都有哪些呢

    來自北京 回復(fù)
  7. “1周內(nèi)增加5個(gè)社交好友的用戶更容易留存”

    來自浙江 回復(fù)
  8. 言簡意賅,牛B

    來自上海 回復(fù)