Adtributor歸因在指標異動分析上的應用探索
如何使用Adtributor算法執行歸因分析,幫助廣告主精確評估各渠道的廣告效果呢?本文將通過實際應用案例展示該算法如何迅速定位銷售異常的根本原因。這不僅能提升廣告的投入產出比,還能為未來的營銷決策提供數據支持。
一、應用場景
在數字營銷領域,歸因分析被廣泛應用于評估不同渠道的廣告投放效果。如一個用戶通過多個渠道接觸到同一品牌的廣告,并在最終決定購買時,歸因分析可以幫助確定每個渠道對用戶購買的貢獻程度。這有助于廣告主更準確地了解哪些渠道的廣告投放更為有效,從而優化未來的廣告投放策略。
簡而言之,歸因分析通過合理地分配用戶行為的“貢獻”到每一個渠道或因素,幫助業務人員更好地理解用戶行為路徑,評估廣告和營銷活動的效果,并據此優化策略,提高轉化率和投資回報率。
二、解決方案
Adtributor算法是微軟研究院于2014年提出的一種多維時間序列異常根因分析方法,在多維度復雜根因的場景下具有良好的可靠性。
算法完整過程包括數據預處理、異常檢測、根因分析和仿真可視化4個步驟,我們主要借鑒了根因分析環節的方法,該環節使用驚奇性和解釋力對指標實際值和預測值之間的差異進行解釋。
1. 解釋力(Explanatory power)
指標的維度的解釋力是該維度指標的變化額度在整體指標變化額度的占比,如下面公式描述,其中Aij為某個維度的真實值、Fij為某個維度的指標的預測值、A為某個指標的真實值、F為某個指標的預測值、i是維度{dim1, dim2 …dim n}, j為維度里的元素{e11, e12, e21, e22 …}。
在實際應用中,我們需要人為確定一個解釋力的閾值,例如如果某個維度的某個元素的解釋力已經超過了40%,我們就覺得這個維度的元素對于整體的變化有很高的解釋力度(可能是導致指標變化的主要因素)。而一個維度可能有多個元素會超過這個閾值,我們就需要將多個元素的解釋力值進行求和得到這個維度對于整體指標的解釋力。
2. 驚奇指標(Surprise)
在進行歸因的時候,我們還面臨一個問題就是排序問題,哪些維度導致的指標波動的差異最大呢?
這個時候就引用了一個驚奇指標,通過預測值的概率分布和真實值的概率分布的差異【Jensen-Shannon (JS) divergence】,來評估維度導致的指標波動的重要程度,這個數值范圍是0~1,越接近0說明預測值和真實值的分布越接近,越接近1說明預測值和真實值的分布差異越大。
計算公式如下:
3. 歸因流程
step1:先把數據提前處理好,預測指標、計算p、q、S、EP這些指標。
step2:循環迭代不同維度按照單個元素的EP閾值篩選維度元素數據,對于EP值和S值進行加和,并將數據寫入結果集合之中。
step3:最后,對于循環之后的結果按照S值排序,并且基于二八原理,剔除維度EP值低于80%的數據,輸出結果。
三、應用案例
以某產品購卡行為為例,一級購買分類包括:(a)套餐 (b)扣款類型 (c)業務區 (d)渠道 (e)A大類 。
其中一級類別可繼續細分,如套餐可細分:(1)連續包月 (2)連續包季 (3)連續包半年 (4)SVIP月卡 (5)SVIP季卡 (6)SVIP半年卡。
當某天卡購買量有異常(通過預測值與真實值誤差來判斷,超過閾值則認為當天卡購買量有異常,如下圖所示:藍色為預測值,綠色為實際值,折線誤差百分比),我們可以利用上文提到的Adtributor歸因來實現異常問題的快速定位。
Adtributor歸因核心代碼如下:
以7月5號購買異常波動為例(在7月5號我們發現卡的購買量t-1真實值與當天的預測值出現顯著差異),我們利用Adtributor歸因在豐景臺數秒內完成異常原因的自動定位(通過歸因,如下圖所示我們可以立即知悉7月5號異動是由扣款渠道的2個因子導致的(周期扣款、立即扣款)。
這樣基于歸因算法,我們很方便完成異常波動的原因分析(即7月5號購買量大幅下滑是由扣款渠道類別下(a)周期扣款(b)立即扣款兩個因子導致),從而可針對這兩個因子調整我們的業務策略。
本文由 @yyandbb415 原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!