通過層次分析法(AHP),建立電商用戶綜合評分模型

22 評論 43270 瀏覽 267 收藏 14 分鐘

文章主要介紹了如何利用層次分析法建立電商用戶綜合評分模型,希望能夠?qū)δ阌兴鶐椭?/p>

層次分析法(Analytic Hierarchy Process,簡稱AHP)定義:是將與決策總是有關的元素分解成目標、準則、方案等層次,在此基礎之上進行定性和定量分析的決策方法。關于層次分析法的具體解釋大家可以使用搜索引擎搜索,篇幅有限,我們暫不展開。

一. 用戶綜合評分模型建立

1.從短期和中長期兩個角度考慮用戶綜合評分模型

現(xiàn)實場景:一個用戶經(jīng)常光顧你的網(wǎng)站,有時只是來看看,有時候順便買點東西,在計算這個用戶的價值的時候,應該怎么做?是看TA最近一次購買行為,還是考慮用戶在整個時間段內(nèi)的表現(xiàn)?老祖宗早就告訴我們了,“日久見人心”。顯然,用戶行為錯綜復雜,一次網(wǎng)站會話行為可能只是管中窺豹,觀察期留的長一些,才能建立更合理的評分模型。

本文的目旨在電商網(wǎng)站的用戶建立起一個評分模型,動態(tài)計算出每個User的價值得分。我們從目標-用戶評分出發(fā),綜合短期和中長期兩個角度抽象出影響用戶得分的因素作為準則層,然后選擇準則層相應的指標層數(shù)據(jù),建立一套科學的評分模型。

從短期來看,我們會關注用戶活躍在在網(wǎng)站/APP上發(fā)生的一系列細致動作,瀏覽重點頁面,點擊預購等。因此,我們將影響目標層用戶得分的第一個因素稱之為“活躍度”。從中長期角度來看,用戶的“忠誠度”和“購買能力”對用戶得分影響至關重要。至此,我們確定了目標層為“用戶價值得分”,影響目標層的準則層包含“活躍度”,“忠誠度”和“購買能力”。

2.用戶綜合評分指標選擇

準則層確定后,就涉及到選擇衡量“活躍度”,“忠誠度”和“購買能力”關鍵指標。有幾個重要的原則可以參考:

  • 可量化能被衡量的,才能被改進,目前電商網(wǎng)站大多通過JS,SDK埋點或者服務器日志分析,所以基本的量化數(shù)據(jù)能夠拿到;
  • 有效性要覆蓋重要的數(shù)據(jù)維度,且在合理可以調(diào)控的范圍內(nèi);
  • 相互獨立指標間盡量保持不相關。

筆者和團隊小伙伴共同討論了一下,選定的適合我司電商用戶的指標內(nèi)容如下:

  • 瀏覽頁面數(shù)
  • 停留時間
  • 瀏覽商品數(shù)
  • 主動下單數(shù):一些真正購買前的微轉(zhuǎn)化,如點擊“立即購買”,“立即開團”按鈕等動作
  • 最近訪問時間
  • 用戶訪問頻率
  • 主動評價數(shù)?
  • 單次最高購買金額
  • 平均每次購買金額
  • 購買次數(shù)

3.適合于電商網(wǎng)站的用戶綜合評分模型

時間選擇上,我們選擇先選取近3個月的用戶行為數(shù)據(jù)進行研究,因此“活躍度”對應的時間是“近三個月最后一次活躍的時候,即最近1天”,“忠誠度”和“購買能力”看的是“最近3個月”這個中長期時間段。實際業(yè)務中,按照已有的規(guī)則建立好數(shù)據(jù)表,每一天的數(shù)據(jù)自動入庫,用戶的評分是呈現(xiàn)隨日期滑窗積累的效果,因此我們前面提到的是動態(tài)計算用戶得分。至此,我們的用戶綜合評分模型如下:

二. 層次分析法(AHP)確定權(quán)重

目前,市面上可以搜到很多解決層次分析問題的軟件,但是筆主認為思維比工具更重要,因此本文采用大家電腦里都有的Excel來解決這個問題,這樣我們能把主要精力集中在實現(xiàn)方法上,而不是工具操作上。在用Excel實現(xiàn)AHP方法的時候,有兩個重要問題需要解決:

構(gòu)造判斷矩陣:常見方法是小組投票,給出兩兩因素(例如A和B)間的比較值,1表示:A和B一樣重要;3表示:A比B重要一些;5表示:A比B重要;7表示:A比B重要的多;9表示:A比B極其重要。這樣,通過兩兩比較給出比較值,判斷矩陣就出來了。如下圖:可以看到“活躍度”,“忠誠度”和“購買能力”的判斷矩陣

一致性檢驗:什么是一致性檢驗?舉個例子,當兩兩比較認為A比B重要,B比C重要時,輪到A和C比較了,你給出C比A重要的比較值,此時就叫做“不一致”。層次分析法的計算不是簡單得到一個結(jié)果,而是要得到一個令人滿意的一致性的結(jié)果。

一致性的檢驗是通過計算一致性比例CR 來進行,其中CR=CI/RI,當CR<=0.1 時,認為判斷矩陣的一致性是可以接受的,否則應對判斷矩陣作適當修正,甚至推倒重做。

另外,公式中另外兩個參數(shù)CI是一致性指標,RI是隨機一致性指標,通過查表可以找到三階矩陣的RI=0.5149,四階矩陣的RI=0.8931。

這部分是數(shù)學知識,大家理解文章后可以直接拿來用,我們后面直接以下圖“準則層”為例,闡述如何用Excel構(gòu)建判斷矩陣及單排序和一致性檢驗,想了解更多的,可以搜索引擎搜索一下。

  • 判斷矩陣構(gòu)造:對角線上表示“活躍度”比“活躍度”,“忠誠度”比“忠誠度”,“購買能力”比“購買能力”,因此全部值都是“1”,然后左下角,將團隊投票的兩兩比較值填入,右上角做倒數(shù)映射即可;
  • 按行相乘:F6=PRODUCT(C6:E6),下拉
  • 開n次方:G6==POWER(F6,1/3),下拉,而G9=SUM(G6:G8)
  • 權(quán)重Wi: H6=G6/$G$9,下拉
  • 分向量AWi:I6==C6*$H$6+D6*$H$7+E6*$H$8
  • AWi/Wi =I6/H6,而J9=AVERAGE(J6:J8)
  • CI=(人-n)(n-1) , 這里面“人”其實是希臘字母“蘭姆達”,其實就是J9單元格的數(shù)字,我打不出這個字母,希望你們understand 我,謝謝!n代表變量數(shù),準則層的n=3,經(jīng)過計算CI=0
  • 三階矩陣RI=0.5149
  • CR=CI/RI=0

至此,我們構(gòu)造的判斷矩陣,一致性檢驗通過。紅色標記的Wi即為相應的權(quán)重,即準則層相對目標層有如下公式:用戶價值得分=0.4*活躍度 + 0.4*忠誠度 + 0.2*購買能力。

指標層相應的判斷矩陣及單排序和一致性檢驗如下圖,請大家參考。

三. 指標數(shù)據(jù)標準化

我們前面選定了每個準則層對應可以量化的指標,這些指標的數(shù)量值和單位不盡相同,我們需要將其采用同一種計量方法,這樣才能進行比較。我們本次采用的是5分制,即要把所有的指標數(shù)據(jù),不管是“瀏覽頁面數(shù)”,“停留時間”,還是“單次最高購買金額”,都標準化到[0,5]。

如下圖,我們拉取最近個月的用戶數(shù)據(jù),通過對原始數(shù)據(jù)進行分析,最后建立的標準化規(guī)則,不同網(wǎng)站/APP的具體標準化規(guī)則可能不同,需要依據(jù)原始數(shù)據(jù)來定。

  • 第一行{0,1,2,3,4,5}表示標準化得分,即要把所有的指標數(shù)據(jù)映射到數(shù)據(jù)集里
  • 黃色行表示實際原始數(shù)值
  • 灰色字體行表示累計占比

以“瀏覽頁面數(shù)”為例,首先拉取近三個月的原始數(shù)據(jù),選擇用戶“最近1天”的在網(wǎng)站/APP上的活躍數(shù)據(jù),如下圖所示,左列表示用戶id,右側(cè)表示每個id在“最近1天”瀏覽的頁面數(shù)。其次,按照PV進行從小到大的升序排列。第三,做截止到XXX-id為止的用戶累計占比。因為是5分制,因此,理論上,找到累計占比約為“20%,30%,60%,80%”的,把相應的PV作為標準化后“1,2,3,4”數(shù)值的分割點即可。

有一點需要提醒,要盡可能保持原始數(shù)據(jù)被均勻標準化到[0,5],但是有的指標起點就非常高,比如“瀏覽商品數(shù)”指標,50.7%的用戶沒有瀏覽商品,那么接下來就要盡量在50%-100%之間均勻標準化。具體標準化過程,大家可以在實踐中自己體會。

四. 數(shù)據(jù)結(jié)果和驗證

前面工作順利的話,應該會有如下圖所示的一張表,以“客戶ID”作維度,顯示每一個客戶對應“指標原始數(shù)據(jù)”,“準則層得分”以及“目標層得分”的數(shù)據(jù)。

我們使用tableau制圖,進行數(shù)據(jù)分布的驗證。如下圖,當準則層,指標層權(quán)重系數(shù)確定,當指標標準化完成后,電商用戶的價值得分出現(xiàn)如圖所示的完美長尾分布。實際過程,從確定權(quán)重,要指標標準化這個過程,筆者和團隊小伙伴進行了多次調(diào)參,和多次推到重做。所以,如果大家借鑒本文做其它平臺用戶綜合評分模型,一定要有耐心。

Tableau圖表中,我們用數(shù)據(jù)桶表示最終得分,縱坐標表示客戶ID不重復計數(shù),橫坐標是標準化后的得分,橫坐標為0.0的數(shù)據(jù)桶解讀為“得分在[0,0.2)的客戶占比為0.2%”,橫坐標為0.2的數(shù)據(jù)桶解讀為“得分在[0.2,0.4)的客戶占比為16.64%”,依次類推。

五. 應用場景和意義

由于本文重點是給大家介紹建立電商用戶綜合評分模型的方法,針對應用場景和意義,筆者僅做拋磚引玉,歡迎大家主動思考,以及評論,同筆者交流。

  • 首先,根據(jù)上一部分用戶最終得分分布圖,可以找到高價值用戶(比如定義得分大于3分的用戶),極低價值用戶(比如定義得分小于0.2的用戶)等等,不同類別的用戶,做針對性的營銷,甚至一對一的溝通和客戶管理。
  • 第二,目標層由指標層決定,我們用“活躍度”,“忠誠度”和“購買能力”三個維度,每個維度以中位數(shù)為分界線,得到2*2*2八大類用戶集合。如下圖所示為使用Tableau繪制的八大類用戶占比情況。然后根據(jù)不同準則層的表現(xiàn)制定不同的溝通策略。

 

如下圖為不同用戶的溝通策略。

感謝閱讀我在《人人都是產(chǎn)品經(jīng)理》上的第一篇文章,希望和各位多交流,以及得到大家的肯定和鼓勵,感謝!

 

本文由 @?sharon 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自PEXELS,基于CC0協(xié)議

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 感謝樓主!
    “找到累計占比約為“20%,30%,60%,80%”,應該是“20%,40%,60%,80%”

    來自浙江 回復
  2. 你好,請問如果是百分制的話,指標數(shù)據(jù)的標準化也是用同樣的方法嗎?

    來自上海 回復
  3. 您好,請問下20%40%60%80%,這個是按照人數(shù)均分嗎?
    如果樣本數(shù)據(jù)呈現(xiàn)長尾,不是正態(tài)分布形式:例如:消費,最近一年消費情況,消費0單的占了70%,消費1單的人數(shù)占了20%,剩余的人數(shù)占了10%,那怎么將他們均分20%40%60%80%?
    比如按照文章提供的思路:0單的70%人數(shù)(分數(shù)=0),消費1單(分數(shù)=1) 好像就沒辦法人數(shù)均分了。

    我現(xiàn)在的思路是,將消費人數(shù)進行l(wèi)og化,log化之后消費人數(shù),通過系統(tǒng)聚類進行分成5類,但這樣的話有個問題,就是人數(shù)肯定不是均分,這就回到我一開始提的問題,20%40%60%80%,這個是不是人數(shù)的均分,但我這種情況還行沒辦法均分了。

    謝謝了!

    來自廣東 回復
  4. 您好,請問如果兩層權(quán)重相乘以后導致權(quán)重衰減得厲害,最后的指數(shù)方差過小,沒有區(qū)分度怎么處理?

    來自江蘇 回復
    1. 可以回過頭去看看初始判斷矩陣兩兩比較是不是給的值太大了,可能要多摸索幾次

      來自上海 回復
  5. 非常非常感謝樓主,學習啦。
    PS:CI=(人-n)(n-1) 這個公式不對哈 ,應該是CI=(人-n)/ (n-1)

    來自北京 回復
    1. 是相除,感謝提醒,謝謝!

      來自上海 回復
  6. 學習了,感謝!

    回復
  7. 指標數(shù)據(jù)標準化中 灰色字體 累計占比的百分比,是怎么來的

    來自上海 回復
    1. 累計占比為輔助數(shù)據(jù)。對各個指標從小到大排序,增加輔助列計算“累計用戶占比”,為保證數(shù)據(jù)均勻,盡可能找20%,40%,60%,80%的點,比如有100條數(shù)據(jù),“瀏覽頁面數(shù)PV”=0有3條,PV=1有25條,則PV=1的累計占比記錄28%。

      來自上海 回復
  8. 請問一下姐姐,這樣的數(shù)據(jù)在哪里找,電子商務系大四學生最近在準備寫關于數(shù)據(jù)分析的論文,但是缺乏數(shù)據(jù) ??

    來自上海 回復
  9. 仔細學習了一遍,因為最近也在做一個評分系統(tǒng),文章開闊了思路,寫得很好,謝謝po主,期待更多的文章!

    來自四川 回復
  10. 你可以考慮開一節(jié)課了,我做你第一個小白學生。

    來自湖北 回復
    1. 謝謝你喜歡這篇文章,互相學習 ??

      來自上海 回復
  11. 權(quán)重wi是怎么算的?????

    來自上海 回復
  12. 有小伙伴反饋不懂層次分析法(AHP)的人會完全看不懂,其實還是有解決辦法的。第一,大家可以理解文章思路,直接拿過來用下試試;第二,權(quán)重不好定,那就本著“各打50大板”的原則,權(quán)重給一樣的的試試。

    來自上海 回復
  13. 給你666個贊

    回復
    1. 你是最棒噠! ??

      來自上海 回復
  14. 看來要學的還有好多,數(shù)據(jù)分析一點不懂 ??

    來自廣東 回復
    1. 永遠年輕,永遠在路上 ??

      來自上海 回復
    2. 1

      來自北京 回復