通過層次分析法(AHP),建立電商用戶綜合評分模型
文章主要介紹了如何利用層次分析法建立電商用戶綜合評分模型,希望能夠?qū)δ阌兴鶐椭?/p>
層次分析法(Analytic Hierarchy Process,簡稱AHP)定義:是將與決策總是有關的元素分解成目標、準則、方案等層次,在此基礎之上進行定性和定量分析的決策方法。關于層次分析法的具體解釋大家可以使用搜索引擎搜索,篇幅有限,我們暫不展開。
一. 用戶綜合評分模型建立
1.從短期和中長期兩個角度考慮用戶綜合評分模型
現(xiàn)實場景:一個用戶經(jīng)常光顧你的網(wǎng)站,有時只是來看看,有時候順便買點東西,在計算這個用戶的價值的時候,應該怎么做?是看TA最近一次購買行為,還是考慮用戶在整個時間段內(nèi)的表現(xiàn)?老祖宗早就告訴我們了,“日久見人心”。顯然,用戶行為錯綜復雜,一次網(wǎng)站會話行為可能只是管中窺豹,觀察期留的長一些,才能建立更合理的評分模型。
本文的目旨在電商網(wǎng)站的用戶建立起一個評分模型,動態(tài)計算出每個User的價值得分。我們從目標-用戶評分出發(fā),綜合短期和中長期兩個角度抽象出影響用戶得分的因素作為準則層,然后選擇準則層相應的指標層數(shù)據(jù),建立一套科學的評分模型。
從短期來看,我們會關注用戶活躍在在網(wǎng)站/APP上發(fā)生的一系列細致動作,瀏覽重點頁面,點擊預購等。因此,我們將影響目標層用戶得分的第一個因素稱之為“活躍度”。從中長期角度來看,用戶的“忠誠度”和“購買能力”對用戶得分影響至關重要。至此,我們確定了目標層為“用戶價值得分”,影響目標層的準則層包含“活躍度”,“忠誠度”和“購買能力”。
2.用戶綜合評分指標選擇
準則層確定后,就涉及到選擇衡量“活躍度”,“忠誠度”和“購買能力”關鍵指標。有幾個重要的原則可以參考:
- 可量化:能被衡量的,才能被改進,目前電商網(wǎng)站大多通過JS,SDK埋點或者服務器日志分析,所以基本的量化數(shù)據(jù)能夠拿到;
- 有效性:要覆蓋重要的數(shù)據(jù)維度,且在合理可以調(diào)控的范圍內(nèi);
- 相互獨立:指標間盡量保持不相關。
筆者和團隊小伙伴共同討論了一下,選定的適合我司電商用戶的指標內(nèi)容如下:
- 瀏覽頁面數(shù)
- 停留時間
- 瀏覽商品數(shù)
- 主動下單數(shù):一些真正購買前的微轉(zhuǎn)化,如點擊“立即購買”,“立即開團”按鈕等動作
- 最近訪問時間
- 用戶訪問頻率
- 主動評價數(shù)?
- 單次最高購買金額
- 平均每次購買金額
- 購買次數(shù)
3.適合于電商網(wǎng)站的用戶綜合評分模型
時間選擇上,我們選擇先選取近3個月的用戶行為數(shù)據(jù)進行研究,因此“活躍度”對應的時間是“近三個月最后一次活躍的時候,即最近1天”,“忠誠度”和“購買能力”看的是“最近3個月”這個中長期時間段。實際業(yè)務中,按照已有的規(guī)則建立好數(shù)據(jù)表,每一天的數(shù)據(jù)自動入庫,用戶的評分是呈現(xiàn)隨日期滑窗積累的效果,因此我們前面提到的是動態(tài)計算用戶得分。至此,我們的用戶綜合評分模型如下:
二. 層次分析法(AHP)確定權(quán)重
目前,市面上可以搜到很多解決層次分析問題的軟件,但是筆主認為思維比工具更重要,因此本文采用大家電腦里都有的Excel來解決這個問題,這樣我們能把主要精力集中在實現(xiàn)方法上,而不是工具操作上。在用Excel實現(xiàn)AHP方法的時候,有兩個重要問題需要解決:
構(gòu)造判斷矩陣:常見方法是小組投票,給出兩兩因素(例如A和B)間的比較值,1表示:A和B一樣重要;3表示:A比B重要一些;5表示:A比B重要;7表示:A比B重要的多;9表示:A比B極其重要。這樣,通過兩兩比較給出比較值,判斷矩陣就出來了。如下圖:可以看到“活躍度”,“忠誠度”和“購買能力”的判斷矩陣
一致性檢驗:什么是一致性檢驗?舉個例子,當兩兩比較認為A比B重要,B比C重要時,輪到A和C比較了,你給出C比A重要的比較值,此時就叫做“不一致”。層次分析法的計算不是簡單得到一個結(jié)果,而是要得到一個令人滿意的一致性的結(jié)果。
一致性的檢驗是通過計算一致性比例CR 來進行,其中CR=CI/RI,當CR<=0.1 時,認為判斷矩陣的一致性是可以接受的,否則應對判斷矩陣作適當修正,甚至推倒重做。
另外,公式中另外兩個參數(shù)CI是一致性指標,RI是隨機一致性指標,通過查表可以找到三階矩陣的RI=0.5149,四階矩陣的RI=0.8931。
這部分是數(shù)學知識,大家理解文章后可以直接拿來用,我們后面直接以下圖“準則層”為例,闡述如何用Excel構(gòu)建判斷矩陣及單排序和一致性檢驗,想了解更多的,可以搜索引擎搜索一下。
- 判斷矩陣構(gòu)造:對角線上表示“活躍度”比“活躍度”,“忠誠度”比“忠誠度”,“購買能力”比“購買能力”,因此全部值都是“1”,然后左下角,將團隊投票的兩兩比較值填入,右上角做倒數(shù)映射即可;
- 按行相乘:F6=PRODUCT(C6:E6),下拉
- 開n次方:G6==POWER(F6,1/3),下拉,而G9=SUM(G6:G8)
- 權(quán)重Wi: H6=G6/$G$9,下拉
- 分向量AWi:I6==C6*$H$6+D6*$H$7+E6*$H$8
- AWi/Wi =I6/H6,而J9=AVERAGE(J6:J8)
- CI=(人-n)(n-1) , 這里面“人”其實是希臘字母“蘭姆達”,其實就是J9單元格的數(shù)字,我打不出這個字母,希望你們understand 我,謝謝!n代表變量數(shù),準則層的n=3,經(jīng)過計算CI=0
- 三階矩陣RI=0.5149
- CR=CI/RI=0
至此,我們構(gòu)造的判斷矩陣,一致性檢驗通過。紅色標記的Wi即為相應的權(quán)重,即準則層相對目標層有如下公式:用戶價值得分=0.4*活躍度 + 0.4*忠誠度 + 0.2*購買能力。
指標層相應的判斷矩陣及單排序和一致性檢驗如下圖,請大家參考。
三. 指標數(shù)據(jù)標準化
我們前面選定了每個準則層對應可以量化的指標,這些指標的數(shù)量值和單位不盡相同,我們需要將其采用同一種計量方法,這樣才能進行比較。我們本次采用的是5分制,即要把所有的指標數(shù)據(jù),不管是“瀏覽頁面數(shù)”,“停留時間”,還是“單次最高購買金額”,都標準化到[0,5]。
如下圖,我們拉取最近個月的用戶數(shù)據(jù),通過對原始數(shù)據(jù)進行分析,最后建立的標準化規(guī)則,不同網(wǎng)站/APP的具體標準化規(guī)則可能不同,需要依據(jù)原始數(shù)據(jù)來定。
- 第一行{0,1,2,3,4,5}表示標準化得分,即要把所有的指標數(shù)據(jù)映射到數(shù)據(jù)集里
- 黃色行表示實際原始數(shù)值
- 灰色字體行表示累計占比
以“瀏覽頁面數(shù)”為例,首先拉取近三個月的原始數(shù)據(jù),選擇用戶“最近1天”的在網(wǎng)站/APP上的活躍數(shù)據(jù),如下圖所示,左列表示用戶id,右側(cè)表示每個id在“最近1天”瀏覽的頁面數(shù)。其次,按照PV進行從小到大的升序排列。第三,做截止到XXX-id為止的用戶累計占比。因為是5分制,因此,理論上,找到累計占比約為“20%,30%,60%,80%”的,把相應的PV作為標準化后“1,2,3,4”數(shù)值的分割點即可。
有一點需要提醒,要盡可能保持原始數(shù)據(jù)被均勻標準化到[0,5],但是有的指標起點就非常高,比如“瀏覽商品數(shù)”指標,50.7%的用戶沒有瀏覽商品,那么接下來就要盡量在50%-100%之間均勻標準化。具體標準化過程,大家可以在實踐中自己體會。
四. 數(shù)據(jù)結(jié)果和驗證
前面工作順利的話,應該會有如下圖所示的一張表,以“客戶ID”作維度,顯示每一個客戶對應“指標原始數(shù)據(jù)”,“準則層得分”以及“目標層得分”的數(shù)據(jù)。
我們使用tableau制圖,進行數(shù)據(jù)分布的驗證。如下圖,當準則層,指標層權(quán)重系數(shù)確定,當指標標準化完成后,電商用戶的價值得分出現(xiàn)如圖所示的完美長尾分布。實際過程,從確定權(quán)重,要指標標準化這個過程,筆者和團隊小伙伴進行了多次調(diào)參,和多次推到重做。所以,如果大家借鑒本文做其它平臺用戶綜合評分模型,一定要有耐心。
Tableau圖表中,我們用數(shù)據(jù)桶表示最終得分,縱坐標表示客戶ID不重復計數(shù),橫坐標是標準化后的得分,橫坐標為0.0的數(shù)據(jù)桶解讀為“得分在[0,0.2)的客戶占比為0.2%”,橫坐標為0.2的數(shù)據(jù)桶解讀為“得分在[0.2,0.4)的客戶占比為16.64%”,依次類推。
五. 應用場景和意義
由于本文重點是給大家介紹建立電商用戶綜合評分模型的方法,針對應用場景和意義,筆者僅做拋磚引玉,歡迎大家主動思考,以及評論,同筆者交流。
- 首先,根據(jù)上一部分用戶最終得分分布圖,可以找到高價值用戶(比如定義得分大于3分的用戶),極低價值用戶(比如定義得分小于0.2的用戶)等等,不同類別的用戶,做針對性的營銷,甚至一對一的溝通和客戶管理。
- 第二,目標層由指標層決定,我們用“活躍度”,“忠誠度”和“購買能力”三個維度,每個維度以中位數(shù)為分界線,得到2*2*2八大類用戶集合。如下圖所示為使用Tableau繪制的八大類用戶占比情況。然后根據(jù)不同準則層的表現(xiàn)制定不同的溝通策略。
如下圖為不同用戶的溝通策略。
感謝閱讀我在《人人都是產(chǎn)品經(jīng)理》上的第一篇文章,希望和各位多交流,以及得到大家的肯定和鼓勵,感謝!
本文由 @?sharon 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自PEXELS,基于CC0協(xié)議
感謝樓主!
“找到累計占比約為“20%,30%,60%,80%”,應該是“20%,40%,60%,80%”
你好,請問如果是百分制的話,指標數(shù)據(jù)的標準化也是用同樣的方法嗎?
您好,請問下20%40%60%80%,這個是按照人數(shù)均分嗎?
如果樣本數(shù)據(jù)呈現(xiàn)長尾,不是正態(tài)分布形式:例如:消費,最近一年消費情況,消費0單的占了70%,消費1單的人數(shù)占了20%,剩余的人數(shù)占了10%,那怎么將他們均分20%40%60%80%?
比如按照文章提供的思路:0單的70%人數(shù)(分數(shù)=0),消費1單(分數(shù)=1) 好像就沒辦法人數(shù)均分了。
我現(xiàn)在的思路是,將消費人數(shù)進行l(wèi)og化,log化之后消費人數(shù),通過系統(tǒng)聚類進行分成5類,但這樣的話有個問題,就是人數(shù)肯定不是均分,這就回到我一開始提的問題,20%40%60%80%,這個是不是人數(shù)的均分,但我這種情況還行沒辦法均分了。
謝謝了!
您好,請問如果兩層權(quán)重相乘以后導致權(quán)重衰減得厲害,最后的指數(shù)方差過小,沒有區(qū)分度怎么處理?
可以回過頭去看看初始判斷矩陣兩兩比較是不是給的值太大了,可能要多摸索幾次
非常非常感謝樓主,學習啦。
PS:CI=(人-n)(n-1) 這個公式不對哈 ,應該是CI=(人-n)/ (n-1)
是相除,感謝提醒,謝謝!
學習了,感謝!
指標數(shù)據(jù)標準化中 灰色字體 累計占比的百分比,是怎么來的
累計占比為輔助數(shù)據(jù)。對各個指標從小到大排序,增加輔助列計算“累計用戶占比”,為保證數(shù)據(jù)均勻,盡可能找20%,40%,60%,80%的點,比如有100條數(shù)據(jù),“瀏覽頁面數(shù)PV”=0有3條,PV=1有25條,則PV=1的累計占比記錄28%。
請問一下姐姐,這樣的數(shù)據(jù)在哪里找,電子商務系大四學生最近在準備寫關于數(shù)據(jù)分析的論文,但是缺乏數(shù)據(jù) ??
仔細學習了一遍,因為最近也在做一個評分系統(tǒng),文章開闊了思路,寫得很好,謝謝po主,期待更多的文章!
你可以考慮開一節(jié)課了,我做你第一個小白學生。
謝謝你喜歡這篇文章,互相學習 ??
權(quán)重wi是怎么算的?????
有小伙伴反饋不懂層次分析法(AHP)的人會完全看不懂,其實還是有解決辦法的。第一,大家可以理解文章思路,直接拿過來用下試試;第二,權(quán)重不好定,那就本著“各打50大板”的原則,權(quán)重給一樣的的試試。
給你666個贊
你是最棒噠! ??
看來要學的還有好多,數(shù)據(jù)分析一點不懂 ??
永遠年輕,永遠在路上 ??
1