如何處理多因子權(quán)重賦值的問題?
已知參與計算的各個feature,如何去確定每個feature的權(quán)重呢?本文將為大家介紹一種相對科學的辦法,來處理這種多因子權(quán)重設置的問題。
數(shù)據(jù)處理領域,在進行相關(guān)指標計算的時候,一個指標通常有若干了因子(通常稱之為feature,下同)參與計算,而每個因子對該指標的貢獻度(通常稱之為weight或contribution,下同)又不同,比如GMV,商品人氣分,用戶滿意度等等。通常可以表示為如下公式:
這時,我們通常遇到下面這個問題:
已知參與計算的各個feature,如何去確定每個feature的權(quán)重呢?
夏唬人目前在做電商推薦策略相關(guān)的事情,經(jīng)常遇到這種問題。
比如在物品(通常稱之為item,下同)召回的時候,如何對每個item進行排序呢?
比如以人氣分作為排序依據(jù),那么通常會考慮銷量,評價,瀏覽次數(shù),下單次數(shù),收藏次數(shù),加購次數(shù)等等。
如果一味的按照經(jīng)驗去進行初始化權(quán)重,然后不停的A/B測試、權(quán)重調(diào)整,是一件研發(fā)成本特別高的事情。
今天就給大家介紹一種相對科學的辦法來處理這種多因子權(quán)重設置的問題。
AHP
簡單介紹一下什么是AHP?
層次分析法,簡稱AHP,它是一種運籌學理論。
是指將與決策總是有關(guān)的元素分解成目標、準則、方案等層次,在此基礎之上進行定性和定量分析的決策方法。
“該方法是美國運籌學家匹茨堡大學教授薩蒂于20世紀70年代初,在為美國國防部研究”根據(jù)各個工業(yè)部門對國家福利的貢獻大小而進行電力分配”課題時,應用網(wǎng)絡系統(tǒng)理論和多目標綜合評價方法,提出的一種層次權(quán)重決策分析方法?!?/p>
所以,AHP理論本質(zhì)是通過把一個復雜的問題拆解為多個目標或準則,并且通過定性量化的方式為每個目標進行賦權(quán)的一個過程。
簡單來說AHP就是拆解加賦權(quán),下面詳細講一下過程。
AHP多因子賦權(quán)應用
1. 構(gòu)造判斷矩陣
什么是判斷矩陣?
判斷矩陣就是以參與指標計算的所有ferture組成的一個方陣,并且給出兩兩“比較量化值”。舉例如下:
對于A和B兩個因子,1表示:A和B一樣重要;3表示:A比B重要一些;5表示:A比B重要;7表示:A比B重要的多;9表示:A比B極其重要,具體標準如下圖所示:
這其實就是一個典型的小組投票的過程,通過在方陣行列元素的兩兩比較,最終可以生成一個判斷矩陣。比如對于有A,B,C,D四個feature的判斷矩陣如下圖所示:
2. 一致性校驗
所謂一致性校驗是指在進行投票的時候的公平性和一致性。
比如你認為A比B重要,B比C重要,但是從最后的結(jié)果來看是C比A重要,這樣即為不一致。
一致性校驗是通過計算校驗系數(shù)來實現(xiàn)的,通常用CR來表示,小于0.1即表示一致性校驗通過。
CR包含一致性指標(CI)和隨機一致性指標(RI)兩部分,CR=CI/RI。
CI和RI是一個固定值,與矩陣的階數(shù)有關(guān)。
剩下的是一個比較復雜的數(shù)學過程,簡單介紹幾個概念,計算過程大家可以百度一下即可。
下圖是通過excel進行計算的:
通過進行小組投票和自動計算,最終CR的值為0.06,因此一致性檢驗通過。
權(quán)重Wi列即為每個feature的權(quán)重,因此最終我們可以得出該指標的計算公式為:
完美解決!
說在最后
大家這里或許會有個疑問:
采用AHP的方法進行賦權(quán),小組投票階段是主觀判斷重要性的,所以是不是會帶來誤差?
會,一定會。
不過還是我之前說的,策略一定是建立在業(yè)務之上的,撇開業(yè)務談策略都是偽策略。
采用AHP模型進行多因子賦權(quán),
需要對該業(yè)務有足夠的了解,更需要對該target下的多個feature有足夠的了解,哪個對于target的貢獻度是最大的。
比如對于一個商品,什么樣的商品是用戶喜歡的?用戶喜歡的商品有哪些feature?每個feature對于用戶喜歡的貢獻程度是什么樣的?這些都是需要業(yè)務經(jīng)驗參與的。
如果說科學的方法都有一個前提假設,那么AHP也有一個前提,就是先了解業(yè)務,再談策略。
以上,希望能幫助到大家。
作者:夏唬人。公眾號:夏唬人,某廠推薦策略產(chǎn)品經(jīng)理。
本文由 @夏唬人 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
作者你好,我想問一下,在前期的工作中,小組投投票后怎么計算分值?平均值?還是其他方法?還有就是A對B通過投票出來了,那B對A是倒數(shù)一下就好了還是也要投票?
會的不用看,看的也不會,說的太模糊了
為什么excel里的RI是0.89
看不懂,能說下具體每個值的計算嗎?
有時候沒必要了解具體每一個值的計算方式~
那個1.67是怎么來的,第一個表里寫的重要不重要用奇數(shù)表示,但是下邊的表里出現(xiàn)了1.67
那個0.6的倒數(shù)。第一個表只是個判斷標準,非固定的值
2.11如何得來,求解釋
計算很復雜,可以從我公眾號后臺拿到模板,看具體的公式設置
2.11如何得來
作者可以解釋一下為什么矩陣表里的ibc是1.67嗎,這里看不太懂,謝謝啊~
以對角線為界,右上角是左下角的倒數(shù)。舉個例子,好比A比B重要5倍,那么B比A的話就是“重要”0.2倍了
上面我是用excel進行推導計算的,相關(guān)的模板都已經(jīng)放在公眾號后臺,計算公式已經(jīng)設置好下載即可直接用,公眾號回復“AHP”領取計算模板。
沒有完全看懂,決定再看一遍