如何處理多因子權(quán)重賦值的問題?

14 評論 13314 瀏覽 60 收藏 7 分鐘

已知參與計算的各個feature,如何去確定每個feature的權(quán)重呢?本文將為大家介紹一種相對科學的辦法,來處理這種多因子權(quán)重設置的問題。

數(shù)據(jù)處理領域,在進行相關(guān)指標計算的時候,一個指標通常有若干了因子(通常稱之為feature,下同)參與計算,而每個因子對該指標的貢獻度(通常稱之為weight或contribution,下同)又不同,比如GMV,商品人氣分,用戶滿意度等等。通常可以表示為如下公式:

這時,我們通常遇到下面這個問題:

已知參與計算的各個feature,如何去確定每個feature的權(quán)重呢?

夏唬人目前在做電商推薦策略相關(guān)的事情,經(jīng)常遇到這種問題。

比如在物品(通常稱之為item,下同)召回的時候,如何對每個item進行排序呢?

比如以人氣分作為排序依據(jù),那么通常會考慮銷量,評價,瀏覽次數(shù),下單次數(shù),收藏次數(shù),加購次數(shù)等等。

如果一味的按照經(jīng)驗去進行初始化權(quán)重,然后不停的A/B測試、權(quán)重調(diào)整,是一件研發(fā)成本特別高的事情。

今天就給大家介紹一種相對科學的辦法來處理這種多因子權(quán)重設置的問題。

AHP

簡單介紹一下什么是AHP

層次分析法,簡稱AHP,它是一種運籌學理論。

是指將與決策總是有關(guān)的元素分解成目標、準則、方案等層次,在此基礎之上進行定性和定量分析的決策方法。

“該方法是美國運籌學家匹茨堡大學教授薩蒂于20世紀70年代初,在為美國國防部研究”根據(jù)各個工業(yè)部門對國家福利的貢獻大小而進行電力分配”課題時,應用網(wǎng)絡系統(tǒng)理論和多目標綜合評價方法,提出的一種層次權(quán)重決策分析方法?!?/p>

所以,AHP理論本質(zhì)是通過把一個復雜的問題拆解為多個目標或準則,并且通過定性量化的方式為每個目標進行賦權(quán)的一個過程。

簡單來說AHP就是拆解加賦權(quán),下面詳細講一下過程。

AHP多因子賦權(quán)應用

1. 構(gòu)造判斷矩陣

什么是判斷矩陣?

判斷矩陣就是以參與指標計算的所有ferture組成的一個方陣,并且給出兩兩“比較量化值”。舉例如下:

對于A和B兩個因子,1表示:A和B一樣重要;3表示:A比B重要一些;5表示:A比B重要;7表示:A比B重要的多;9表示:A比B極其重要,具體標準如下圖所示:

這其實就是一個典型的小組投票的過程,通過在方陣行列元素的兩兩比較,最終可以生成一個判斷矩陣。比如對于有A,B,C,D四個feature的判斷矩陣如下圖所示:

2. 一致性校驗

所謂一致性校驗是指在進行投票的時候的公平性和一致性。

比如你認為A比B重要,B比C重要,但是從最后的結(jié)果來看是C比A重要,這樣即為不一致。

一致性校驗是通過計算校驗系數(shù)來實現(xiàn)的,通常用CR來表示,小于0.1即表示一致性校驗通過。

CR包含一致性指標(CI)和隨機一致性指標(RI)兩部分,CR=CI/RI。

CI和RI是一個固定值,與矩陣的階數(shù)有關(guān)。

剩下的是一個比較復雜的數(shù)學過程,簡單介紹幾個概念,計算過程大家可以百度一下即可。

下圖是通過excel進行計算的:

通過進行小組投票和自動計算,最終CR的值為0.06,因此一致性檢驗通過。

權(quán)重Wi列即為每個feature的權(quán)重,因此最終我們可以得出該指標的計算公式為:

完美解決!

說在最后

大家這里或許會有個疑問:

采用AHP的方法進行賦權(quán),小組投票階段是主觀判斷重要性的,所以是不是會帶來誤差?

會,一定會。

不過還是我之前說的,策略一定是建立在業(yè)務之上的,撇開業(yè)務談策略都是偽策略。

采用AHP模型進行多因子賦權(quán),

需要對該業(yè)務有足夠的了解,更需要對該target下的多個feature有足夠的了解,哪個對于target的貢獻度是最大的。

比如對于一個商品,什么樣的商品是用戶喜歡的?用戶喜歡的商品有哪些feature?每個feature對于用戶喜歡的貢獻程度是什么樣的?這些都是需要業(yè)務經(jīng)驗參與的。

如果說科學的方法都有一個前提假設,那么AHP也有一個前提,就是先了解業(yè)務,再談策略。

以上,希望能幫助到大家。

 

作者:夏唬人。公眾號:夏唬人,某廠推薦策略產(chǎn)品經(jīng)理。

本文由 @夏唬人 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 作者你好,我想問一下,在前期的工作中,小組投投票后怎么計算分值?平均值?還是其他方法?還有就是A對B通過投票出來了,那B對A是倒數(shù)一下就好了還是也要投票?

    來自浙江 回復
  2. 會的不用看,看的也不會,說的太模糊了

    來自北京 回復
  3. 為什么excel里的RI是0.89

    來自廣東 回復
  4. 看不懂,能說下具體每個值的計算嗎?

    來自廣東 回復
    1. 有時候沒必要了解具體每一個值的計算方式~

      來自北京 回復
  5. 那個1.67是怎么來的,第一個表里寫的重要不重要用奇數(shù)表示,但是下邊的表里出現(xiàn)了1.67

    來自北京 回復
    1. 那個0.6的倒數(shù)。第一個表只是個判斷標準,非固定的值

      來自北京 回復
  6. 2.11如何得來,求解釋

    回復
    1. 計算很復雜,可以從我公眾號后臺拿到模板,看具體的公式設置

      來自北京 回復
  7. 2.11如何得來

    回復
  8. 作者可以解釋一下為什么矩陣表里的ibc是1.67嗎,這里看不太懂,謝謝啊~

    來自江蘇 回復
    1. 以對角線為界,右上角是左下角的倒數(shù)。舉個例子,好比A比B重要5倍,那么B比A的話就是“重要”0.2倍了

      來自北京 回復
  9. 上面我是用excel進行推導計算的,相關(guān)的模板都已經(jīng)放在公眾號后臺,計算公式已經(jīng)設置好下載即可直接用,公眾號回復“AHP”領取計算模板。

    來自北京 回復
    1. 沒有完全看懂,決定再看一遍

      回復