電商商品搜索權重模型
編輯導語:我們在網上搜索商品時,它會根據季節、銷量等一些數據進行排列;比如我們在夏天的時候搜索長袖,只會出現比較薄款的類型,厚重的長袖都在后面;本文作者對電商商品搜索權重模型進行分析,我們一起來看一下。
商品搜索權重設計做為各大電商的商業機密,網上很少有資料涉及這方面的知識;之前因為項目需要,自己整理過一些權重設計資料,這里和大家分享一個簡單的權重計算模型,有興趣的朋友可以自己再根據需求進行優化。
一、權重概念
權重是反應參數指標在整體評價系統中的重要程度,權重越高,表明該指標越重要。
舉個列子,一個學校招生考試,共三個科目:語文(100分)、數學(100分)、英語(100分),最終根據語文30%,數學40%,英語30%的比例進行累計得一個總得分,得分高者優先錄取。
其中的百分比就是各科的權重,數學占比40%,則說明學校對學生的數學更加重視。
權重的計算方法有很多中,如:加權計算法、加權平均數法、AHP層次法、優序圖法等等,今天我們通過最簡單的加權計算法來實現一個商品的權重模型,對其它權重算法感興趣的朋友可以自己搜索學習。
二、加權法
什么是加權法呢?
還是上面的例子,如果有個考生的成績如下:語文(85)、數學(90)、英語(80),那么他的加權計算過程為:85*30% + 90*40% + 80*30% = 85.5——就是簡單的【成績 * 比例】 再累加的過程。
把上面的科目映射到商品中,則有如下關系:
- 科目 = 商品屬性
- 分值 = 屬性分值
- 成績 = 屬性得分
- 占比 = 屬性的權
這都是什么意思呢?下面我們來一一說明。
1. 確定權重指標【科目=商品屬性】
權重指標這個比較好理解,前面我們講的標題、品類、品牌等等都屬于商品屬性。
需要注意的是在權重模型中,并不是商品的所有屬性都會參與權重計算的,影響用戶搜索習慣、以及銷量的屬性才會參與計算。
如:品牌、價格、總銷量、月銷量、瀏覽量、收藏量、商品評分等;對于不同的品類,部分特有屬性也會參與計算,如:服飾品類的材質、適應季節等,手機品類的內存大小、存儲大小等。
2. 定義指標滿分值【分值=屬性分值】
指標滿分值就好比給科目定義的滿分值一樣,只有設置了上限,數據才有對比性,我們才能判斷出一個具體的分值所代表的好壞程度。
在商品屬性中,部分屬性在系統設計之初就已經有分值的定義,如評分,通常都設置為10分制或者5顆星的記分方式。
但是在這里依然需要給他們再重新定義一套權重中的滿分值,而不能使用原始的10分制或5顆星來計算,因為后面涉及到了自定義權重的高低,需要動態進行調整。
還有一個需要注意的地方,滿分值的定義需要根據屬性值的多少來作為依據;如平臺有500個獨立的品牌,那么品牌的滿分值就不應該定義為100,而是1000;否則就會出現扎堆現象,某個分值會出現多個品牌的情況,應該盡量避免這種情況發生。
3. 劃分指標分值【成績=屬性得分】
對于科目來說,卷面分已經規定好了,具體能考出多少成績,這個就得看各位同學自己的發揮了。
商品也一樣,屬性的滿分定義好后,某個具體屬性能得多少分值就需要根據統計數據和評分標準進行打分。
首先需要定制評分標準,標準的規定有兩種方式:
- 人工經驗定義:根據后臺的銷售數據人為的決定分值,搜索比較多的,銷售量高的可以得分高點,反之亦然;如手機品類中的品牌,通常比較火熱的就是華為、蘋果、小米,其次vivo、oppo、三星等等,人為的依次可以為它們設置得分值:華為(500)、蘋果(450)、小米(400)、vivo(380)、oppo(350)、三星(320)。
- 有明確數據參考:根據系統反饋的統計數據,通過計算獲得分值;如月銷量,默認滿分定義為1000分,如果月銷量超過5000單,則得1000分,未超過的根據比例計算動態獲得的分值。
4. 確定指標的權【占比 = 屬性權】
與各科的占比一樣,權重模型需要為每個參與計算的屬性設置相應的權,這里之所以沒有叫占比,是因為通常我們理解的占比是以百分制來計算的,所有參與因素占比最終加起來需要等于百分百。
但是商品模型參數屬性比較多,采用百分制會試最終的權重值很聚集,搜索效果并不好。
所以通常采用權的設計方法。什么是權呢?
舉個實例,如:數字8692 = 8* 1000 + 6*100 + 9*10 + 2*1,其中千分位的權是1000,百分位的權是100,十分位的權是10,個位的權是1。
我們采用類似的方式給參與權重的商品屬性定義權,如比較重要的屬性:品牌(100000)、價格(100000)、總銷量(10000)、月銷量(10000);重要的屬性:瀏覽量(1000)、收藏量(1000);一般的屬性:庫存(10)、材質(10);其中不同的屬性是可以定義相同權的。
理解了以上幾點,權重模型的基本框架就設計好了,最終權重值通過累加分值乘以權就可以得到。
三、優化
1. 品類影響
在上述的權重模型中,受品類的影響比較嚴重。
比如小米品牌下有多款不同品類的商品,假如有手機和電視兩個品類,大家對他的手機認可度比較高,所以手機品類下品牌的得分和權相對就會設置的比較高一些;而電視是剛進入市場,大家對他的接受度與老牌廠商比就略顯遜色,所以電視品類下品牌的得分和權就應該設置的低一些。
再有一個原因就是如果有品類的特殊屬性要參與權重,不同品類的特殊屬性是不同的。所以在維護權重模型的基本配置時,應該是以品類為單位去維護,這樣才能做到個性化的權重設計。
2. 人工干預
上面通過設置好權重配置后,內部都是通過代碼邏輯計算獲得的權重值。
但是如果平臺需要推廣新品,由于新品沒有銷售數據,所以它的排名默認肯定都靠后;這時就需要設計一個維護入口,通過人工單獨為商品增加權重數值,將新品排名提到前面已達到推廣目的。
3. 外界因素影響
對于部分商品的個別屬性,它的權重值會受一些外部因素的影響。
如服飾和鞋類,它們材質屬性受季節的影響;如材質分別為棉絨和滌綸的登山鞋,夏天搜索【登山鞋】這個關鍵字時,滌綸材質的應該被排在前面,棉絨材質的應該被排在后面;冬天搜索【登山鞋】時,棉絨材質的應該在前,滌綸材質的應該在后,這個在做計算時應該是有依賴條件的。
以上就是加權權重模型的設計方案,希望對你有幫助。
這里再多說一下,為了能夠保證商品權重的及時性,生產環境下通常每天晚上都會對商品重新做權重值計算。
最后給出一個商品的模擬示例,有需要的同學根據自己的場景優化一下。
作者:JackLiu;個人微信公眾號: 揚帆去遠航(ID:Jackai_liu)
本文由 @Jack 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
作者:Jack;個人微信公眾號: 揚帆去遠航(ID:Jackai_liu)
本文由 @Jack 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
價格權重下,滿分值為1000,評分標準中1000元以下的是怎么得到7000分的,這個數據是錯的吧
很有幫助,什么規模的電商平臺會用到這么精細的搜索,如果我不過幾千個SKU,該怎么設計搜索?
大佬你微信多少,能求教一下權重的這塊么
權重有的是百分制 有的千分制 有的十分制 有的5分制 如何選擇使用哪一種呢?這點請詳細指點一下吧!多謝多謝
我想請教一下,品牌的屬性得分的設置是針對關鍵詞還是全局的?
作者能再仔細講講價格這塊是如何處理的嗎?比如:淘寶的價格帶,非常感謝,方便的話,可以加我下微信::LixueStudy,這廂有禮了!哈哈
產品一枚。正在做電商搜索,就看到了樓主的文章,讓小白的我對搜索有了一些初步了解,喜不自勝,哈哈。
這個東西看下來對店鋪有啥幫助嗎?影響最大的是品牌和價格,品牌你沒得選,價格你也沒得選,所以你知道這個東西有啥用呢?
理論上來說你知道一套模型,可以幫助你解決一些問題,但如果是這個模型,你沒辦法解決任何問題!就算你把收藏、評分、服務優化到極致,從權重的增幅來看對你的幫助微乎其微!
對你沒用,對其他人有用
作者寫的是普適性底部邏輯,理論知識肯定需要根據現實進行調整再用噻
找出一篇,讓LZ看看
求繼續更新
大神咨詢下,如果維度里面加上標簽,但是每個商品涉及多個標簽,計算的時候又不能把所有的標簽的屬性得分加起來,這樣很影響權重,能不能幫忙解答下有啥方法呢
1
第四點的權的概念和第二點分值的概念有點混淆,沒理解。根據考生成績的例子,考生=商品,考生的排名即商品的排名,考生排名的計算通過各科成績(商品屬性的得分)*權重(即百分比)。但是第四點權的概念又不是通過百分比表達,這里沒理解
作者在文中2-4里有標識:【占比 = 屬性權】,本質是一樣的。
受益!
學到了,謝謝
感謝
優秀
謝謝分享
很受益!