精品久久久久久国产牛牛,99精品人妻少妇一区二区

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

搜推策略產品十做十不做

元氣

2022-11-28

2 評論 4420 瀏覽 40 收藏

18 分鐘

搜索推薦到底該怎么做呢？是要照著老板說的做，還是根據用戶反饋做？本文作者總結了搜推策略產品的十做十不做，并對其中的三點進行了分析，一起來看一下吧。

搜索推薦到底怎么做？按老板說的做，照競品抄，根據用戶反饋做、通過數據分析做？8年京東、美團搜推經驗，建議大家那些該做，那些不該做的，搜推策略產品十做十不做，但要根據具體情況定。

01 硬加權不做，但柔性智能化流量調控要做

什么叫硬加權，就是給某個商品的排序直接從后面提到前面，這個叫硬加權。比如有運營來找你，說我這個東西這么好，怎么排序靠后呢，你得給我加權呀、或者是某個業務找到你，說我這個業務是今年公司重點，但流量不足呀，你得加權呀……

為什么不能硬加權，硬加權損效率呀！為什么損效率呀，用點黑話，是因為用戶不Buy in呀，就是用戶不點呀！

那為什么柔性智能化流量調控可以做呢？這有幾個關鍵點，一個是前置的篩選分層，如果是電商就是精細化選品，看哪些品是預期可以多獲得一些流量，也能承接得住的。

比如阿里今年雙11出了一個價格力加權，就是你這個商品優惠力度大，我可以多給你流量；再比如阿里的優質商家商品流量加權，也是說這個商品有一定的潛力，我多給他一些流量，應該也能承接的?。贿€有就是中間的賽馬機制，效率好的晉升，效率差的汰換，同時要有運營診斷指導，為什么效率差，商品價格高、沒什么評論積累、主圖標題不清晰等。

當然還有很多，不一一展開說了。還有一個重要的點是，對于協同部門要疏不是堵，就是你給他提供抓手，可以讓他有玩的東西，然后一點一點有軼序地玩。

02 亂七八糟標簽不用做，但用戶商品基礎標簽、營銷標簽、人群節日標簽要做

什么叫亂七八糟的標簽？就是一提起推薦，大家就說你是基于那些標簽推薦的，我們能不能在商品或內容上打些標簽，然后你們用呀？我們之前打的標簽你們用了嗎，效果怎么樣？你看我們還需要打什么標簽……這里說明下，標簽對于推薦來講是重要的，但不是最重要的，尤其是在大數據量的情況下。所以，不要提到推薦，大家就認為標簽做好了，推薦就做好了，推薦沒做好，就是標簽沒做好。

1. 推薦原理

回答什么是亂七八糟標簽前，我先基于我的理解給大家科普下推薦原理。其實這也不能怪大家，早期推薦技術也沒那么先進，然后數據量可能也不多，所以，大家就冷啟的時候讓你選興趣點標簽，推薦的時候根據文本標簽推薦，模型上也是LR、GBDT一類的。

這就讓沒搞過搜推的人覺得，啊，推薦就是標簽推薦，但他不知道，現在都是DNN了，都是基于用戶行為推薦，基于I2I推薦，基于KNN，基于Embedding、Vector推薦，只有個別情況下，數據挖掘不到的，才會通過早期的文本標簽做召回推薦。

舉些例子吧，要不然，這么說，懂的人懂，不懂的人還是覺得推薦就是標簽推薦，推薦沒做好，就是沒標簽，或者標簽不準，或者標簽用得不好……那以電商為例，基本可以通過共購買，共點擊等數據挖掘到相似或相關的商品。

比如你點擊了小米的手機，那可能會推薦給你華為的手機，因為很多人點了小米后，也會點華為，甚至最后還購買了華為，這么說還是籠統，更細節是你點的是小米支持5G的，8G+512G內存+存儲的、5英寸的、雙攝的……那算法就通過大數據幫你找到的是華為P40\P50，而不會找到Nokia。

那你這例子不還是說推薦就是基于標簽推薦的嗎？這里其實又涉及到了算法可解釋的問題，通常業務會問，你這排序的邏輯是什么，為什么這么排，為什么這個排前面，那個排在后面？你看給我推了這個，你看我是這樣的用戶，我年薪百萬，怎么不給我推那個？你這個推的多Low呀，一點都不高端……那算法同學呢，一般的回答就是，呃，這是算法推薦的，是DNN深度學習的，是黑盒的，是不可解釋的，我們也不知道為什么這么推；產品經理呢一般會說：啊，你點過這些吧，這是根據你的行為和畫像推薦的。

2. 模型可解釋

我先撈干的，理論上DNN深度神經網絡是不可解釋的，不像GBDT的樹模型那樣是可解釋的，這說的是從模型的角度，什么Feature Important角度是不可解釋的。但實際上任何模型也都是可解釋的，因為人的選擇是可解釋的，人的購物決策和瀏覽內容的偏好是可解釋的，只不過是你要根據不同人、不同時間、不同地點、不同場景、不同……太多了，這樣就不好解釋了，而且你還是要解釋給不了解算法的人。

那這就變成，本來是可解釋的也解釋不清楚了，或者解釋清楚了也聽不清楚……大部分情況下，排序就兩種結果：有用戶行為的非新用戶就是點什么推什么，無行為的新用戶就是熱門推薦。

就像行業里的頭條、抖音、快手什么的，早期甚至現在都是你第一次打開就是美女、時效熱點事件、當地特色內容等；然后你就一直看，算法就認為你喜歡，就一直找相似的推；然后你美味佳肴吃夠了，偶爾也想來點粗糧，這時你就劃掉那些美女了，或者自己搜索點什么，那算法就認為你喜歡上其他內容了，那就幫你找新的相似的內容。

但這些說的都是表面哈，我來講點深度的。其實算法里有個概念叫特征，特征是什么呢？就是能表達這個商品或者內容好壞的東西，其實就像“白、富、美”就是表達一個女人的特征。那算法里一般用什么特征呢，比如內容類關鍵的就是點擊量、點贊量、評論數、點擊率、完播率、停留時長、好評率……然后這些特征呢，還有周期，比如7天點擊量、3天點擊量、1小時點擊量等。好這樣估計有些人能理解推薦一些了。

03 為了多樣性而做的多樣性不做，但基于人群、用戶行為、時令節日、空間等變化的多樣性要做

1. 什么是多樣性

一般推薦結果的多樣性就是，連續Top N個結果是不同的，不同的維度一般是類目維度。這個是通俗的定義，如果要科學定義的話，其實是通過基尼系數、熵等來衡量的。

這里再多說一些多樣性，僅是類目維度的多樣性還不夠，有些場景下需要下分到二、三、四級類、甚至是詞維度，同時還可以根據圖片、價格、商家、品牌、屬性、作者等等很多維度不同的多樣性。那大家如何理解多樣性的呢？這里就會根據不同的屁股、不同的認知來理解了，抽象地講沒有感覺，我舉些例子，做為推薦產品經理遇到比較多的情況應該是：

1）老板覺得多樣性不夠

這里多吐槽一下，在互聯網公司推崇扁平化、去官僚化的情況下，做為一個底層人員，仍然要面對很多層級的老板，而且這些老板們的想法還都不一樣，想法不一樣也就算了，關鍵是他們還不聽一線人員的方案。一般打仗是在前線的人員，最清楚狀況，最知道怎么打，且將在外，軍令可有所不從，但你在互聯網公司，你要敢不從，那你就等著走人吧。

那老板們都如何理解多樣性呢，比如甲老板會說，這怎么每天都給我推差不多的內容，我們平臺上不是有很多內容嗎，我們那個主推的怎么沒看見；乙老板會說，一樣的內容推得太多了；丙老板會說我在其他平臺上看到的內容，咱們這怎么沒推呢……

2）業務覺得多樣性不夠

業務經常是說，怎么沒有我們品類的內容呢，怎么都是那個品類的內容呢？

3）用戶覺得多樣性不夠

很多用戶是不愿意反饋的，一般也就反饋點什么推什么、看過買過還推。

2. 如何做多樣性

前面雖然提到了什么叫多樣性，但不夠具體，所以，在如何做前，還是要定義清楚什么是多樣性，做到什么樣，大家能滿意。這里先說那些不是多樣性不夠：

1）不區分場景的多樣性不是多樣性問題

老板們不分任何時候，都想要多樣性，這里有一個經典的場景，比如某個用戶此刻想買個冰箱，或者是想了解某個事件，這時你非要為了多樣性，再給他推薦個洗衣機、電視，雖然都是家裝三件套，但這個用戶可能不是新裝修呀，有可能就是想換個冰箱，或者是給家里人買、或者是放到租房的地方，反正他不缺電視。

那你說想買上衣的時候，推薦褲子可以吧，這個場景看似成立，但不是適合所有用戶；那這種跨品類的，組合式的推薦什么時候成立呢，這個要根據每個用戶的意圖強弱，行為豐富度等來動態判斷。比如用戶就是逛，就是什么都點，那基本上，你的推薦就可以發散一些，否則，有明確意圖的，你就要幫他收斂，快速幫他找到他想要的，可能是他有一個價格心理，或者是一個屬性風格的心理。

2）行為與意圖茅盾的不是多樣性問題

什么意思呢？就是經常有些內部的人，他不是想看真的內容或者購買那個東西，而是沒有目的地亂點、亂看，點著點著，自己也忘了都點過什么，然后算法基本會基于你最近的點擊等行為進行推薦。且由于算法貪心的Point wise模式，推薦的內容確實會是相似的多，這樣就會造成錯覺，怎么給我推的內容都差不多？

這里的差不多，就是上面說的，算法會基于行為推薦類目相似、價格相似等的內容，但老板要看到的是不同價格段的都來點，或者其他想法，反正是有自己的想法。有時能代表用戶，但更多時候是參雜著自己的意愿，以及平臺的導向。

比如也會說咱們平臺不是還有很多內容嗎，這里其實你可以建議你的老板去內容庫或者商品庫里看全部內容，推薦算法不可能把全部分類都推出來，那和過去的貨架式、陳列式沒什么區別了。

我們繼續說多樣性如何做。做之前呢，要知道目標，做到什么標準算好，那這里基本上是需要定量和定性去衡量的，比如定量上要提升瀏覽深度、CTR、停留時長、不同品類的曝光占比等，不同業務可能不太一樣，定性上是否明顯的Badcase在減少等。

有了衡量標準后，就是具體策略了，這個策略也要從多層進行制定，基本上推薦要想優化一個問題，都是要全方面的調整，不可能有一個大招，就解決所有問題，那一般都是從數據、召回、排序、交互上去優化：

1）數據

數據這不多說了，核心是三點，數據要全面、準確、實時；你要搞清楚人的畫像和商品內容的畫像，要不然無法進行準確的召回和匹配。

2）召回

這里要多說一點，召回源是推薦最重要的部分，如果你只有一路相似召回，那你就沒法做多樣性。至少要按人群、時間、空間、場景等維度進行差異化的召回，比如新人召回熱銷、或者基于CF的召回；非新更多是基于用戶行為的相似相關召回。

還有些人會深度將人群分得更細，比如阿里的八大人群。從時間上會基于平日、季節、節日、大促、熱點、上新等進行召回；從空間上會基于LBS召回；場景上則會比較多，比如是用戶動線購前、中、后等，用戶需求的具體場景，比如辦年貨、吃火鍋等。除了這些召回外，還有一些更偏算法的，比如KNN，KG，Base Model CF。

3）排序

這里和多樣性相關的應該是模型由Point wise調整為List Wise，以及通過MMR等進行打散的排序，還可能加入一些硬規則的M出N的排序，然后EE和生態排序也可以算到這里。

4）交互

這里最重要的是，要實時捕捉用戶的正負反饋，根據正反饋加強推薦，根據負反饋削弱推薦；同時要在產品交互形態上做到動態交互，既用戶點擊某個Item后回到列表頁時，下一個如何進行動態的推薦；以及用戶翻頁時，要進行重新推薦，這里有些會使用端智能，但感覺端智能還是提升有限，最好還是進行服務端重新的推薦。

總結一下多樣性的要點：