搜推策略產品十做十不做
搜索推薦到底該怎么做呢?是要照著老板說的做,還是根據用戶反饋做?本文作者總結了搜推策略產品的十做十不做,并對其中的三點進行了分析,一起來看一下吧。
搜索推薦到底怎么做?按老板說的做,照競品抄,根據用戶反饋做、通過數據分析做?8年京東、美團搜推經驗,建議大家那些該做,那些不該做的,搜推策略產品十做十不做,但要根據具體情況定。
01 硬加權不做,但柔性智能化流量調控要做
什么叫硬加權,就是給某個商品的排序直接從后面提到前面,這個叫硬加權。比如有運營來找你,說我這個東西這么好,怎么排序靠后呢,你得給我加權呀、或者是某個業務找到你,說我這個業務是今年公司重點,但流量不足呀,你得加權呀……
為什么不能硬加權,硬加權損效率呀!為什么損效率呀,用點黑話,是因為用戶不Buy in呀,就是用戶不點呀!
那為什么柔性智能化流量調控可以做呢?這有幾個關鍵點,一個是前置的篩選分層,如果是電商就是精細化選品,看哪些品是預期可以多獲得一些流量,也能承接得住的。
比如阿里今年雙11出了一個價格力加權,就是你這個商品優惠力度大,我可以多給你流量;再比如阿里的優質商家商品流量加權,也是說這個商品有一定的潛力,我多給他一些流量,應該也能承接的?。贿€有就是中間的賽馬機制,效率好的晉升,效率差的汰換,同時要有運營診斷指導,為什么效率差,商品價格高、沒什么評論積累、主圖標題不清晰等。
當然還有很多,不一一展開說了。還有一個重要的點是,對于協同部門要疏不是堵,就是你給他提供抓手,可以讓他有玩的東西,然后一點一點有軼序地玩。
02 亂七八糟標簽不用做,但用戶商品基礎標簽、營銷標簽、人群節日標簽要做
什么叫亂七八糟的標簽?就是一提起推薦,大家就說你是基于那些標簽推薦的, 我們能不能在商品或內容上打些標簽,然后你們用呀?我們之前打的標簽你們用了嗎,效果怎么樣?你看我們還需要打什么標簽……這里說明下,標簽對于推薦來講是重要的,但不是最重要的,尤其是在大數據量的情況下。所以,不要提到推薦,大家就認為標簽做好了,推薦就做好了,推薦沒做好,就是標簽沒做好。
1. 推薦原理
回答什么是亂七八糟標簽前,我先基于我的理解給大家科普下推薦原理。其實這也不能怪大家,早期推薦技術也沒那么先進,然后數據量可能也不多,所以,大家就冷啟的時候讓你選興趣點標簽,推薦的時候根據文本標簽推薦,模型上也是LR、GBDT一類的。
這就讓沒搞過搜推的人覺得,啊,推薦就是標簽推薦,但他不知道,現在都是DNN了,都是基于用戶行為推薦,基于I2I推薦,基于KNN,基于Embedding、Vector推薦,只有個別情況下,數據挖掘不到的,才會通過早期的文本標簽做召回推薦。
舉些例子吧,要不然,這么說,懂的人懂,不懂的人還是覺得推薦就是標簽推薦,推薦沒做好,就是沒標簽,或者標簽不準,或者標簽用得不好……那以電商為例,基本可以通過共購買,共點擊等數據挖掘到相似或相關的商品。
比如你點擊了小米的手機,那可能會推薦給你華為的手機,因為很多人點了小米后,也會點華為,甚至最后還購買了華為,這么說還是籠統,更細節是你點的是小米支持5G的,8G+512G內存+存儲的、5英寸的、雙攝的……那算法就通過大數據幫你找到的是華為P40\P50,而不會找到Nokia。
那你這例子不還是說推薦就是基于標簽推薦的嗎?這里其實又涉及到了算法可解釋的問題,通常業務會問,你這排序的邏輯是什么,為什么這么排,為什么這個排前面,那個排在后面?你看給我推了這個,你看我是這樣的用戶,我年薪百萬,怎么不給我推那個?你這個推的多Low呀,一點都不高端……那算法同學呢,一般的回答就是,呃,這是算法推薦的,是DNN深度學習的,是黑盒的,是不可解釋的,我們也不知道為什么這么推;產品經理呢一般會說:啊,你點過這些吧,這是根據你的行為和畫像推薦的。
2. 模型可解釋
我先撈干的,理論上DNN深度神經網絡是不可解釋的,不像GBDT的樹模型那樣是可解釋的,這說的是從模型的角度,什么Feature Important角度是不可解釋的。但實際上任何模型也都是可解釋的,因為人的選擇是可解釋的,人的購物決策和瀏覽內容的偏好是可解釋的,只不過是你要根據不同人、不同時間、不同地點、不同場景、不同……太多了,這樣就不好解釋了,而且你還是要解釋給不了解算法的人。
那這就變成,本來是可解釋的也解釋不清楚了,或者解釋清楚了也聽不清楚……大部分情況下,排序就兩種結果:有用戶行為的非新用戶就是點什么推什么,無行為的新用戶就是熱門推薦。
就像行業里的頭條、抖音、快手什么的,早期甚至現在都是你第一次打開就是美女、時效熱點事件、當地特色內容等;然后你就一直看,算法就認為你喜歡,就一直找相似的推;然后你美味佳肴吃夠了,偶爾也想來點粗糧,這時你就劃掉那些美女了,或者自己搜索點什么,那算法就認為你喜歡上其他內容了,那就幫你找新的相似的內容。
但這些說的都是表面哈,我來講點深度的。其實算法里有個概念叫特征,特征是什么呢?就是能表達這個商品或者內容好壞的東西,其實就像“白、富、美”就是表達一個女人的特征。那算法里一般用什么特征呢,比如內容類關鍵的就是點擊量、點贊量、評論數、點擊率、完播率、停留時長、好評率……然后這些特征呢,還有周期,比如7天點擊量、3天點擊量、1小時點擊量等。好這樣估計有些人能理解推薦一些了。
03 為了多樣性而做的多樣性不做,但基于人群、用戶行為、時令節日、空間等變化的多樣性要做
1. 什么是多樣性
一般推薦結果的多樣性就是,連續Top N個結果是不同的,不同的維度一般是類目維度。這個是通俗的定義,如果要科學定義的話,其實是通過基尼系數、熵等來衡量的。
這里再多說一些多樣性,僅是類目維度的多樣性還不夠,有些場景下需要下分到二、三、四級類、甚至是詞維度,同時還可以根據圖片、價格、商家、品牌、屬性、作者等等很多維度不同的多樣性。那大家如何理解多樣性的呢?這里就會根據不同的屁股、不同的認知來理解了,抽象地講沒有感覺,我舉些例子,做為推薦產品經理遇到比較多的情況應該是:
1)老板覺得多樣性不夠
這里多吐槽一下,在互聯網公司推崇扁平化、去官僚化的情況下,做為一個底層人員,仍然要面對很多層級的老板,而且這些老板們的想法還都不一樣,想法不一樣也就算了,關鍵是他們還不聽一線人員的方案。一般打仗是在前線的人員,最清楚狀況,最知道怎么打,且將在外,軍令可有所不從,但你在互聯網公司,你要敢不從,那你就等著走人吧。
那老板們都如何理解多樣性呢,比如甲老板會說,這怎么每天都給我推差不多的內容,我們平臺上不是有很多內容嗎,我們那個主推的怎么沒看見;乙老板會說,一樣的內容推得太多了;丙老板會說我在其他平臺上看到的內容,咱們這怎么沒推呢……
2)業務覺得多樣性不夠
業務經常是說,怎么沒有我們品類的內容呢,怎么都是那個品類的內容呢?
3)用戶覺得多樣性不夠
很多用戶是不愿意反饋的,一般也就反饋點什么推什么、看過買過還推。
2. 如何做多樣性
前面雖然提到了什么叫多樣性,但不夠具體,所以,在如何做前,還是要定義清楚什么是多樣性,做到什么樣,大家能滿意。這里先說那些不是多樣性不夠:
1)不區分場景的多樣性不是多樣性問題
老板們不分任何時候,都想要多樣性,這里有一個經典的場景,比如某個用戶此刻想買個冰箱,或者是想了解某個事件,這時你非要為了多樣性,再給他推薦個洗衣機、電視,雖然都是家裝三件套,但這個用戶可能不是新裝修呀,有可能就是想換個冰箱,或者是給家里人買、或者是放到租房的地方,反正他不缺電視。
那你說想買上衣的時候,推薦褲子可以吧,這個場景看似成立,但不是適合所有用戶;那這種跨品類的,組合式的推薦什么時候成立呢,這個要根據每個用戶的意圖強弱,行為豐富度等來動態判斷。比如用戶就是逛,就是什么都點,那基本上,你的推薦就可以發散一些,否則,有明確意圖的,你就要幫他收斂,快速幫他找到他想要的,可能是他有一個價格心理,或者是一個屬性風格的心理。
2)行為與意圖茅盾的不是多樣性問題
什么意思呢?就是經常有些內部的人,他不是想看真的內容或者購買那個東西,而是沒有目的地亂點、亂看,點著點著,自己也忘了都點過什么,然后算法基本會基于你最近的點擊等行為進行推薦。且由于算法貪心的Point wise模式,推薦的內容確實會是相似的多,這樣就會造成錯覺,怎么給我推的內容都差不多?
這里的差不多,就是上面說的,算法會基于行為推薦類目相似、價格相似等的內容,但老板要看到的是不同價格段的都來點,或者其他想法,反正是有自己的想法。有時能代表用戶,但更多時候是參雜著自己的意愿,以及平臺的導向。
比如也會說咱們平臺不是還有很多內容嗎,這里其實你可以建議你的老板去內容庫或者商品庫里看全部內容,推薦算法不可能把全部分類都推出來,那和過去的貨架式、陳列式沒什么區別了。
我們繼續說多樣性如何做。做之前呢,要知道目標,做到什么標準算好,那這里基本上是需要定量和定性去衡量的,比如定量上要提升瀏覽深度、CTR、停留時長、不同品類的曝光占比等,不同業務可能不太一樣,定性上是否明顯的Badcase在減少等。
有了衡量標準后,就是具體策略了,這個策略也要從多層進行制定,基本上推薦要想優化一個問題,都是要全方面的調整,不可能有一個大招,就解決所有問題,那一般都是從數據、召回、排序、交互上去優化:
1)數據
數據這不多說了,核心是三點,數據要全面、準確、實時;你要搞清楚人的畫像和商品內容的畫像,要不然無法進行準確的召回和匹配。
2)召回
這里要多說一點,召回源是推薦最重要的部分,如果你只有一路相似召回,那你就沒法做多樣性。至少要按人群、時間、空間、場景等維度進行差異化的召回,比如新人召回熱銷、或者基于CF的召回;非新更多是基于用戶行為的相似相關召回。
還有些人會深度將人群分得更細,比如阿里的八大人群。從時間上會基于平日、季節、節日、大促、熱點、上新等進行召回;從空間上會基于LBS召回;場景上則會比較多,比如是用戶動線購前、中、后等,用戶需求的具體場景,比如辦年貨、吃火鍋等。除了這些召回外,還有一些更偏算法的,比如KNN,KG,Base Model CF。
3)排序
這里和多樣性相關的應該是模型由Point wise調整為List Wise,以及通過MMR等進行打散的排序,還可能加入一些硬規則的M出N的排序,然后EE和生態排序也可以算到這里。
4)交互
這里最重要的是,要實時捕捉用戶的正負反饋,根據正反饋加強推薦,根據負反饋削弱推薦;同時要在產品交互形態上做到動態交互,既用戶點擊某個Item后回到列表頁時,下一個如何進行動態的推薦;以及用戶翻頁時,要進行重新推薦,這里有些會使用端智能,但感覺端智能還是提升有限,最好還是進行服務端重新的推薦。
總結一下多樣性的要點:
- 用戶意圖非常明確收斂時,不要做大力度的多樣性;
- 用戶意圖發散時,要加強多樣性;
- 要合邏輯地做多樣性,不要為了多樣性而多樣性;
04 其他
個人觀點的體感不做,但大多數人的用戶體驗,敏感商品屏蔽等要做;
拍腦袋的功能不做,但通過數據分析、行業調研、ROI高的要先AB實驗做;
前端樣式變來變去的策略產品不做,但分人群等個性化的UE及方案等要做;
天天干預配置的運營、策略產品不做,但要提供工具給產品運營用;
天天幫研發找表、跑數的保姆不做,但跨部門協調、數據分析等要做;
左手導右手的不做,但如果能形成全局效率最大化的要做;
人情類的需求不做,但為了生存有選擇性地做。
以上為個人觀點,不代表任何機構。
本文由 @元氣 原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
很有啟發,十分感謝
搜索推薦最終還是要根據用戶反饋來做的,同時也要根據實際需求適時調整