搜索聯想詞產品實踐系列之淺見(二)排序-場景動線篇

0 評論 7806 瀏覽 47 收藏 8 分鐘

編輯導語:在前一篇中,作者分享了關于《搜索聯想詞的產品定位,效果評估和召回》,本篇闡述在召回所有候選結果后,如何進行排序的問題和聯想詞頁面的場景和動線,我們一起來了解一下。

一、候選詞條的精排

根據用戶確定的字符,在召回環節召回前K條候選聯想詞,如何將這些詞條精準排序,就是排序需要解決的問題。在精排環節,根據業務發展的成熟度,逐步從單一因子排序過度到多因子排序。

為什么要逐步過渡呢?主要是考慮到數據積累的量級影響到數據的信任度問題。在業務發展初期,數據量小,用戶交易鏈路后續數據對結果的影響抖動大,就單純采用交易環節前期行為,比如采用單純的點擊量因子來排序。

根據鏈路衰減原則,在業務發展初期,本身數據量都很小,后續的點擊,訂單,GMV就更小,如果采用后端的行為,那么對結果的擾動就非常大,也就是說這些數據對評估目標是不可信任的。

等業務積累到一定階段,點擊率數據可被信任的話,可以采用點擊率數據來排序,等到業務發展相對成熟,可以采用包含人氣因子、收益因子、服務因子等綜合模型來排序。

排序產品策略主要有如下幾類,我將每種策略的優劣做簡單分析,在闡明策略之前,我們還是將聯想詞目標重申一下:

  • 用戶輸入部分字符就推薦出用戶需要的Query供用戶選擇,降低輸入成本;
  • 結合公司經營需要或者用戶的發散性要求,提升推薦Query的新穎性。

策略1:基于推薦Query搜索次數排序,優勢:簡單;不足:作弊Query可能被推出,并且長尾query沒機會。

策略2:基于Query靜態分的下拉推薦

Query靜態分擬合了Query各維度的知識:比如Query PV、IPV、UV、IUV、CTR、成交轉化率、成交筆數、成交金額、召回商品數,將上述知識用LR回歸的方法擬合成一個實數。

優勢:根據靜態分對候選Query進行排序,Query靜態分不僅考慮了Query的歷史PV/點擊信息,而且考慮了Query的交易信息,交易良好的Query獲得更多的展現機會,給予高質量候選Query以更多的展現機會和排序位置,大大降低了低質量和作弊Query的展現概率。

劣勢:靜態分主要依賴于歷史Query自身的特征,搜索Query與候選Query之間的聯系僅僅是兩者的前綴相同,這種簡單的共性(匹配)沒有將搜索Query與候選Query緊密的結合在一起,關聯性弱的候選Query如果行為表現比較好,就會排在前面,但是這種關聯性弱的Query的線上表現,尤其是CTR往往很差。

策略3:基于CTR預估的下拉推薦

利用LR回歸模型來預估推薦Query的CTR,在模型中充分考慮到搜索Query和候選Query之間的關系,二者之間的聯系越強,候選CTR就會高,反之則會比較低,所以設計的策略用到的特征如下

  • 搜索詞與推薦Query文本特征
  • 搜索詞與推薦Query的類目相關特征
  • 搜索(推薦)Query的詞性特征
  • 搜索(推薦)詞對應的結果頁面特征
  • 候選Query靜態分特征(容納靜態分策略優點)

優點:充分考慮到推薦Query的歷史表現,推薦Query與搜索Query之間的關系

缺點:沒有考慮用戶的個性化偏好

策略4:結合用戶個性化建模的CTR下拉推薦

策略3考慮了搜索Query和候選Query之間關系以及候選Query的歷史表現,但是沒有結合用戶個性化信息。

將用戶的年齡、性別、購買力、短期和長期Query偏好作為用戶建模,在排序時候結合個性化建模推薦會取得更好的效果,在策略3的基礎上增加如下用戶特征:

  • 用戶年齡
  • 用戶平臺性別
  • 用戶購買力
  • 用戶長期Query特征
  • 用戶短期Query特征

優點就不用講了,但是策略4只有在平臺業務成熟度足夠的時候,才可能開展,同時對平臺研發能力有較高要求,具備用戶建模、行為建模等大數據平臺能力。

排序后處理:

  • 后處理包括同義Query去重;Query結構化和合并。去重是指語義上相同,但是表層字符上有些不同,進行詞條合并。
  • Query結構化和合并:結構化合并有助于展示更多的推薦(也就是聯想)Query。

比如在電商網站搜索“海爾”,推薦的Query有:

  • 海爾冰箱
  • 海爾洗衣機
  • 海爾風扇
  • 海爾微波爐

一般地,網站將最常用Query能結構化的盡量結構化,結構化遵循語義一致的原則,比如電商網站將品牌的多個品類(品類語義),品牌+品類的多種功能(功能語義)等結構化在一起。

搜索聯想詞產品實踐系列之淺見(二)排序-場景動線篇

二、場景和動線

前面文章我們在搜索結果頁搭建場景和策劃動線,文中也提及在各個頁面都可以策劃場景和動線,比如在聯想詞頁面,電商網站策劃了店鋪導流的場景(上圖中藍色方框內),滿足用戶直接搜索店鋪的需求,另外,策劃了O2O場景(上圖中的綠色方框),滿足用戶線下店鋪極速達的需求。

大家可能會問,這種場景穿插放置位置是如何決定的?這種場景策劃結合了商業變現和用戶需求,根據公司變現規則來確定,按照變現收入來確定位置。

搜索聯想詞產品實踐系列之淺見(二)排序-場景動線篇

Query離線處理:

Query歸一化:大小寫、全半角、簡繁體、無效字符比如停用詞、無效空格等。

大家對文中的產品策略,以及場景和動線設計,以及搜索聯想詞還有哪些方面的意見和建議,歡迎評論區留言討論。

#專欄作家#

毛新年,公眾號:資深電商專家毛新年,人人都是產品經理專欄作家。起點學院講師,2021年B端產品經理大會演講嘉賓。主導搭建主流電商平臺搜索推薦商品三大體系,熟悉電商平臺策略-產品-運營-數據及研發各環節。

本文原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!