4個步驟,小結搜索系統

0 評論 6476 瀏覽 95 收藏 6 分鐘

搜索系統作為用戶自行使用的引導工具,重要程度不言而喻;本文主要從4步:需求識別、檢索、排序、展現來總結搜索系統的工作機制。

搜索是一個比較有年份的功能,他不是一個簡單的搜索框,畢竟搜索造就了一個百度帝國。

搜索系統在產品架構中是幫助用戶搜索到他們想要的內容,當用戶不知道如何通過其他路徑直接獲取特定內容的時候才會使用,也就是說搜索是用戶自行使用最后的一個引導工具,重要程度不言而喻。

首先對搜索建立一個整體大概的認知,搜索工作機制如上圖,主要分為4步:需求識別、檢索、排序、展現。

一、需求識別

用戶在搜索框中輸入的關鍵詞即用戶想要查詢的內容,首先需要機器去識別出用戶想要的是什么,才能把用戶想要的東西遞給用戶,首先介入工作就是分詞系統,通過對關鍵詞的整分詞匹配或通過語義解析盡可能的了解當前用戶的需求。

  • 檢索:了解用戶想要什么東西了后,就去倉庫里面把不同區存在的貨物提取出來,準備交付。
  • 排序:為了賣出更多的貨物,會對自己的倉庫定一系列的規則,如:近期要賣的優先、信譽好的供應商優先等進行排序,保證給到用戶我們最好的貨物。
  • 展現:知道用戶想要什么、也從倉庫提取了后,按照排序規則展現給用戶就可以了。

接下來落實到具體的產品方案,堅持一個底層原則:從業務中來,到業務中去。

明確本次搜素策略優化目標,圍繞目標高舉高打:

如:能夠準確識別用戶query背后對商品的需求,并根據排序規則在頁面反饋結果集。

關鍵衡量指標:

  • 商品需求識別準確率:已識別出的query中真正帶有商品需求的query占比,越高越好;
  • 商品需求識別召回率:已識別query中真正帶有商品需求數量的query在所有帶有商品需求query中占比,越高越好。

檢驗策略效果計算方式:

  1. 正確率 = 提取出的正確信息條數 / 提取出的信息條數
  2. 召回率 = 提取出的正確信息條數 / 樣本中的信息條數

想要更好的優化方案,可以對現有的搜索關鍵詞和模塊數據進行分析,從某交易產品月上萬個搜索關鍵詞中,隨機抽取了1000條搜索關鍵詞字數分布如下圖:

通過對用戶輸入的關鍵詞進行分析,結論:

  1. 用戶輸入關鍵詞數量:2、3、4占據總字數的80%,所以:我們需要做一個搜索聯想提升用戶搜索效率。
  2. 用戶關鍵詞主要分布在:品牌、商品名、品類名、其他特殊字詞等,所以:我們要根據各種場景細化出不同的排序方案。
  3. 用戶有較多次出現搜索為空的情況,引起這種結果有兩種可能:① 搜索現有的準確率較低。 ② 現在平臺商品SKU 較少。

二、用戶搜索輸入分析

該部分需要考慮到用戶在使用搜索時有什么使用場景,在不同場景下有怎樣的行為反應:

三、排序計算方式

排序是整個搜素平臺最為關鍵的一環,此處需要權衡商家、用戶、平臺的綜合利益考慮,如商品搜索可以將特征維度分為:商品維度、賣家維度、平臺維度、個性化、反作弊等維度,通過落地到自身業務的當前狀態,可得出關鍵參考點有:

  • 商品名稱:商品的全稱匹配率。
  • 副標題:副標題與關鍵詞的匹配率。
  • 銷量:商品銷售數據權重較高。
  • 標簽:有標簽的商品比沒有標簽的商品權重更高,標簽排名:促銷(滿減、N元任選)>秒殺>包郵 >其他。
  • 權重參考值排序:商品名稱 > 副標題 > 銷量 > 標簽

四、展現

最后根據用戶搜索不同的關鍵詞,使用特定的排序方案,輸入機器得出的結果集 :

本文由 @World 原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!