電商搜索主要就這3個事

0 評論 11525 瀏覽 80 收藏 8 分鐘

本篇文章介紹了電商搜索的工具——搜做引擎,其3個核心能力:詞庫、權重、索引。

最簡單的電商搜索是針對商品名稱,隨著技術進步,用戶搜索的內容五花八門,只僅針對商品名稱的搜索已經遠遠不能滿足用戶的需求,這個時候行業里面引入了一個工具——搜索引擎。

搜索引擎主要為我們提供3個核心能力:詞庫、權重、索引,還可能包含其他一些附屬功能,比如評價體系、數據統計等,下面我們主要來說下搜索引擎的這3個核心能力。

一、詞庫

1.1 數據準備

搜索引擎可以對用戶輸入的搜索詞做預處理,以此提供用戶更想要的搜索結果,比如近義詞、分詞、兼容拼音、糾錯功能等,除了有通用的詞庫可以解決掉一般性的輸入問題之外,最主要的就是針對用戶以往的搜索詞去定期完善相應的詞庫。

所以在構建相應的詞庫之前,需要對用戶以往的搜索詞做好相應的統計,包括每個搜索詞的搜索人數占比、搜索結果點擊率以及每個搜索詞的下單轉化情況等,有了這些數據,我們就可以有針對性的優先優化最有價值的搜索詞,另外還可以通過這些數據查看優化后的結果。

1.2 近義詞

比如用戶搜索的是“充電寶”,但實際上專業名詞叫“移動電源”,再比如“充電器”,專業名詞叫“電源適配器”等等,根據用戶的搜索數據,我們需要定期把這些對應關系更新到近義詞庫,如圖15-1。

圖15-1 近義詞詞庫(圖片來源:小米商城)

1.3 分詞

分詞的意思是說,如果用戶的搜索詞比較長,比如“防霧霾口罩”,但是商品標題是“過濾防護口罩”,這個時候如果按照完全匹配是匹配不到的,分詞的作用就是把搜索詞分成“防霧霾”+“口罩”,這樣搜索的結果集就會大大增加。如圖15-2:

目前已經有通用的分詞詞庫,用來處理常見的分詞,但是對于一些專有名詞,或者一些需要系統特別處理的詞,比如手機行業里的“全面屏”,需要我們自己根據數據統計的結果定時更新到分詞詞庫。

圖15-2 分詞(圖片來源:天貓)

1.4 其他

包括錯別字、兼容拼音、去重等,原理跟近義詞、分詞類似,這里想討論一個問題:如果用戶的搜索詞是錯的,我們應該如何處理?如圖15-3,第一張圖,用戶搜索了“xiaomi”,小米商城直接給用戶顯示了“小米”的搜索結果,也就是幫用戶糾正了錯誤。而第二張圖,用戶搜索“永衣”,天貓先給用戶顯示了“永衣”的搜索結果,再問用戶是不是在找“泳衣”。

那到底是先顯示“永衣”的搜索結果,再問用戶是不是搜索“泳衣”,還是直接幫用戶糾正為“泳衣”的搜素結果,再問用戶是否仍然搜“永衣”?

我個人的建議是,在“永衣”有搜索結果的情況下,先幫用戶顯示“永衣”的搜索結果,再問用戶是不是搜索“泳衣”。因為“永衣”有搜索結果,所以我們并不能完全確認用戶的搜索詞是否錯誤,如果直接幫用戶糾正錯誤,從尊重用戶的角度來說是不合適的,甚至可能是多余的。

如果“永衣”沒有搜索結果,則直接給用戶顯示“泳衣”的搜索結果,并且不是提示用戶是否仍然搜索“永衣”,因為“永衣”沒有搜索結果,還讓用戶搜索干嘛?而是類似圖15-2,告訴用戶“永衣”沒有搜索結果,已為您推薦“泳衣”的相關商品。

圖15-3 糾錯(圖片來源:小米、天貓)

二、權重

權重就是跟搜索結果排序相關的,從電商的角度來說,包括但不限于商品、用戶、運營等維度。

商品可能包括品類、商品名稱、副標題、顏色、規格參數等,用戶相關的就包括購買、推薦、收藏、點擊等,運營相關的包括促銷、新品、熱賣等。

每一項有一個權重值,經過一系列的算法計算,權重越高的商品搜索結果越靠前。跟詞庫類似,權重也是需要定期更新不斷完善的過程。

三、索引

索引是搜索引擎的一個重要特性,我們知道一般的數據庫也可以創建索引,但主要是針對具體數據類型確切數值的精確篩選,而大數據量下的實時處理能力,以及基于語義、相關性方面的搜索,還需要搜索引擎的支持。

搜索引擎需要定期從商城獲取數據創建索引,數據內容包括了之前提到的商品、用戶、運營等相關的數據,如果對實時性要求比較高,就增量同步,實時性要求不高,則可以定期全量同步。

用戶從搜索到最終獲得搜索結果的流程如圖15-4:

圖15-4 用戶搜索流程

總結

本文以電商為例,詳細講解了搜索引擎提供的詞庫、權重、索引3個核心能力,包括它們是如何應用在我們的產品當中,以及在日常的搜索優化工作中,需要做哪些事情,希望對各位有所幫助。

#專欄作家#

張旭東,微信公眾號:旭東愛折騰,人人都是產品經理專欄作家。努比亞手機商城產品經理,前華強旗艦店產品經理,FON樂隊吉他手。

本文原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!