電商運營之站內搜索全面指南(二)

5 評論 8756 瀏覽 62 收藏 9 分鐘

筆者在上一個章節中,給大家初步的講解了一下,站內搜索的前端和后端人工干預的一些邏輯與頁面呈現。那么,接下來就順著這條敘事主干,帶領大家更加深入地了解一下:站內搜索接下來需要明白的雜七雜八和主干。

?站內搜索邏輯的基本組成:怎么被搜到以及怎么排序靠前?

怎么描述呢?

對商家而言,商品怎么才能被搜索到解決的是有無問題,而怎么排序靠前被消費者看到解決的是溫飽問題。透過這兩個問題我們來好好聊一聊搜索的兩大要素:索引和排序。

索引

搜索其實是依靠爬蟲來提取信息的。

什么是爬蟲?說的簡單點就像是幫你搬運信息到倉庫的小哥,爬蟲只負責幫你收集信息,且會給你存放在倉庫里,分門別類安排的整整齊齊。然后,你這個老板只需要查看這些信息就好了。

那么,相比互聯網的廣域搜索比如百度 和谷歌。電商網站的搜索就顯得簡單和閉塞多了,所有的商品都存在一個庫里,你的爬蟲甚至都不需要每天無時不刻的勞作,只需要每天跑一次就夠了。所以,一個商品能否被搜索抓取到是能否展現給用戶的必要條件。

索引指的就是:被爬蟲抓取到并整理好的商品庫。

索引分為全量索引增量索引兩部分。

全量索引為全站商品的一次更新,所有的商品變化包括上下架,名稱屬性標簽庫存信息等的變化通過全量索引進行更新;增量索引為實時更新(也不一定是實時更新,可能是按照整點規則進行更新)更新的內容主要是商品的部分屬性。

下圖是我一同事為了宣講做的ppt? 不是本人原創,直接截圖復用了。

那么商品的哪些信息會被納入索引呢?

——商品名稱、銷售地區、庫存量、商品屬性(尺碼顏色款式等)、商品掛靠的類目名稱、商品編號、商品的標簽信息和價格等。

除了以上的一些固有信息外,商品的數據信息,比如:銷量、評價、曝光點擊等數據也會被納入索引,用來介入接下來的排序步驟,計算排序得分。我們舉個簡單的例子,比如:我早上上架了一款蘋果耳機。但是,我的商品標題和屬性里都沒有對這個款耳機的英文 AirPods的描述。

那么,用戶在搜索AirPods時,是否會搜索到這款產品呢。顯然是無法搜索到的,因為搜索是針對文本信息的精確匹配,此時解決辦法有兩個。

  1. 是給AirPods和蘋果耳機配置同義詞。
  2. 在商品標題屬性或者標簽上給商品加上AirPods關鍵詞。這樣改產品才會被搜索到。

以上即當商品的標題,屬性,類目,標簽,描述等屬于索引范圍的文本信息都不包含用戶輸入的關鍵詞以及系統中的同義詞時,這款產品是無法被搜索引擎搜索到的,當然也無法呈現給用戶。

那么,各位對索引的概念是否有了直觀的認識?沒有也不要緊,我肯定不會講第二遍。

排序

能不能被搜索到的問題解決了,接下來就是商家們最關心的問題,就是:怎樣讓自己的商品在搜索中讓更多的用戶看到?

這個就涉及到搜索的排序算法了。每家電商的搜索排序都是按照自己的算法邏輯進行的。排序的算法邏輯也是各有千秋和特色。排序算法應該是站內搜索里面各大電商的核心機密。

但是,排序的因子就不那么機密了,基本上你想得到的就這么些。只是各家在各個因子上的權重不一樣,計算方式也不一樣。

我們先來列舉一下這些因子有哪些:銷量(淘寶用成交筆數)、點擊、收藏、加購、好評率、商品質量分(商品信息的完善和準確程度)、用戶行為偏好(用以做千人千面個性化)、店鋪評分等信息。

我這里倒是有一些 排序算法的公式,但是還是算了,我看了也頭疼,大家只要知道影響排序算法因子就行,知道哪些因子起了決定性作用就ok。

下圖為我為自家公司在初期版本上的排序因子,看看能得出什么結論?現在很多淘寶商家削尖了腦袋想一探這個排序算法的究竟,其實大可不必,電商千千萬,搜索一條路。對于產品和運營而言,只要知道哪些是直接能夠提升銷售和轉化就夠了。

其實排序分為兩個主要的階段,一個是大范圍的排序(類目排序),一個是商品范圍的排序。

什么意思呢?首先,用戶在輸入一個關鍵詞后,大概率是一個物品詞或者品牌詞,用戶在電商網站使用搜索,95%的概率是要尋找想要購買的商品。此時,我們需要給到他們在這些商品的集合。我們稱之為列表或者類目或者叫分類。

大家在電商app首頁的底部 一般會看到這個模塊,這個項目我將在后面的章節中給大家更加深入的講解。如下圖所示(紅框部分就是分類)):也就是說先要定位用戶想要尋找的商品在哪個分類中。只有找到這個商品的集合類目,然后再該類目中進行商品的排序,這才是排序的兩步走戰略——第一步,類目預測;第二步,商品排序。

目前類目預測主要是兩種方式互為補充:人工和機器算法。

人工也就是我上一章中提到的人工后臺干預。機器類目預測目前主要的方式有:類目文本+商品量集群算法;貝葉斯預測算法;中心詞類目預測算法。這幾種算法各有優劣,我將會在之后的搜索算法章節進行詳細介紹。

好了,總結一下本章:第一步是解決有無問題,第二步是解決溫飽問題。要先能被搜索到才能被更多用戶看到。以上內容不代表絕對準確,有個人的觀點在里面,謹慎采納!

預告下一章內容:

  1. 站內搜索的物料基礎:目錄與商品描述
  2. 站內搜索運營的邏輯與數據指標

#專欄作家#

作者:王歡,微信:wanghuan314400,運營小灰一枚。

本文由 @王歡 原創發布于人人都是產品經理,未經許可,不得轉載。

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 索引講正排、倒排更合理一些

    來自廣東 回復
    1. 寫給小白看 估計就聽繞了

      來自浙江 回復
  2. 可以給個排序算法的計算公式嗎?不曉得如何計算各個維度來給商品打分,還有想問下這種排序因子及分值需要給運營工具人工干預嗎

    回復
  3. 商品基礎權重排序因子感覺較少, 有更多可以分享的排序因子嗎

    來自湖南 回復
  4. ??

    來自上海 回復