電商搜索邏輯全解析
編輯導語:對于電商平臺來說,搜索功能是至關重要的,可以說是最核心的功能,好的搜索設計往往可以吸引用戶,促進用戶點擊商品,從而實現交易的轉化。接下來,本文作者通過剖析電商行業的專屬特點和需求,并結合其個人經驗,為我們分享了他總結的解決方案,并且預測了電商搜索的未來趨勢。
搜索功能一定是一家電商平臺技術中最重要的核心的功能,我相信大家對此都無異議。
因為無論產品經理設計了多么完美的產品邏輯,老板砸了多少錢去做拉新用戶,如果用戶在搜索體驗時,搜索結果不符合預期或者不滿足其搜索需求,那么之前所做的工作都會付之東流了。
畢竟電商服務的行業屬性還是促進業務的轉化,實現買賣成單。
本文通過剖析電商行業的專屬特點和需求,并結合個人經驗分享解決方案,希望對大家有所啟發~
一、搜索的業務邏輯
“搜索Query→查詢語義理解→召回→排序→搜索結果”
當用戶在搜索框輸入一個Query時,系統通過對語義的理解,召回相關文檔或商品,在通過算法排序,安客戶實際的搜索意圖進行前后排序,最終解決其搜索需求,實現業務轉化。
其中【查詢語義理解】與【排序】對搜索引導的業務目標最為重要。
二、自然語言處理技術(NLP)在搜索上的應用
1. 概念介紹
想實現搜索引擎效果的優化,就一定要對自然語言處理技術有一定的了解,因為用戶輸入一個Query里從學術角度解讀,自然語言智能研究實現了人與計算機之間用語言進行有效通信,它是融合語言學、心理學、計算機科學、數學、統計學于一體的科學。
自然語言處理被學者譽為”人工智能皇冠上的明珠“,研究覆蓋了感知智能、認知智能、創造智能這樣的學科,是實現完整人工智能的必要技術。
1)感知智能
是指從無結構化數據中識別出重要的要素。比如給一個query,分析出包含的人民、地名、機構名等。
2)認知智能
是在感知之上,能夠理解其中要素的含義以及進行一些推理。比如“謝霆鋒是誰的兒子 ?誰是謝霆鋒的兒子”兩句話。詞和實體都差不多,但語義差別很多。這是認知智能要解決的問題。
3)創造智能
比如計算機指能夠理解語義的基礎上,創造出符合常識、語義、邏輯的句子。比如自動寫出行云流水的小說、創造娓娓動聽的音樂 ? ?能夠無違和跟人自然聊天等。
2. NLP搜索分析路徑
三、電商搜索的特點
1. 關鍵詞堆砌
例如:楊冪同款夏季連衣裙包郵。
2. 詞序對語義影響不大
例如:楊冪同款女夏季連衣裙包郵;女夏季連衣裙包郵楊冪同款。
3. 類目預測問題
例如:當用戶查詢“蘋果”時,可能查詢的是水果,也可能是手機品牌。
4. 搜索引導的業務轉化比重較大
據統計,綜合類電商搜索引導轉化占比40%以上,垂直類電商搜索引導轉化占比60%以上。
5. 穩定性要求較高,支持彈性擴容
活動、大促系統QPS可能是平時的百倍千倍,需要平滑的擴縮容,保障系統的穩定。
四、電商搜索優化核心內容
1. 分詞(劃重點?。?/h3>
1)分詞效果的優化直接影響召回數量,減少無結果率,提高搜索召回質量
例如:
“火鍋九塊九包郵”
- 效果差的分詞方式:“火、鍋、九、塊、九、包、郵”;“火鍋、九、塊、九、包郵”
- 效果好的分詞方式:“火鍋、九塊九、包郵”
”925銀耳飾“
- 效果差的分詞方式:“925、銀耳、銀、耳飾”
- 效果好的分詞方式:“925、銀、耳飾”
2)不同的分詞方式直接影響著參與召回的關鍵詞,從而影響召回的準確性
目前很多開源自建系統難以實現很好的分詞效果,主要原因是訓練語料的數據量有限,不足以形成可以不斷打磨深耕的行業數據。
尤其電商行業商品種類豐富,中文字、詞表達的意義多樣,多音字、同義詞又眾多的情況下,靠自身算法工程師和開發團隊很難實現快速的解決優化,這是一個不斷積累訓練的漫長過程。
3)強烈建議選擇云產品(電商推薦阿里云開放搜索、內容\日志搜索推薦ES)
現成的百萬級訓練語料、行業模板直接接入,畢竟專業領域交給更專業的人,我們才有更多資源投身到業務迭代中去。
2. 實體識別
1)電商搜索-實體識別含義
識別Query中的品牌、品類、款式、風格等具有電商行業特色的實體。
2)召回時保留重要性高的實體詞,對重要性低的部分不影響召回,只影響算法排序
例如:在電商Query中,在實體重要性如果按高、中、低三檔來分。
其中“品牌、品類”是在高檔,也就是最重要的;其次“風格、款式、顏色、季節、人群、地點…”處于中檔;最后“尺寸、修飾詞、影響服務、系列、單位…”處于低檔,可以丟棄不參與召回。
3. 類目預測
舉例說明:
- 用戶搜索“蘋果”可能是想要水果的蘋果,也可能是蘋果手機;
- (用戶搜索“華為”,召回結果按銷量排序,可能銷量最高的“華為手表”、“華為配件”排在前面,實際的搜索意圖”華為手機“卻排在后面。
類目預測就是根據類目下的文本信息和行為數據,計算query與類目的相關度,從而達到預測query的查詢意圖的目的,計算哪些類目與query最相關,用類目相關度影響搜索結果的排序。
也就是說,當通過行為數據分析,發現搜索”華為”的用戶,大部分的搜索意圖都為“手機”,那么召回排序上優先“手機類目”。
4. 排序算法
電商排序常見問題:
- 數據缺乏時效性:難以平衡優質商品和新發布商品之間的權衡關系;
- 商家刷排名:部分商家找到排序漏洞,通過關鍵詞堆砌,獲得靠前位置,用戶體驗不好;
- 人力資源緊張:需要專業算法工程師2-3名,很難找到合適的人才。
5. 人工干預bad case
舉例說明:
- “iPhone11”剛上市時,用戶搜索“蘋果/iphone”,最新款產品肯定要排在前面,在沒有常規排序算法的時候,就需要類目預測人工干預;
- “噴泡”是一款籃球鞋的別稱,并非主流叫法,全稱是“Air Jordan AirFoamposite系列”,這時就需要通過平時運營積累的專業詞匯可視化同步到開放搜索做查詢語義理解功能的補丁,通過靈活干預得以解決;
- 跨境電商有時Query涉及“日文、韓文、泰文”等外語,當我們的分詞詞典不能很好的分詞優化時,也可以通過分詞干預功能解決;
- 用戶搜索Query“香奈兒氣墊”,默認的實體識別,將“香奈兒”歸類為“普通詞”;“氣墊”歸類為“材質”,需要人工干預實體識別,把“香奈兒”干預為品牌。
6. 搜索引導功能
1)搜索前引導
- 搜索框底紋:根據用戶近期行為數據,引導用戶意圖;
- 搜索熱搜榜:實時熱度,引導隨便逛逛的用戶,想知道大家都搜了些什么;
- 搜索熱詞:結合興趣,給用戶推薦優質查詢詞。
2)搜索中引導
下拉提示:智能推薦候選query,提高用戶輸入效率,幫助用戶盡快找到想要的內容。
五、電商搜索未來趨勢
- 搜索是一個需要持續輸出優化的技術,中腰部電商未來一定會選擇輕運作模式,借助像阿里云、華為云這樣的更專業的技術服務商的搜索技術,把更多資源投入到業務創新及研發上。
- 行業模板的突破,據小編所知阿里云的開放搜索技術已經形成電商行業搜索的專屬模板,這也是基于淘寶天貓多年的行業經驗積累而成,無需開發,數據接入即可,產品經理和運營人員都可以參與搜索效果的優化中來。
- AI與搜索技術深入融合,AI智能語音搜索、圖片識別搜索目前主要在頭部電商上應用,隨時技術的發展我相信,這些都會作為主流服務應用在更多電商企業中,改變更多消費者的消費方式
以上內容就是我今天我和大家分享的,希望對你有所幫助,感興趣可以關注【搜索與推薦技術】公眾號~
作者:KKai,B端產品運營
本文由 @KKai 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自 Pexels,基于 CC0 協議
本文由 @KKai 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
作者可以加個微信嗎?文章寫的很好,想要學習交流一下
第四大點-第6點-第2小問,能展開講講嗎
第6點中的第2小問,能展開講講嗎
下拉提示可以解決客戶快速輸入問題,還可以根據用戶行為數據,分析每一用戶的搜索意圖,潛移默化的提升了購買轉化率
大佬你搜了什么亂七八糟的東西
感謝,非常干貨
感謝分享
推薦近期【云棲大會】阿里達摩院的老師分享的自然語言處理技術視頻:https://yunqi.aliyun.com/2020/session54?liveId=44650