策略產品經理子方向:搜索策略產品
搜索策略產品的工作可能會遇到哪些場景和流程?這篇文章里,作者基于工作中的搜索項目,從5個主要問題出發做了拓展和闡述,一起來看看吧。
基于工作中的搜索項目,進行相關搜索策略產品工作的總結,本文主要匯總了以下5個問題進行拓展敘述:
- 搜索場景主要模塊
- 搜索場景常見名詞解釋
- 搜索場景核心流程
- 優化目標的制定
- 搜索場景需要建設及優化方向
一、搜索場景主要模塊
市面上常見的產品,搜索場景基本上都是由搜索入口、搜索中間頁、搜索結果頁這三部分組成,如下:
- 搜索入口:搜索框+底紋詞(搜索框自帶的推薦詞)
- 搜索中間頁:歷史搜索、熱門搜索/搜索發現、聯想詞、主動搜索、中間頁搜索榜單(或運營banner)
- 搜索結果頁:搜索結果頁feed流、排序/篩選功能模塊、廣告位、運營位/banner
各產品細拆下來還有很多模塊,雖然模塊較多,但這些模塊存在的核心目標都是為了讓用戶在搜索場景快速找到精確目標內容,提升轉化和用戶體驗。
二、搜索場景常見名詞解釋
1. query
query即用戶搜索詞,在眾多模塊中,搜索詞可能是用戶主動輸入的,也可能是點擊歷史搜索詞/熱門搜索詞/聯想詞/底紋詞等等跳轉搜索結果頁的內容,也都算作搜索詞,也叫關鍵詞。
2. 相關性
相關性是用戶搜索詞與搜索頁面內容的相關程度,比較簡單場景的是從用戶畫像和內容文本的相關性去衡量相關性。大概的做法是隨機抽取一部分用戶的搜索詞及對應的搜索結果內容,拿用戶畫像中的部分畫像字段,再拿搜索結果的物品的相關字段,人工定義2邊的字段內容是否相關以及相關性強度等。
3. 索引&倒排索引
1)索引
索引是一種像書籍目錄一樣快速查詢數據的結構,能夠快速定位和查找數據。索引能夠將查詢操作的時間復雜度從遍歷整個文檔集合降低到對索引的查詢,大大提升效率。
2)倒排索引
倒排索引是搜索引擎中最常用的索引結構之一,尤其適用于文本檢索場景。其工作原理主要包括以下步驟:
- 文檔分詞:首先,對每一個文檔(如職位描述或簡歷)進行分詞處理,將文本分割成單個單詞或短語,稱為“詞元”。這個過程可能包括去除停用詞(如“的”、“和”等)、詞形還原(將單詞變為其原形,如“running”變為“run”)等。
- 詞項記錄:為每一個獨特的詞元創建一個項記錄,這個記錄包含該詞出現的所有文檔ID列表及其在文檔中的位置信息。這是倒排索引的精髓,它把“詞”到“文檔”的映射關系反轉過來,就是倒排。
- 壓縮與優化:為了節省空間和提高效率,會對這些記錄進行壓縮和索引結構的優化,如使用位圖、倒排列表等數據結構。
*以招聘場景舉例說明倒排索引的應用:求職者搜索特定職位時,系統只需要在倒排索引中查找關鍵詞對應的文檔ID列表,即可快速找到匹配的職位,無需掃描全部職位信息。
4. 意圖識別
1)意圖識別
我個人認為,意圖識別就是在技術上區分搜索和推薦的核心不同點之一。當用戶在搜索場景中輸入關鍵詞詞(query)時,系統會對關鍵詞進行“分詞-糾錯-改寫-意圖識別-輸出識別結果”這一系列操作,我們把這個過程統稱為意圖識別。
例如,在招聘平臺中,意圖識別意味著理解求職者是尋找特定職位、公司信息、工作場所、薪資還是其他相關內容,基本知道了用戶在搜什么,然后根據這個意圖去推薦符合意圖的崗位。這里存放內容信息的地方,就叫做索引。
2)分詞
分詞又叫切詞,是文本處理中的基礎步驟,切詞對于提高搜索效率和準確率非常重要。切詞是將連續的文本分割成獨立且有語義的詞,這也是切詞的難點:識別詞的邊界和歧義問題。
切詞時先對文本進行臟數據清洗和轉化(去除標點、大小寫轉換等),然后用平臺自有或市面上場景的詞典進行文本匹配切詞,匹配成功就切詞。這里面涉及到詞典中沒有的和有歧義的詞,需要進行算法切分或進行詞性標注進行劃分,優化詞典。
3)糾錯
糾錯是提升用戶體驗和搜索效率的重要部分,尤其是在處理用戶輸入的關鍵詞時,能夠有效的識別就糾錯,確保用戶能夠快速找到需要的內容。
常見的糾錯內容有:拼寫糾錯、語法糾錯、同音詞糾錯、縮寫糾錯等。在用戶輸入搜索詞后,進行初步處理(去掉空格、標點等)后,利用詞典(專業詞庫或錯誤詞典)對每個詞進行匹配,且考慮關鍵詞的上下文信息,進行糾錯推斷。還能利用模型算法進行糾錯。通過自動糾錯的方式,提升搜索效率及搜索場景的包容性,進一步提升用戶體驗。
4)改寫
改寫是提升搜索質量和用戶體驗的關鍵過程之一。改寫通過分析理解用戶的關鍵詞,進行轉換,生成更精準更符合自己平臺的查詢query,從而獲得更準更多的搜索結果。
改寫通過同義詞替換、拼寫修正、短語識別與重組、去噪化數據、規范化數據等方面進行搜索詞處理。在用戶輸入搜索詞后,進行初步的分詞和去噪處理(去掉無意義詞),通過自然語言處理技術分析用戶查詢的意圖,包括關鍵詞分析、上下文理解等。根據已建立的改寫規則庫(如同義詞表、拼寫糾正規則等),匹配合適的改寫方案。運用機器學習模型,基于用戶行為數據和歷史搜索結果,動態生成更精準的改寫建議。
改寫能提升搜索結果相關性,有效處理長尾查詢,拓寬用戶搜索范圍,增加內容覆蓋度,促進長尾流量的轉化。
*意圖識別引導整個搜索過程,決定是否需要改寫;改寫優化查詢以提高相關性;切詞和分詞提供基本處理單元;詞典和詞庫提供詞匯規范和專業匹配依據,共同確保搜索的高效和準確。
三、搜索場景核心流程
關于搜索場景的召回、排序等介紹,大家感興趣的可以看之前的介紹:http://www.aharts.cn/pd/4519608.html
四、制定搜索場景優化目標
1. 定義搜索場景及用戶需求
1)用戶群體:需要明確平臺的主要用戶群體,如求職者、雇主客戶、代招(獵頭)等,并分析他們的特定需求。
2)搜索場景:識別用戶在什么情境下使用搜索功能,如求職者尋找特定職位、雇主客戶篩選候選人、獵頭尋求合適人才等。
2. 確定優化目標
其實在第二部分中就已經提到了搜索場景中各模塊的核心目標:讓用戶在搜索場景快速找到精確目標內容,提升轉化和用戶體驗。因此,搜索場景的整體優化目標,其實就是快速識別用戶意圖、進行精準推薦,并讓用戶快速完成轉化。
- 提升用戶體驗:減少搜索響應時間,優化搜索結果的相關性和多樣性,提供個性化推薦。
- 增加用戶參與度:提升搜索后的行為轉化率(如點擊、申請職位、收藏、投遞簡歷等),延長用戶在平臺的停留時間。
- 業務目標:提高職位匹配效率,增加有效連接(求職者與雇主的配對),提升用戶滿意度和留存率,最終推動業務增長。
3. 設定目標提升量
根據核心目標,我們制定了對應的量化指標:各公司的優化方向略有差異,但整體思路大同小異,搜索場景的優化目標對比下來,基本上是以下4個方向指標的提升:內容的相關性提升、轉化漏斗中轉化指標的提升(ctr-點擊率、cvr-轉化率、deep-cvr深度轉化等)、轉化數量絕對值的提升、用戶滿意度;
量化指標的確定以后,需要確定量化目標值,例如轉化量提升10%。這個10%是怎么來的?不能摸著腦袋直接拍數據,需要多角度進行合理預估:
- 基準線分析:當前搜索場景的用戶量、轉化率、轉化量數據;對比各周期數據漲幅趨勢;
- 上限預估:根據競品分析、平臺往年數據對比、轉化漏斗拆分,預估用戶量上限和轉化指標上限;
- 快速驗證:在正式實施前,通過A/B測試或小范圍試驗新策略,收集數據以量化預期提升效果。
- 風險評估:評估實施計劃所需的時間、人力、技術資源以及潛在風險,確保目標設定在資源可承受范圍內,同時考慮到可能遇到的阻力和不確定性。
*最近預估的10%轉化率提升是基于上述多維度分析的結果,是一個結合了歷史數據、行業標準、技術可行性及資源評估的綜合預判。實際操作中,這一目標應當是靈活調整的,并隨著項目進展不斷校驗和優化。
五、搜索優化方向
優化目標相關指標思考清楚后,整個場景的優化目標值就很清晰了,這部分主要根據我在工作中遇到的問題匯總后劃分了以下4個方向去優化:
1. 用戶覆蓋率(c端產品體驗+策略優化)
這部分主要是針對功能模塊的優化,去合理提升用戶在各模塊的覆蓋率以及用戶在搜索場景的轉化路徑;
需要看的數據主要有:
1)整個轉化流程中用戶的轉化漏斗(請求-下發-曝光-點擊-轉化-深度轉化),去看用戶在哪一塊的流失率最高,進行歸因分析
2)提升點擊數量常用的策略:擴大曝光量及吸引用戶眼球(加角標或創意提示)
3)去掉多余的功能及轉化路徑(差異化推薦)
從用戶點擊搜索框-歷史搜索詞/熱門搜索列表-聯想詞-搜索結果頁/結果頁的結構組成/展現形式等,進行體驗端問題匯總,以優化核心價值為目標,去做匯總;
2. 檢索流程及背后邏輯
匯總搜索場景線上流程并梳理對應的檢索邏輯,如上面第二節講的搜索場景核心流程,根據核心流程拆分成以下優化邏輯:
1)用戶點擊搜索框-點擊歷史搜索/點擊搜索按鈕/點擊熱門搜索/點擊聯想詞-請求列表頁(召回-排序-打散)
2)明確搜索場景目前線上檢索流程及對應的背后邏輯,梳理完后,針對不同流程的邏輯進行優化,對接不同的技術團隊
3)從整體體驗端流程(用戶點擊搜索框–>用戶在搜索場景完成深度轉化)的每一個階段,對應到底層的邏輯鏈路,去做相應的梳理和建設,整體的流程按照串聯點去做;
3. 內容優化
相關內容體驗及線上客訴融合,針對內容出不來、出來的內容不合理、內容排序排不出上去、無法精準搜索等問題,細化挖掘底層原因,進行優化方案輸出;
*我在工作中常見的底層原因主要是意圖識別不準確、分詞過細、標簽召回有誤等,供參考。
4. 數據側要點
數據完整度決定了場景優化的上限,在搜索場景優化或正常的策略優化中,都需要優先做數據測算,以下是我在搜索場景優化中匯總的數據側需要注意的地方:
1)埋點梳理
- 搜索場景常見指標是否有對應的埋點或日志表數據
- 轉化漏斗數據鏈路是否完整
2)數據看板
- 整體轉化漏斗看板/分請求來源看轉化漏斗看板
- 人均指標看版
3)搜索詞監控
- 針對頭部搜索詞對比,檢測頭部搜索詞是否異常,以及當天新出現在頭部的搜索詞(及昨天對應為top位置)
- 搜索詞接信安、風控等過濾接口
4)優化路徑匯總
數據摸底,輸出結論及問題規劃。
前期需要對現有搜索場景進行快速的數據摸底工作,從數據維度確認gap在哪,主要有以下幾個維度的數據摸底:
場景與大盤數據:
- 場景流量數據
- 分流程uv/pv轉化率
- 留存數據(對比大盤)
場景頁面轉化數據:
- 轉化率
- 分位置轉化數據
頭部搜索詞數據:
- top1000/3000/5000/N搜索詞曝光占比
- 天/周/月搜索詞重合度
- 高曝光高轉化搜索詞
- 高曝光低轉化搜索詞
長短期搜索詞監測和數據看板建設;
搜索詞監測:
- 搜索場景核心指標監測
- 突發熱詞監測
- 頭部熱詞轉化率監測(高曝光高轉化/高曝光低轉化,出發預警)
數據看板:
- 整體轉化漏斗
- 分召回策略轉化漏斗
六、其他關注點
1. 優化前對齊搜索場景項目優化目標及限制條件(商業收入與連接量的平衡點)或其他訴求(商業流量占比與商業收入的關系)。
2. 明確各流程/各部門接口人,避免單個部分多人來回溝通;需求溝通明確時間節點。
3. 以項目形式進行推進,避免單個需求來回溝通,浪費技術資源。
4. 數據先行,埋點的制定及ab分流的策略等。
5. 抓住重點,看數據在核心不在多,不能哐一下搞一堆數據出來,沒有核心點。
本文由 @大俗大雅 原創發布于人人都是產品經理。未經作者許可,禁止轉載
題圖來自Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
感謝前輩指點!幫大忙了
寫的很細致,基本與我現在的工作一致。