久久久久精品久久九九,精品久久久无码中文字幕,欧美性刺激网站

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

產品經理需要了解：推薦系統和搜索引擎的關系

達觀數據

2017-12-06

2 評論 19901 瀏覽 196 收藏

18 分鐘

本文作者結合自己的實踐經驗來為大家闡述推薦系統和搜索引擎兩者之間的關系、分享自己的體會。

從信息獲取的角度來看，搜索和推薦是用戶獲取信息的兩種主要手段。無論在互聯網上，還是在線下的場景里，搜索和推薦這兩種方式都大量并存，那么推薦系統和搜索引擎這兩個系統到底有什么關系？區別和相似的地方有哪些？

本文作者有幸同時具有搜索引擎和推薦系統一線的技術產品開發經驗，結合自己的實踐經驗來為大家闡述兩者之間的關系、分享自己的體會。

圖1：搜索引擎和推薦系統是獲取信息的兩種不同方式

主動或被動：搜索引擎和推薦系統的選擇

獲取信息是人類認知世界、生存發展的剛需，搜索就是最明確的一種方式，其體現的動作就是“出去找”，找食物、找地點等，到了互聯網時代，搜索引擎（Search Engine）就是滿足找信息這個需求的最好工具，你輸入想要找的內容（即在搜索框里輸入查詢詞，或稱為Query），搜索引擎快速的給你最好的結果，這樣的剛需催生了Google、百度這樣的互聯網巨頭。

但是獲取信息的方式除了搜索外，還有另一類，稱為推薦系統（Recommendation System,簡稱Recsys），推薦也是伴隨人類發展而生的一種基本技能，你一定遇到這樣的場景，初來乍到一個地方，會找當地的朋友打聽“嗨，請推薦下附近有啥好吃好玩的地方吧！”——知識、信息等通過推薦來傳播，這也是一種獲取信息的方式。

搜索和推薦的區別如圖1所示，搜索是一個非常主動的行為，并且用戶的需求十分明確，在搜索引擎提供的結果里，用戶也能通過瀏覽和點擊來明確的判斷是否滿足了用戶需求。然而，推薦系統接受信息是被動的，需求也都是模糊而不明確的。以“逛”商場為例，在用戶進入商場的時候，如果需求不明確，這個時候需要推薦系統，來告訴用戶有哪些優質的商品、哪些合適的內容等，但如果用戶已經非常明確當下需要購買哪個品牌、什么型號的商品時，直接去找對應的店鋪就行，這時就是搜索了。

圖2：從搜索詞中可以看出，用戶有大量個性化推薦的需求

很多互聯網產品都需要同時滿足用戶這兩種需求，例如對提供音樂、新聞、或者電商服務的網站，必然要提供搜索功能，當用戶想找某首歌或某樣商品的時候，輸入名字就能搜到；與此同時，也同時要提供推薦功能，當用戶就是想來聽好聽的歌，或者打發時間看看新聞，但并不明確一定要聽哪首的時候，給予足夠好的推薦，提升用戶體驗。

個性化程度的高低

除了主被動外，另一個有趣的區別是個性化程度的高低之分。搜索引擎雖然也可以有一定程度的個性化，但是整體上個性化運作的空間是比較小的。因為當需求非常明確時，找到結果的好壞通常沒有太多個性化的差異。例如搜“天氣”，搜索引擎可以將用戶所在地區的信息作補足，給出當地天氣的結果，但是個性化補足后給出的結果也是明確的了。

用戶對信息的個性化需求

但是推薦系統在個性化方面的運作空間要大得多，以“推薦好看的電影”為例，一百個用戶有一百種口味，并沒有一個“標準”的答案，推薦系統可以根據每位用戶歷史上的觀看行為、評分記錄等生成一個對當前用戶最有價值的結果，這也是推薦系統有獨特魅力的地方。雖然推薦的種類有很多（例如相關推薦、個性化推薦等），但是個性化對于推薦系統是如此重要，以至于在很多時候大家干脆就把推薦系統稱為“個性化推薦”甚至“智能推薦”了。

快速滿足還是持續服務？

開發過搜索引擎的朋友都知道，評價搜索結果質量的一個重要考量指標是要幫用戶盡快的找到需要的結果并點擊離開。在設計搜索排序算法里，需要想盡辦法讓最好的結果排在最前面，往往搜索引擎的前三條結果聚集了絕大多數的用戶點擊。簡單來說，“好”的搜索算法是需要讓用戶獲取信息的效率更高、停留時間更短。

但是推薦恰恰相反，推薦算法和被推薦的內容（例如商品、新聞等）往往是緊密結合在一起的，用戶獲取推薦結果的過程可以是持續的、長期的，衡量推薦系統是否足夠好，往往要依據是否能讓用戶停留更多的時間（例如多購買幾樣商品、多閱讀幾篇新聞等），對用戶興趣的挖掘越深入，越“懂”用戶，那么推薦的成功率越高，用戶也越樂意留在產品里。

所以對大量的內容型應用來說，打造一個優秀的推薦系統是提升業績所不得不重視的手段。

馬太效應和長尾理論

馬太效應（Mattnew Effect）是指強者愈強、弱者愈弱的現象，在互聯網中引申為熱門的產品受到更多的關注，冷門內容則愈發的會被遺忘的現象。馬太效應取名自圣經《新約·馬太福音》的一則寓言： “凡有的，還要加倍給他叫他多余；沒有的，連他所有的也要奪過來?！?/p>

搜索引擎就非常充分的體現了馬太效應——如下面的Google點擊熱圖，越紅的部分表示點擊多和熱，越偏紫色的部分表示點擊少而冷，絕大部分用戶的點擊都集中在頂部少量的結果上，下面的結果以及翻頁后的結果獲得的關注非常少。這也解釋了Google和百度的廣告為什么這么賺錢，企業客戶為什么要花大力氣做SEM或SEO來提升排名——因為只有排到搜索結果的前面才有機會。

圖3：搜索引擎充分體現的馬太效應：頭部內容吸引了絕大部分點擊

有意思的是，與“馬太效應”相對應，還有一個非常有影響力的理論稱為“長尾理論”。

長尾理論（Long Tail Effect）是“連線”雜志主編克里斯·安德森（Chris Anderson）在2004年10月的“長尾”（Long Tail）一文中最早提出的，長尾實際上是統計學中冪率（Power Laws）和帕累托分布特征（Pareto Distribution）的拓展和口語化表達，用來描述熱門和冷門物品的分布情況。Chris Anderson通過觀察數據發現，在互聯網時代由于網絡技術能以很低的成本讓人們去獲得更多的信息和選擇，在很多網站內有越來越多的原先被“遺忘”的非最熱門的事物重新被人們關注起來。事實上，每一個人的品味和偏好都并非和主流人群完全一致，Chris指出：當我們發現得越多，我們就越能體會到我們需要更多的選擇。如果說搜索引擎體現著馬太效應的話，那么長尾理論則闡述了推薦系統發揮的價值。

評價方法的異同

搜索引擎通?；贑ranfield評價體系，并基于信息檢索中常用的評價指標，例如nDCG（英文全稱為normalized Discounted Cumulative Gain）、Precision-Recall（或其組合方式F1）、P@N等方法，具體可參見之前發表于InfoQ的文章《怎樣量化評價搜索引擎的結果質量陳運文》。整體上看，評價的著眼點在于將優質結果盡可能排到搜索結果的最前面，前10條結果（對應搜索結果的第一頁）幾乎涵蓋了搜索引擎評估的主要內容。讓用戶以最少的點擊次數、最快的速度找到內容是評價的核心。

推薦系統的評價面要寬泛的多，往往推薦結果的數量要多很多，出現的位置、場景也非常復雜，從量化角度來看，當應用于Top-N結果推薦時，MAP（Mean Average Precison）或CTR（Click Through Rate，計算廣告中常用）是普遍的計量方法；當用于評分預測問題時，RMSE（Root Mean Squared Error）或MAE（Mean Absolute Error）是常見量化方法。

由于推薦系統和實際業務綁定更為緊密，從業務角度也有很多側面評價方法，根據不同的業務形態，有不同的方法，例如帶來的增量點擊，推薦成功數，成交轉化提升量，用戶延長的停留時間等指標。

搜索和推薦的相互交融

搜索和推薦雖然有很多差異，但兩者都是大數據技術的應用分支，存在著大量的交疊。近年來，搜索引擎逐步融合了推薦系統的結果，例如右側的“相關推薦”、底部的“相關搜索詞”等，都使用了推薦系統的產品思路和運算方法（如下圖紅圈區域）。

在另一些平臺型電商網站中，由于結果數量巨大，且相關性并沒有明顯差異，因而對搜索結果的個性化排序有一定的運作空間，這里融合運用的個性化推薦技術也對促進成交有良好的幫助。

搜索引擎中融合的推薦系統元素

推薦系統也大量運用了搜索引擎的技術，搜索引擎解決運算性能的一個重要的數據結構是倒排索引技術（Inverted Index），而在推薦系統中，一類重要算法是基于內容的推薦（Content-based Recommendation），這其中大量運用了倒排索引、查詢、結果歸并等方法。另外點擊反饋（Click Feedback）算法等也都在兩者中大量運用以提升效果。

作者：陳運文，達觀數據CEO

本文由 @陳運文原創發布于人人都是產品經理。未經許可，禁止轉載。

題圖來自 unsplash

更多精彩內容，請關注人人都是產品經理微信公眾號或下載App