產品經理需要了解:推薦系統和搜索引擎的關系
本文作者結合自己的實踐經驗來為大家闡述推薦系統和搜索引擎兩者之間的關系、分享自己的體會。
從信息獲取的角度來看,搜索和推薦是用戶獲取信息的兩種主要手段。無論在互聯網上,還是在線下的場景里,搜索和推薦這兩種方式都大量并存,那么推薦系統和搜索引擎這兩個系統到底有什么關系?區別和相似的地方有哪些?
本文作者有幸同時具有搜索引擎和推薦系統一線的技術產品開發經驗,結合自己的實踐經驗來為大家闡述兩者之間的關系、分享自己的體會。
圖1:搜索引擎和推薦系統是獲取信息的兩種不同方式
主動或被動:搜索引擎和推薦系統的選擇
獲取信息是人類認知世界、生存發展的剛需,搜索就是最明確的一種方式,其體現的動作就是“出去找”,找食物、找地點等,到了互聯網時代,搜索引擎(Search Engine)就是滿足找信息這個需求的最好工具,你輸入想要找的內容(即在搜索框里輸入查詢詞,或稱為Query),搜索引擎快速的給你最好的結果,這樣的剛需催生了Google、百度這樣的互聯網巨頭。
但是獲取信息的方式除了搜索外,還有另一類,稱為推薦系統(Recommendation System,簡稱Recsys),推薦也是伴隨人類發展而生的一種基本技能,你一定遇到這樣的場景,初來乍到一個地方,會找當地的朋友打聽“嗨,請推薦下附近有啥好吃好玩的地方吧!”——知識、信息等通過推薦來傳播,這也是一種獲取信息的方式。
搜索和推薦的區別如圖1所示,搜索是一個非常主動的行為,并且用戶的需求十分明確,在搜索引擎提供的結果里,用戶也能通過瀏覽和點擊來明確的判斷是否滿足了用戶需求。然而,推薦系統接受信息是被動的,需求也都是模糊而不明確的。以“逛”商場為例,在用戶進入商場的時候,如果需求不明確,這個時候需要推薦系統,來告訴用戶有哪些優質的商品、哪些合適的內容等,但如果用戶已經非常明確當下需要購買哪個品牌、什么型號的商品時,直接去找對應的店鋪就行,這時就是搜索了。
圖2:從搜索詞中可以看出,用戶有大量個性化推薦的需求
很多互聯網產品都需要同時滿足用戶這兩種需求,例如對提供音樂、新聞、或者電商服務的網站,必然要提供搜索功能,當用戶想找某首歌或某樣商品的時候,輸入名字就能搜到;與此同時,也同時要提供推薦功能,當用戶就是想來聽好聽的歌,或者打發時間看看新聞,但并不明確一定要聽哪首的時候,給予足夠好的推薦,提升用戶體驗。
個性化程度的高低
除了主被動外,另一個有趣的區別是個性化程度的高低之分。搜索引擎雖然也可以有一定程度的個性化,但是整體上個性化運作的空間是比較小的。因為當需求非常明確時,找到結果的好壞通常沒有太多個性化的差異。例如搜“天氣”,搜索引擎可以將用戶所在地區的信息作補足,給出當地天氣的結果,但是個性化補足后給出的結果也是明確的了。
用戶對信息的個性化需求
但是推薦系統在個性化方面的運作空間要大得多,以“推薦好看的電影”為例,一百個用戶有一百種口味,并沒有一個“標準”的答案,推薦系統可以根據每位用戶歷史上的觀看行為、評分記錄等生成一個對當前用戶最有價值的結果,這也是推薦系統有獨特魅力的地方。雖然推薦的種類有很多(例如相關推薦、個性化推薦等),但是個性化對于推薦系統是如此重要,以至于在很多時候大家干脆就把推薦系統稱為“個性化推薦”甚至“智能推薦”了。
快速滿足還是持續服務?
開發過搜索引擎的朋友都知道,評價搜索結果質量的一個重要考量指標是要幫用戶盡快的找到需要的結果并點擊離開。在設計搜索排序算法里,需要想盡辦法讓最好的結果排在最前面,往往搜索引擎的前三條結果聚集了絕大多數的用戶點擊。簡單來說,“好”的搜索算法是需要讓用戶獲取信息的效率更高、停留時間更短。
但是推薦恰恰相反,推薦算法和被推薦的內容(例如商品、新聞等)往往是緊密結合在一起的,用戶獲取推薦結果的過程可以是持續的、長期的,衡量推薦系統是否足夠好,往往要依據是否能讓用戶停留更多的時間(例如多購買幾樣商品、多閱讀幾篇新聞等),對用戶興趣的挖掘越深入,越“懂”用戶,那么推薦的成功率越高,用戶也越樂意留在產品里。
所以對大量的內容型應用來說,打造一個優秀的推薦系統是提升業績所不得不重視的手段。
推薦系統滿足難以文字表述的需求
目前主流的搜索引擎仍然是以文字構成查詢詞(Query),這是因為文字是人們描述需求最簡潔、直接的方式,搜索引擎抓取和索引的絕大部分內容也是以文字方式組織的。
因為這個因素,我們統計發現用戶輸入的搜索查詢詞也大都是比較短小的,查詢詞中包含5個或5個以內元素(或稱Term)的占總查詢量的98%以上(例如:Query“達觀數據地址”,包含兩個元素“達觀數據”和“地址”)。
但另一方面,用戶存在著大量的需求是比較難用精煉的文字來組織的,例如想查找“離我比較近的且價格100元以內的川菜館”、“和我正在看的這條裙子同款式的但是價格更優惠的其他裙子”等需求。
一方面幾乎沒有用戶愿意輸入這么多字來找結果(用戶天然都是愿意偷懶的),另一方面搜索引擎對語義的理解目前還無法做到足夠深入;所以在滿足這些需求的時候,通過推薦系統設置的功能(例如頁面上設置的“相關推薦”、“猜你喜歡”等模塊),加上與用戶的交互(例如篩選、排序、點擊等),不斷積累和挖掘用戶偏好,可以將這些難以用文字表達的需求良好的滿足起來。
形象的來說,推薦引擎又被人們稱為是無聲的搜索,意思是用戶雖然不用主動輸入查詢詞來搜索,但是推薦引擎通過分析用戶歷史的行為、當前的上下文場景,自動來生成復雜的查詢條件,進而給出計算并推薦的結果。
馬太效應和長尾理論
馬太效應(Mattnew Effect)是指強者愈強、弱者愈弱的現象,在互聯網中引申為熱門的產品受到更多的關注,冷門內容則愈發的會被遺忘的現象。馬太效應取名自圣經《新約·馬太福音》的一則寓言: “凡有的,還要加倍給他叫他多余;沒有的,連他所有的也要奪過來?!?/p>
搜索引擎就非常充分的體現了馬太效應——如下面的Google點擊熱圖,越紅的部分表示點擊多和熱,越偏紫色的部分表示點擊少而冷,絕大部分用戶的點擊都集中在頂部少量的結果上,下面的結果以及翻頁后的結果獲得的關注非常少。這也解釋了Google和百度的廣告為什么這么賺錢,企業客戶為什么要花大力氣做SEM或SEO來提升排名——因為只有排到搜索結果的前面才有機會。
圖3:搜索引擎充分體現的馬太效應:頭部內容吸引了絕大部分點擊
有意思的是,與“馬太效應”相對應,還有一個非常有影響力的理論稱為“長尾理論”。
長尾理論(Long Tail Effect)是“連線”雜志主編克里斯·安德森(Chris Anderson)在2004年10月的“長尾”(Long Tail)一文中最早提出的,長尾實際上是統計學中冪率(Power Laws)和帕累托分布特征(Pareto Distribution)的拓展和口語化表達,用來描述熱門和冷門物品的分布情況。Chris Anderson通過觀察數據發現,在互聯網時代由于網絡技術能以很低的成本讓人們去獲得更多的信息和選擇,在很多網站內有越來越多的原先被“遺忘”的非最熱門的事物重新被人們關注起來。事實上,每一個人的品味和偏好都并非和主流人群完全一致,Chris指出:當我們發現得越多,我們就越能體會到我們需要更多的選擇。如果說搜索引擎體現著馬太效應的話,那么長尾理論則闡述了推薦系統發揮的價值。
推薦系統和長尾理論
一個實際的例子就是亞馬遜(Amazon)網絡書店和傳統大型書店的數據對比。市場上出版發行的圖書種類超過了數百萬,但是其中大部分圖書是無法在傳統大型書店上架銷售的(實體店鋪空間有限),而能放在書店顯著位置(例如暢銷書Best Seller貨架)上的更是鳳毛麟角,因此傳統書店的經營模式多以暢銷書為中心。但是亞馬遜等網絡書店的發展為長尾書籍提供了無限廣闊的空間,用戶瀏覽、采購這些長尾書籍比傳統書店方便得多,于是互聯網時代銷售成千上萬的小眾圖書,哪怕一次僅賣一兩本,但是因為這些圖書的種類比熱門書籍要多得多,就像長長的尾巴那樣,這些圖書的銷量積累起來甚至超過那些暢銷書。正如亞馬遜的史蒂夫·凱賽爾所說:“如果我有10萬種書,哪怕一次僅賣掉一本,10年后加起來它們的銷售就會超過最新出版的《哈利·波特》!”
長尾理論作為一種新的經濟模式,被成功的應用于網絡經濟領域。而對長尾資源的盤活和利用,恰恰是推薦系統所擅長的,因為用戶對長尾內容通常是陌生的,無法主動搜索,唯有通過推薦的方式,引起用戶的注意,發掘出用戶的興趣,幫助用戶做出最終的選擇。
盤活長尾內容對企業來說也是非常關鍵的,營造一個內容豐富、百花齊放的生態,能保障企業健康的生態。試想一下,一個企業如果只依賴0.1%的“爆款”商品或內容來吸引人氣,那么隨著時間推移這些爆款不再受歡迎,而新的爆款又沒有及時補位,那么企業的業績必然會有巨大波動。
只依賴最熱門內容的另一個不易察覺的危險是潛在用戶的流失:因為只依賴爆款雖然能吸引一批用戶(簡稱A類用戶),但同時也悄悄排斥了對這些熱門內容并不感冒的用戶(簡稱B類用戶),按照長尾理論,B類用戶的數量并不少,并且隨時間推移A類用戶會逐步轉變為B類用戶(因為人們都是喜新厭舊的),所以依靠推薦系統來充分滿足用戶個性化、差異化的需求,讓長尾內容在合適的時機來曝光,維護企業健康的生態,才能讓企業的運轉更穩定,波動更小。
評價方法的異同
搜索引擎通?;贑ranfield評價體系,并基于信息檢索中常用的評價指標,例如nDCG(英文全稱為normalized Discounted Cumulative Gain)、Precision-Recall(或其組合方式F1)、P@N等方法,具體可參見之前發表于InfoQ的文章《怎樣量化評價搜索引擎的結果質量 陳運文》。整體上看,評價的著眼點在于將優質結果盡可能排到搜索結果的最前面,前10條結果(對應搜索結果的第一頁)幾乎涵蓋了搜索引擎評估的主要內容。讓用戶以最少的點擊次數、最快的速度找到內容是評價的核心。
推薦系統的評價面要寬泛的多,往往推薦結果的數量要多很多,出現的位置、場景也非常復雜,從量化角度來看,當應用于Top-N結果推薦時,MAP(Mean Average Precison)或CTR(Click Through Rate,計算廣告中常用)是普遍的計量方法;當用于評分預測問題時,RMSE(Root Mean Squared Error)或MAE(Mean Absolute Error)是常見量化方法。
由于推薦系統和實際業務綁定更為緊密,從業務角度也有很多側面評價方法,根據不同的業務形態,有不同的方法,例如帶來的增量點擊,推薦成功數,成交轉化提升量,用戶延長的停留時間等指標。
搜索和推薦的相互交融
搜索和推薦雖然有很多差異,但兩者都是大數據技術的應用分支,存在著大量的交疊。近年來,搜索引擎逐步融合了推薦系統的結果,例如右側的“相關推薦”、底部的“相關搜索詞”等,都使用了推薦系統的產品思路和運算方法(如下圖紅圈區域)。
在另一些平臺型電商網站中,由于結果數量巨大,且相關性并沒有明顯差異,因而對搜索結果的個性化排序有一定的運作空間,這里融合運用的個性化推薦技術也對促進成交有良好的幫助。
搜索引擎中融合的推薦系統元素
推薦系統也大量運用了搜索引擎的技術,搜索引擎解決運算性能的一個重要的數據結構是倒排索引技術(Inverted Index),而在推薦系統中,一類重要算法是基于內容的推薦(Content-based Recommendation),這其中大量運用了倒排索引、查詢、結果歸并等方法。另外點擊反饋(Click Feedback)算法等也都在兩者中大量運用以提升效果。
作者:陳運文,達觀數據CEO
本文由 @陳運文 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 unsplash
棒棒噠
受教