個性化推薦從入門到精通(附推薦產品經理修煉秘籍)
你的公司是否適合采用個性化推薦?如果需要個性化推薦,該如何做好?產品運營在參與到一個推薦系統的構建當中,有哪些常見的坑?有哪些可以避開這些坑的一些簡單方法?
今天的分享將為大家解答以下幾個問題:你的公司是否適合采用個性化推薦?如果需要個性化推薦,該如何做好?產品運營在參與到一個推薦系統的構建當中,有哪些常見的坑?有哪些可以避開這些坑的一些簡單方法?以及如何修煉成一個優秀的推薦產品經理?
一、“四個關鍵”為你揭開推薦系統的神秘面紗
個人認為,推薦系統是根據用戶以及不同的場景差異,對信息進行合理的排序、過濾,解決信息過載問題的一套機制。這個定義中包含四個關鍵點,如下:
1.“根據用戶以及不同的場景差異”
對于很多剛開始做推薦的人可能會忽略這一點,大部分人在思考推薦時想的更多的可能是基于用戶來做,但其實我從眾多實踐中發現,很多時候推薦產生價值不僅僅只是說以用戶進行區分,相關場景的差異會對于最后推薦效果產生巨大的影響。
2.“推薦的本質是對信息進行合理的排序、過濾”
很多人認為推薦是一個魔盒,非常神奇,其實究其本質是企業有成千上萬甚至上億的 item,不管這些 item 是文章、視頻,還是電商里面的商品,然后現在有某個人在一個具體的場景里面,企業需要把這些 item 給他看,那應該把哪個放在第一個?這就是推薦系統背后的運作原理。
3. “推薦系統要解決信息過載的問題”
舉個例子,如果你的企業只做爆款商品,整個公司只賣兩個商品,這樣用戶一看就明白了,顯然也不需要推薦,所以做推薦的一個前提條件是你公司本身提供的業務里面的信息太多了,對于一個正常的自然人來說,他處理不了那么多信息的時候,企業才需要去幫助用戶解決信息過載的問題,從而為用戶設計這樣一套機制。
4.“一套機制”
這點很好理解,推薦系統是由不同的算法、規則等構成的一套機制。這四點是我從產品視角為你解讀了什么是推薦系統,以及他的一些簡單作用。
二、推薦系統、廣告系統、搜索系統三者有何不同?
事實上,解決我在前面提到的一系列問題,推薦系統并不是唯一的方法。
比如,前面所提到的排序、過濾,做技術的同學應該很容易聯想到,搜索和廣告系統也涉及排序、過濾,且搜索也一定程度上解決了信息過載。那么,這三個系統,它到底有什么區別呢?
我從 5 個方面對其進行了對比,下面將一一講述:
1. 用戶獲取信息的方式。
廣告與推薦系統,用戶都是被動的,但搜索不一樣,用戶是主動搜索的,他需要輸入一些關鍵詞,會加入一些自己的意見和重點。
2. 點擊率要求。
這三個系統對點擊率都有要求,僅在要求上有些區別,這就不詳述了。
3. 驚喜度要求。
對于廣告和搜索系統來說,不需要太多的驚喜度。比如,如果我搜一個關鍵詞,搜索到我想要的資料時,并不會覺得很驚喜,甚至認為是理所當然,但是在推薦系統里,用戶往往對驚喜度是有要求的。
具體來說,用戶對于一個推薦系統的期望是希望產品能夠給他們一些驚喜,如用戶 A 雖然不知道產品用了什么數據、什么方法,但如果突然推薦了一首可能他已經快遺忘的自己卻很喜歡的歌時,他就會因感到產品“好懂我”而驚喜。
4. 個性化要求。
在廣告和搜索系統,個性化的需求是可有可無的,不管有沒有系統也能正常運作。但是,對于推薦系統來說,個性化要求非常高,甚至越高越好。因為個性化推薦針對的是差異化的單個場景,一定會有個性化的要求。
5. 用戶反饋。
廣告和搜索系統存在比較隱性的反饋,即對于搜索結果好不好?一般很少有搜索引擎廠商會直接問用戶,你喜不喜歡搜索結果,更多是廠商去判定廣告效果和搜索效果,一般是通過 CTR,或通過整個產品的某些長期留存表現來判定。但是,對于推薦系統來說,很多推薦產品會直接地問用戶的喜好,存在很明顯的顯性主觀表達。
因此,同樣是解決類似的一系列問題。 但是這三個不同的系統存在極大的差異(如下圖),這些區別直接決定了企業去判斷某個業務適不適合使用個性化推薦,以及該如何做好個性化推薦。
三、什么樣的產品或業務適合采用個性化推薦?
個人認為,具有媒體性的產品(Media Product)適合使用個性化推薦,這里指的不是只有與媒體相關的才能使用推薦,公司業務為電商的就不行,其實它只是一個概念,包含四個點,但不一定要同時滿足,下面我將一一解說。
1. 口味很重要(Taste)
產品中的 Taste 本身很重要。舉個例子,網上曾有一個很火的梗,在淘寶搜索連衣裙,排在第二位的連衣裙價格,代表了在整個淘寶體系里判定你個人的客單價范圍。我們當時試了一下,發現一個特別有趣的現象,就是一般女生搜索出來的價格都會很低,大概一兩百元,而我和一些男同事搜索出來會高很多,如我搜索的基本上是一千八左右的連衣裙,仔細想一想也有原因,像女生天天逛淘寶,大大小小什么商品都買,但我上淘寶基本上都是要買相機、電腦,這些價格都在幾千或上萬元。很容易發現,我們所有人對于買的東西的方向和口味是有差異的。
事實上除了存在差異還存在要求,很多人不希望被一個平臺判定其口味是某個方向。比如一個具備推薦系統的網站總給你推薦一些下三濫、低俗的東西,他會想“天哪!我是這樣一個人嗎?”因此,大家對于一個平臺的口味和自己的口味都是有要求的。
2. 單位成本不重要(Cost)
“單位成本不重要”我們可以通過這個例子來理解,比如以前我們每天看報紙,因為報紙的單價較便宜,對應到現在的產品,比如我聽一首歌、看一篇文章、買一個常規的商品,你的消費行為的 cost 消耗都不高,且不那么重要。
3. 有瀑布效應(Information Cascade)
瀑布效應指的是,一旦在社區或平臺里產生了一個趨勢,那么整個平臺的其他人都會跟隨這個趨勢,比如,微博上轉發超過三四千的動態,可能會慢慢地被轉發的更多,整個社區會形成這樣的一些趨勢和傾向,瀑布效應在平臺和社區較容易形成。
4. 多樣性(Diversity)
這一點指的是你的平臺的內容本身是具有多樣性的,這是推薦的基礎。如果整個平臺的內容在各種維度、屬性上都一致,那么很難做推薦。
基本上,只要滿足以上 1-2 個點,我們就可以說它是一個偏媒體型的產品。這方面一個很經典的例子,我們可以看下圖,在圖中的王守崑是原來負責豆瓣最早的推薦系統的架構師,這是他在很早之前分享中的一頁 PPT,我覺得這是講一個產品適不適合上推薦最直觀的一個例子。
當時他們在做豆瓣推薦的時候,首先思考到底應該優先在什么頻道上推薦,為此設置了一個判斷的標準,開始列一些指標,如下:
豆瓣會根據各個頻道的用戶數、條目數(豆瓣收錄的圖書、電影、音樂多少)計算稀疏性,比如圖書的條目數是 300 萬,同時記錄圖書用戶群體人均會在豆瓣收藏幾本書(點看過的視為收藏),豆瓣用人均的看過的次數除以總的條目數算出的值叫做稀疏性。
如果一個產品稀疏性太低,那么繼續使用現行的推薦系統的相關算法就會出現問題,因為整個待推薦的內容面臨很大的群體,如果每一個人喜歡的東西太少時,他就會散落在整個大群體的各個方面,你很難找到人和人之間具體的關系,因為每個人在整個系統里面的表達興趣太少了。因此,稀疏性低的產品做推薦,要么是工程難度比較高,那么效果可能不太好,一般說稀疏性高一點的產品更容易找到人與人之間契合的東西,當然稀疏性也不能過高,如果稀疏性達到百分之八九十,那所有的用戶可能就過于相似,所以豆瓣比較強調稀疏性。
關于多樣性,有一個有趣的點需要注意。比如圖書的多樣性高,大家可能理解圖書僅根據一個偵探小說就能分出幾十個類型;電影的多樣性低,好像和常規的理解不一樣,事實上因為電影現在是高度工業化和商業化的產品,他們的類型聚集度是相當高的。所以這給了大家一個啟示,在判斷自身產品時,不要完全憑直覺,而要真的拿自己公司的實際數據說話。
時效性很好理解,我就不解釋了。反饋是指在某個品類中,企業做出一個推薦行為,用戶什么時候能給企業一個反饋,也就是用戶表達自己喜好的反饋時間周期是快還是慢。比如圖書就會很慢,讀完可能需要十天半個月,拖延癥的人可能還要讀半年左右;文章就會很快,只要點我的文章就可以定義為偏好,把這篇文章滾動到底就是喜歡;音樂也是,聽完就是喜歡,很快跳過就是不喜歡。
最后,豆瓣會綜合前面所有的這些維度屬性來判斷推薦效果。在圖中他們認為推薦效果最好的是單曲,原因是單曲的稀疏性特別高,雖然多樣性相對來說低級別,但是因為稀疏性高,加上反饋周期特別快,綜合起來效果最好。事實上,這也是為什么大家在互聯網的花花世界中,還能記得豆瓣 FM 這個產品。不過,豆瓣在其他方面的推薦效果也不錯,比如圖書。
以上,就是豆瓣當時內部的一個評估過程,揭示了企業想要做一個推薦產品的時,到底該如何去衡量這個業務適不適合做,效果將怎樣,需要定一個衡量的標準。
四、以商業為目的,推薦要做成什么樣?
推薦的商業目的一般分為以下幾種:
1. 用計算機經驗取代運營經驗(節省成本、提高效率)
這一點非常重要,很多人提到推薦系統會認為是由公司的技術部門負責,像變魔法一樣,就把某個事情從人工運營變成了機器運營,然后運營的同學就好像沒活干了,但事實不是如此,其實本質上來說它是取代運營經驗,但是有個前提條件是你們公司本來有運營經驗,我很少見到公司使用推薦系統是完全拋開運營團隊,單靠技術團隊自己的力量,把推薦系統運作得很好。
事實上,我們可以這樣理解這一點:運營積累了一些經驗,但是只能通過運營人工的進行一次次干預,這樣往往只能對整個區域進行干預,沒有辦法把經驗落地到每一個具體的用戶身上,干預每一個用戶的體驗還是很難。因此,推薦系統就可以幫助解決提升每個用戶的體驗問題。
2. 充分利用流量(提高變現能力)
事實上,很多企業的產品設計以及各種運營方案,可能只能解決眾多流量的其中 60% 的需求,另外 40% 的需求被忽略了,或者是不得不忽略,因為企業沒有辦法給每一個用戶或者每一群用戶單獨配一個運營。此時,推薦系統就可以起到類似分流量的精細化運營的作用。
3. 促進信息流動(留住小眾用戶)
這個價值點可能很多企業沒有注意到,因為大多數想使用個性化推薦的公司,都在考慮公司如何賺錢?或用戶如何能得到更好的體驗?但是,很多產品的推薦系統還有一個很重要的作用是促進信息流動,從而留住小眾用戶。在很多形態的產品中,不管是社區型的產品,還是電商型的產品,它都會存在一些商品,如果產品的機制運營的不錯,這些商品會在短時間之內成為整個社區的話題和爆款。
但是可能社區本身的積淀或產品的話題程度,不可能讓它持續地成為話題,但是一定要制造話題,因為其一可以彰顯整個社區多樣性,其二小眾的群體也覺得自己能在大平臺得到展現,會更容易留下來,但如果整個社區缺乏這種能力,展示在推薦位置的永遠是熱門的大眾內容,那么長尾的小眾社區、小眾用戶、小眾商品就會涌入其他平臺,企業便很難養起來那一部分的風。
回到當下來看,像抖音這樣的產品,為什么能夠讓那么多人參與進去?核心在于聚集了多樣化的用戶,比如經常在抖音上看到一些播放量、點贊量都是幾十萬的用戶,你點進去他的主頁來看歷史的視頻播放,你會發現這個用戶可能只有那一個視頻幾十萬,其他的視頻只有幾百、幾千的播放量。但這就是推薦系統的魅力,用戶不需要一直是一個大 V,只要偶爾一個內容能夠成為爆款,那么平臺就能夠把這類用戶篩選出來,讓他吸引更多的人參與進來,而避免說被少數的大 V、頭部流量把整個平臺給遏制住,這是一個比較有意思的商業目的。
五、產品、運營必知的推薦系統算法
這里是針對常見的一些做推薦的基礎思想和算法進行簡單的掃盲(之后神策數據公眾號會有一篇文章“推薦系統的實踐與思考”會對最新的一些推薦系統的架構構建進行專門的介紹),以下三種是比較常見的:
協調過濾(CF)、隱語義模型(LFM)、優勢排行(Edgerank),我們最常見到的是CF、其中 Edgerank 主要用于類似 Facebook 做社交的企業。
1. 協調過濾(CF)
事實上,大部分的推薦系統的本質是“物以類聚,人以群分”,思路大概可分為兩個方面:其一,研究物品,即研究被推薦系統推薦的 item 進行推薦,被稱為基于物品的推薦(Item-based);其二,研究人,即根據人的喜好進行推薦,被稱為基于用戶的推薦(User-based)。
基于物品的協同過濾是什么意思呢?舉個例子,某個電商企業的商品 i 和 j 被同一類人喜歡,因此可以將其歸為一類,當用戶 u 喜歡 i 但是沒有看過 j,就可以把 j 推薦給 u。
基于用戶的協同過濾又是什么意思呢?前面提到的物品的協同過濾是先把物品歸為一類,然后再推薦相同類的,而基于用戶的協調過濾是我們先分析用戶。舉個例子,我們把用戶 A 和 B 歸為一類,然后,就可以把 B 喜歡的商品,A 還沒看過的 i 也推薦給 A。
2. 隱語義模型(LFM)
隱語義模型相對協同過濾會復雜一些,但是本質上也較相似,這根據用戶的行為和物品的特征,用機器學習的方法先把物品進行分類,然后再計算用戶 A 對每一個類別的興趣程度。舉個例子,某個企業通過機器學習把物品分成了十個類,然后該企業計算用戶 A 對每個類別的興趣程度,可以劃分為 1、0.8、0.7、0.5、0.3 等。之后,企業繼續計算一個物品 i 對于每個類別的權重,也就是物品 i 到底該被劃分到哪個類別,最后,企業根據這兩個信息和權重計算出用戶對物品 i 的喜愛程度。相比協同過濾,LFM 分的更精細,事實上,現實中不管是人的屬性還是物品的屬性都千差萬別,很難通過單純的把物品或人分為一類就能滿足推薦的需求。
3. 優勢排行(Edgerank)
Edgerank 是 Facebook 完全基于自身信息流分發構建的一個算法。這能幫助大家理解有時候推薦算法不是簡單采用市面上恒定的算法,而要根據公司實際的需求調整。Edgerank 會算三個指標:親密度(Affinity Score)、邊的權重(Edge Weight)、新鮮程度(Time Decay)。
親密度(Affinity Score)。比如用戶 A 發了一些文字信息、視頻、圖片等,用戶 B 從一些第三方應用分享的這些文字、視頻、圖片來到用戶 A 的信息流,Facebook 就會首先算用戶 B 與用戶 A 的親密程度(同學?情侶?曾經互動過?),通過系統來計算出 AS 的親密度分數,當判定為存在親密度,就會再計算邊的權重。
邊的權重(Edge Weight)。這指的是用戶 B 通過什么樣子的邊連接到你,是圖片?文字?還是通過分享自己喜歡的文章,像這種不同的連接類型,叫做邊。 邊的權重的不同會幫助更好的推薦。舉個例子,如果發現 Facebook 的用戶更喜歡看照片,照片的邊的權重就會更高;如果用戶總發一些沒有營養的雞湯文,這些文章邊的權重就會下降。
新鮮程度(Time Decay)指的是內容本身的發布時間的早晚,越近發布的權重會越高。
Facebook 會綜合這三個指標給用戶做推薦,但是對大多數企業來說無法直接套用,因為這是根據 Facebook 自身信息流的分發需求提煉出的影響因子。
之所以為大家介紹這三種模型,是想讓大家簡單了解現在做推薦的常規手段,但事實上現在的工程實踐遠比上面的這些基礎模型復雜,我們再來看一下推薦系統的架構圖,這不是純技術角度的架構圖,比較偏產品視角。事實上,做推薦系統往往是一個過程,通過多種算法得到一個初步結果,然后再對初步結果進行過濾、排序,再生成一些推薦原因,最后展示推薦結果。在整個過程里面,產品運營參與的環節也比較多,這就是我的一個理解。
六、個性化推薦產品經理的修煉秘籍
做推薦系統往往不是一蹴而就的,中間會有很多失敗的因素。我認為常見的失敗原因主要分為三個方向:數據質量、太過魯莽、不理解用戶。
很多公司讓我幫忙判斷是否適合做推薦時,往往發現公司在數據層面上沒有什么積累。比如有些企業完全沒有統一的地方存儲用戶信息,可能分散在不同系統、不同部門。這導致做推薦建模時,完全不知道數據在哪找。
還有些企業用戶的行為信息保存太少,基本上只有一些關鍵交易信息保留,但整個交易的前置環節,比如用戶在首頁搜索哪些關鍵詞?在一個頁面詳情頁上反復瀏覽了幾次?是否添加購物車?是否使用優惠券?類似這些信息全部沒有保存。雖然推薦系統中的某些關鍵行為非常重要,但是大部分的推薦系統中的關鍵行為極少。
對于推薦系統來說,數據越多越好。很多公司,你會發現其用戶行為數據收集的相當少。除此之外,當我幫他們把數據找全了想合到一起來使用,卻發現合不到一起。比如,公司的瀏覽數據沒有記錄 UID,直接只記錄了網站上的 cookie,因此只能用 cookie 來判定用戶訂單,但訂單后臺直接記錄了用戶的 UID 或訂單號,多個數據源之間沒有統一的 ID 識別機制,企業無法把用戶的行為數據、業務數據連通。 這些主要是數據質量導致推薦系統失敗的原因,缺少一個好的數據基礎打地基。
過于魯莽和不理解用戶也是企業會常犯的錯誤,這些會在下面的秘籍中體現。
秘籍 1 :明確推薦場景
當大家做推薦系統時,一定要想明白推薦的場景是什么?頭條因個性化推薦而爆火,很多人一想到推薦可能就是信息流,這就是過于魯莽的判定,但其實推薦場景有很多,比如信息流、猜你喜歡、關聯推薦以及針對不同的用戶推薦不同的產品界面等。
舉個例子,現在同樣的一個產品,可能 Web 端、移動端都有入口,甚至還存在車載設備的入口等。那么,同樣的產品功能,在這三個場景下給用戶推薦肯定應該有所不同,而且往往是當產品、運營認知到了這種區別之后,反饋到算法部門,讓他們進行調整最終得到某些效果進行對比,不難發現對于這點,認知的經驗效果遠比調節算法的細節來得更加有用。
另一個典型的例子是用戶在售前、售中、售后的不同場景,針對其整個作用的方向不一樣。
比如,企業做商品推薦,在售前應該推薦什么商品,能把用戶的興趣激發出來?售中有什么策略能促進用戶盡快下單?售后又該怎么做?如果用戶剛剛買了一個電視機,又被推薦買另外一個電視機,就是一個典型的糟糕的推薦場景。事實上,用戶處在不同周期,推薦算法要解決的問題是不一樣的,推薦邏輯也隨之不同,所以推薦算法要根據用戶在你產品的生命周期進行不同的設計。
秘籍 2:明確目標
這一點指的是推薦系統能解決的問題,個人認為,可以分為從眾、興趣、發現三個方向。
解決從眾的需求
很多人認為“從眾”是貶義詞,事實上,我們大部分人從生理和心理上都有從眾的需求,因為從眾是人追求安全感的一個體現,所以推薦系統首先解決從眾需求。比如,讓產品的推薦能告訴用戶在這個社區里面現在最流行什么,來幫助其跟隨潮流,從而獲得歸屬感和安全感,這個需求通常是穩定的,而且非常重要。
解決興趣的需求
簡單來說,這個平臺上有很多內容,但時間、精力有限,用戶只想看與自己興趣相關的。
解決發現的需求
如果產品上的內容我看的差不多了,有沒有點新鮮的內容,這就是發現的需求。比如,我是一個愛好做模型的人,但該網站上關于模型的內容已經看的差不多了,網站給我推薦了一些我可能感興趣,但不是模型相關的內容來解決我發現的需求。
以上就是推薦系統解決的三方面需求目標,不同的目標與之相關的要求也不一樣。
對于從眾的需求來說,企業希望用戶的滿意度非常高。當你推薦的流行內容如果被用戶發現不是最近流行的,用戶的滿意度就會很低。然而,對于發現的需求來說,企業對滿意度要求就沒有那么高,用戶自己的預期也不會那么高,所以有時候對于發現的需求,企業為用戶推薦錯一個或者推薦一個沒那么滿意的東西,用戶很可能會認為機器猜錯了很正常,不會介意。
就推薦準確率而言,從眾一般準確率較低,因為用戶不會對所有流行的內容都會仔細查看,但是,興趣的準確率就要求很高。對于覆蓋率,從眾因為是迎合整個社區的潮流需求,覆蓋率肯定是低的。而興趣因為針對不同的人來覆蓋不同的興趣,覆蓋的會越來越多。發現往往能使產品中很多可能冷門的庫存內容重新得到展示。以此類推,多樣性、新穎性、驚喜度也是類似。
因此,如果你的企業使用推薦系統,從這個三個方向,最后的考核指標完全不一樣。舉個例子,我們經常聽到產品現在的目標是提高用戶收聽時長,但逐漸會發現產品處于不同階段,推薦的目標是完全不一樣的,就個人經驗總結,一個正常產品的發展軌跡往往如下圖。
推薦系統一般最開始都是為了解決從眾的需求,也就是如何把社區中流行、熱門的內容盡可能地通過推薦系統篩選出來,讓更多的人來看。然后慢慢地用戶增加,產品內容越來越豐富,便需要做更精細化的運營,這個階段更注重推薦系統解決單個群體或單個用戶的興趣需求。最后,產品在后期逐漸穩定時便要著手于發現。
舉個例子,機核網是神策數據的一個客戶,一個專注游戲文化的媒體網站,我是其忠實用戶,第一次接觸時,我被網站上的深度文章所吸引,我花了大概半年多的時間,把歷史文章、電臺、視頻內容都看了一遍,這個時候作為一個老用戶,已經把我興趣范圍之內的東西探索的差不多了,產品提供的價值受到了限制,這個時候企業便需要使用推薦系統去解決和發現一些需求,如何讓這一批老用戶能夠在產品中找到一些新東西,激發新的需求變得非常重要。所以,往往做推薦系統會分為幾個階段。
秘籍 3:大膽拍腦袋
在工作中,很多時候不可避免的需要拍腦袋。下圖是 Facebook 的首席產品官 Chris Cox 說的一句話。
大概意思是,在最開始,News feedranking 是 Facebook 最核心的時間流,他們像扳開關一樣,有時認為圖片的權重不夠高,就把圖片權重調高一點,然后把故事權重調低一點。比如可能一個圖片值五分,如果一個用戶加入某個小組只值一分。事實上,給這些行為打 5 分與 1 分沒有特別科學的說法,但是,剛開始一定要大膽的拍腦袋,而不是大家都停在一個點,什么都不做。
有時候做推薦系統,關于某些關鍵行為的權重該如何設置的問題,如果產品運營完全不參與,把這個問題推給技術,技術有時候對業務的理解沒有那么深,他可能傾向于用一個很復雜的算法來算權重。
當然,最好的方式更多還是需要產品給技術更多的輸入。如果產品告訴技術,在產品里面用戶很喜歡圖片,可以先把圖片權重調高一點,把故事權重調低一點,技術按照這個規則先嘗試一下,事實上,在推薦系統整個開發迭代過程中經常會反復的調高調低權重,并且在這個實踐應用過程中也會發現其中的優劣勢。
再舉個例子,之前我在 A 站早期帶 A 站的時候,因為當時還較小,養不起一個算法團隊,所以我們買了市面上的一些黑盒推薦服務,企業只需要提供數據,服務商就可以把推薦結果給你,最終發現效果特別差,而且你想做相關的調整把某個受歡迎的頻道權重調高一點,但因為是純黑盒推薦,企業自身根本無法直接調整,或企業給服務商提需求,可能需要等幾個月才能拿到結果,那么推薦的最終效果就很難保證。所以即使市面上有很多黑盒推薦,接入成本也比較低,但企業會發現推薦系統不是一個接入一次就完成的事情,推薦系統需要在這個過程中不斷地去調整,不斷地根據業務去反饋。
因此,企業在拍腦袋的時候,需要產品和運營定義到底哪些「用戶行為」更重要、或者意味著什么,這是靠機器無法做的。比如,用戶看一篇文章滾動到底部,機器并不會認為這有什么價值,但我們會認為該用戶對這篇文章真的感興趣。也就是一個無用的信息,加入了人工的判斷認知之后,就可能變成在整個推薦系統里很關鍵的信號。
這個系統里還有很多這種類似的行為需要人為的給這些行為打上一個標記,判定為喜歡或不喜歡的信號,這種信號極其重要,不是大家想象的推薦是根據一些很明確的行為定義的,很多用戶的喜歡和不喜歡判斷都不是用戶主動表達出來的,都是依靠產品、運營、技術一起研究業務、用戶流程推斷出來的。
那么行為如何彰顯喜歡程度或者討厭程度呢?舉個例子,對于電商產品,通常會認為一個用戶對于商品的興趣表達公式是:購買遠大于收藏,收藏大于瀏覽。在做推薦系統時,這些權重就需要考慮進去。
秘籍 4:反復檢閱推薦結果
企業不是只要推薦系統上線就可以了,還需要反復檢閱推薦結果。一般檢閱分兩種:離線和在線。
第一個是在線的檢閱。在線檢閱的核心是企業要理解用戶的行為模式,產品要像用戶一樣去用自身的產品以及推薦模塊,設身處地感受一下現在推薦的內容是否是自己想要的,如果推薦的內容不是想看的,就需要和運營、技術溝通,為什么這次推薦的是一個我不想看的內容,就是你要把推薦放到一個實際的場景里,真正地自己去體會去理解用戶的行為。
第二個是離線的檢閱。過去做產品時,我們有時候會仔細分析給用戶推薦的歷史結果中是否存在一些很明顯的 Bad case,這也是企業改善推薦質量很常見的一種方式。
豆瓣電臺過去做中文英文曲庫分割就是一個典型例子,當時豆瓣的收聽率一直無法上升,最后豆瓣員工進入用戶狀態,換位思考發現有些人喜歡聽中文歌,完全不喜歡英文歌,而還有些人喜歡聽英文歌,卻反感中文歌。從推薦角度思考,只需要做一個簡單的事,把中文跟英文的曲風直接區隔開,區隔開后豆瓣的推薦準確率瞬間提升。
另外一個例子是,有一次我們做商品推薦遇到了瓶頸,我們采取了一個方法,在每次推薦批次的商品中加入幾個 10 元包郵或 20 元包郵的商品,最后整個點擊率、轉化率都提升了,這并不是科學的方法,但當企業做一些在線的體驗優化或是離線的Bad case校驗時,你會發現一些粗暴的解決方法,但是這些對于整體的效果提升很有效。
秘籍 5:多學習一些算法知識
非技術出身的產品、運營,如果真的想把推薦業務做好,建議學一些算法知識,至少簡單知道每一個算法的基本優劣勢,這樣才能為你的優化方向提供目標和思路,溝通更順暢,更容易碰撞出火花。
比如,當做協同過濾的推薦系統時,當企業有 6000 萬的歷史用戶,平均每個人喜歡十個商品,但是只能推薦 1000 萬個商品。對于沒有做過推薦系統的大部分人,對其背后的的工程難度是無法想象的,但是你需要配合工程師去理解,如果你不理解工程難度在哪,就提不出比較好的建議。
比如產品、運營需要知道,過熱、過冷、太 low 是一些很常見的Bad case。過熱指的是推薦的永遠是很重要的內容;過冷就是總推薦一些最冷門的內容,導致用戶點擊率低;太 low,也是很常見的,內容質量低,用戶不喜歡。這也是我認為有時候產品運營參與推進業務可以幫助技術解決的一個特別好的點。在我做產品時,一旦發現有Bad case,就直接干掉,在這過程中不僅優化了整個推薦的質量,還通過不斷地干掉這個動作本身發現一些問題和規律。
再分享一個經典問題——如何做冷啟動?現在已經集中在幾個大概的方向:1.主動收集,讓用戶去選一些感興趣的一些方向,如豆瓣注冊后讓你選擇感興趣的類目;2.被動收集,如在淘寶網頁收集用戶的一些點擊、瀏覽等行為數據。
七、推薦系統的未來走向
下面簡單聊聊我對推薦系統的未來走向的想法。事實上,現在的一些企業的推薦系統,大部分算法都是混合發揮作用的,也就是復合算法。企業還可以在復合算法基礎上加入競爭機制,如在同樣一個推薦場景,多個窗口同時運作,這些窗口之間存在相互競爭,最后判定在同一個場景下,到底哪個算法、推薦機制更有效果。又或者企業直接使用機器學習,機器學習會自主做一些 utem、 item 的建模,甚至是算法之間的競爭關系。
事實上,相比我在 2008 年剛入行的時,現在的推薦系統已經非常復雜,我認為之后這些會更復雜、越來越抽象,如今任何一個公司想自己從 0 開始做推薦系統都會非常困難。但是不管基于我過去的產品經驗,還是現在在神策數據的經驗,總結發現其實構建推薦系統的價值觀、企業對于自己公司業務的理解,在整個推薦的搭建過程當中起著至關重要的作用。
以上就是我的全部分享,希望對你有幫助!
本文內容來自于近期神策數據舉辦的《智能推薦——應用場景與技術難點剖析》閉門會上的分享內容整理,分享者為神策數據副總裁張濤,曾就職于騰訊、映客和豌豆莢等知名互聯網公司。
最后,告訴大家一個好消息:
為了幫助在運營進階路上,執著前進的伙伴們能夠更快速的提升,我們聯合了騰訊、百度等擁有10年以上經驗沉淀的實戰派導師,推出了【運營總監修煉之道】,至今已幫助5000多名運營管理者和進階者,掌握了更加系統全面的運營專業知識和管理思路,在處理類似運營戰略規劃、不同渠道運營策略和流量變現、品牌營銷玩法、數據分析等實際問題時有更清晰的解決方向!
掃描二維碼添加小助手了解詳情,還可以回復“筆記”領取【運營總監課程學習筆記】哦!
再猶豫,機會就沒啦~
原作者:張濤
本文由 @神策數據 發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
感謝!對個性化推薦有了初步的認識。
寫得好,必須點贊,專門注冊一個賬號來給你蓋樓
想跟著BAT大咖老師學習更多進階運營知識體系嗎?
在【運營總監修煉之道】,四位來自騰訊、百度等擁有10年以上經驗沉淀的實戰派導師,將和你面對面分享高階運營的系統知識,幫你掌握更加系統全面的運營專業體系和高效管理思路…….
想了解更多詳情?立即聯系Leo咨詢哦~微信/TEL:13028897966
PS:除了咨詢問題,還可以領取【運營總監課程學習筆記】! ??
請問FaceBook對于親密度的意義在哪里呢?
目前廣告系統應該也是會針對目標用戶進行數據分析,精準推送吧,是不是也是需要個性化要求呢??個人愚見