個性化算法要合規整改,“個推”政策限制下如何做好算法推薦?(上)

0 評論 5111 瀏覽 8 收藏 15 分鐘

編輯導語:個性化推薦可以讓用戶更加快速地獲取自己想要的信息,幫助用戶在海量信息中進行篩選,減少用戶的時間成本,但這存在著數據泄露的隱患,且后續若形成信息繭房,也會限制用戶的思維邊界。那么,未來個性化推薦應該怎么走,還存在著什么發展空間?本文作者就個性化推薦的定義、利弊以及發揮空間等問題做了探討,一起來看一下。

8月27日,國家互聯網信息辦公室發布《互聯網信息服務算法推薦管理規定(征求意見稿)》(以下簡稱《意見稿》)并公開征求意見。

《意見稿》對具有輿論屬性或社會動員能力的算法推薦服務提供者進行重點規則,從內容推薦要求堅持主流價值導向,到不得實施流量造假、控制熱搜等影響網絡輿論,劍指微博、今日頭條、百度、快手、抖音等資訊信息及短視頻平臺。

《意見稿》對個性化推薦開關、個性化推薦等做出明確規定,APP要在規定時間內整改合規。以下是關于《意見稿》的部分截圖:

【上篇】個性化算法要合規整改,“個推”政策限制下如何做好算法推薦?

大數據算法為王時代,個性化算法是潮流(但算法背后衍生出不少個人隱私問題),《意見稿》基于人權益本身出臺。平臺如何在個性化推薦合規情況下,進一步做好人工推薦或精準推薦,達到雙管齊下效果?本篇淺談個人對算法推薦的看法。

一、什么是個性化推薦?

個性化推薦為什么受到平臺“吹捧(喜歡)”?算法主要解決了什么問題?什么是個性化推薦?

個性化推薦就是在特定場景下,人和信息之間更有效率的一種連接。各平臺熱衷于做算法推薦的目的是要把內容/物品變成價值的效率系統,提升產品整體的使用轉化。

二、個性化推薦的利與弊

個性化推薦可謂互聯網經濟最核心的取勝武器?!兑庖姼濉返某雠_是要逆時代洪流發展?當然不是!

任何事物都有兩面性,個性化推薦算法也一樣,利弊結合。

1)好處

  1. 用戶打開產品能快速找到自己想要的物品,提升整體查找效率;
  2. 方便用戶快速了解自己感興趣的內容;
  3. 方便用戶專注于了解自己喜歡的領域,形成自身優勢。

2)壞處

  1. 所有便利都是通過出讓更多個人隱私換來的。一旦平臺存儲的數據泄露,將是人類史上一場無法預估的信息災難。
  2. 大數據比你自己更懂自己,但長期下去容易形成信息繭房,不利于個人認知成長。
  3. 個性化相似內容推薦頻次過高,重復看到相似推薦等于浪費個人時間。

《意見稿》基于個性化算法所暴露出的弊端,進行了強制約束和整改。

三、推薦的進化史

近10年算法推薦發展迅速,但不少平臺仍然保留著“個人推薦+算法推薦+個性化推薦”幾種不同的推薦策略,三者之間有何區別?

1. 人工推薦

個人推薦是推薦的1.0版本,由平臺運營/編輯根據自己對內容或物品的品質、熱度等做出評分,最后將評分高的內容推薦給用戶。個人推薦的內容通常是千人一面,平臺需要花費較長時間去驗證人工挑選的內容是否符合市場/用戶的需求,整體推薦效率滯后。

人工推薦目前仍廣泛應用于傳統行業,如報紙、媒體、出版等。

2. 算法推薦

算法推薦是推薦的2.0版本,即平臺根據推薦訴求(如提升內容的CTR、CVR等指標),形成簡單的算法邏輯,讓內容滿足平臺大多數用戶的需求。

比如常見的排行榜、新品榜、人氣榜、飆升榜等,但算法推薦仍然是千人一面的推薦效果。

【上篇】個性化算法要合規整改,“個推”政策限制下如何做好算法推薦?

3. 精準推薦

精準推薦是推薦的3.0版本,它是前兩種算法推薦的綜合產物。主要通過給用戶、內容、物品打上各類專屬標簽,再給貼有不同標簽的用戶推薦他們可能喜歡的內容,在某種程度上精準推薦“簡單”的實現了千人千面的推薦需求。

精準推薦目前廣泛應用于APP推送、廣告投放等。

【上篇】個性化算法要合規整改,“個推”政策限制下如何做好算法推薦?

4. 個性化推薦

個性化推薦是推薦的4.0版本。它跟人工推薦最根本的區別在于,人工推薦是對用戶“被動的投喂”,而個性化推薦則是用戶“主動的選擇”。

個性化推薦的核心在于推薦模型的訓練,主要包括召回和排序兩種主模型,且個性化推薦進一步細分為搜索推薦和個性化推薦。

搜索推薦是將海量內容與用戶表意明確的查詢意圖的相關聯,通過分詞、變換、擴充、糾錯等過程,更好地了解用戶的搜索意圖,實現精準推薦。而個性化推薦則是將海量內容與用戶表意不明確的偏好相關聯,最后輸出用戶可能偏好的推薦物。

因此個性化推薦的邏輯是——APP通過大數據收集,記錄下用戶每一個行為動作、行為路徑、停留時長等,實時分析用戶的主要意圖,再通過以物推物、以人推物、協同過濾等規則,將用戶偏好內容先召回,最后按排序規則計算出要給用戶推薦的內容。

個性化推薦解決用戶千人千面的需求,目前廣泛應用于各大頭部APP,其中以BATJ四大巨頭為主。

四、個性化推薦存在的問題

個性化推薦發展迅猛,但仍然存在不少問題,其中最常見的4個問題便是:

1. 重復推薦問題

當機器算法足夠了解你之后,算法能快速計算出用戶偏好的內容,但同品類、同熱點甚至是相似度極高的內容,無法避免內容重復出現在一屏或多個推薦位的問題。

將APP頁面拆分成不同板塊分析下,以淘寶APP為例,頁面可分為搜索區、輪播banner區、分類icon區、特價劃算區、直播區等不同榜單模塊。淘寶的算法推薦業內數一數二,所以從物品推薦來看推薦的內容重復度低,但目前推薦能做到四大巨頭這程度的企業較少。

【上篇】個性化算法要合規整改,“個推”政策限制下如何做好算法推薦?

因為榜單之間的推薦系統其實比較復雜。舉個簡單的例子,APP一共有10個榜單欄目,其中2個榜單是純人工干預,剩余8個榜單純算法推薦。這種推薦邏輯至少會出現3種重復推薦的問題——人工推薦的榜單之間存在重復推薦、純算法榜單之間存在重復推薦、人工榜單和算法榜單之間存在重復推薦。

如果榜單跟榜單之間制定去重規則,能降低重復推薦的概率。然而去重限制并不能100%保證頁面不再出現重復內容。因為榜單越多意味著去重規則越復雜,越靠后的榜單可能會出現去重后無內容召回的情況,無內容召回時系統會自動啟用兜底推薦,這便衍生出其他2種重復推薦問題——人工榜單跟兜底榜單存在重復推薦、純算法榜單跟兜底榜單存在重復推薦。

2. 推薦不準問題

負責算法推薦時,不少同事曾給我反饋算法推薦不準的問題。比如他不是老師身份,平臺總喜歡給他推薦老師偏好的內容;他不是高管,總給他推薦高管的資訊;他對美妝不感興趣,總給他推薦美妝信息等等。

好幾次一查對方日志發現,用戶早上7點04分瀏覽了美妝頻道、中午11點30分點進去了某化妝品詳情頁、中午12點45分在看某美妝博主的直播……這些行為日志都明確表明用戶對美妝品類有強烈需求,而用戶本身卻不承認自己有過這些點擊行為。為什么?

除了“超我”不承認“本我”的行為以外,還因為會存在一個賬號在多臺設備上使用過,或多個不同用戶使用同一個賬號下單等情況。

這時候一個賬號對應的實際用戶身份非常復雜。雖然算法可以通過增加設備ID加大匹配門檻,但系統仍不能100%準確判斷好每次瀏覽的是用戶A還是用戶B,這就是為什么在個性化算法推薦成熟的時候,仍然有很多用戶吐槽大數據推薦不準。

實際上,你喜不喜歡某品類,有沒有點過哪些資源,大數據給你記錄得清清楚楚,大數據不會騙人,有時候騙人的反而是我們自己。

3. 推薦過于密集

相似內容推薦過于密集的問題十分普遍,最常見于抖音。

我自身是個影視劇迷,非常愛刷影視劇視頻。抖音算法計算出我的偏好后,精準的拿捏住我對哪些劇感興趣。比如我最近在追《周生如故》,抖音里10條內容就給我推了6條關于該劇的內容。

站在用戶角度,我非常高興算法給我精準推薦偏好的視頻,但同一個片段上一個視頻剛刷完,沒刷幾個視頻同樣的內容又出現,推薦頻次過于密集最后導致用戶在茫茫視頻推薦中,人工過濾未看過的視頻,心累。

4. 熱點時效性問題

算法推薦遇到的最大挑戰點在于對熱點內容和時效性強的內容推薦,比如馬上中秋國慶到來,強時效性的內容在推薦時需要加入時間衰減的推薦機制,不然就會給用戶推薦不合時宜或已經過時的內容。

五、算法成熟時代,如何應對“個推”政策危機?

個性化推薦算法暴露不少隱私問題,《意見稿》整改是維護社會主義價值觀的正向措施。在算法成熟的時代,企業該如何應對《意見稿》中提到的合規處理?

——答案只有一個,按照政策執行,該關閉的開關關閉,該下線的算法下線,該修改的引導文案修改,算法推薦要堅持弘揚社會主義正能量。

六、精準推薦發揮空間還有多大?

個性化算法被“整改”,算法“回滾”到3.0版本,還有多大發揮空間?

其實這算不上什么算法回滾。即使眾多企業都在談論個性化推薦,但個性化算法只有少部分頭部玩家在應用,不少企業目前也只處于3.0推薦階段。標簽體系雖然成熟,但我認為標簽還有進一步的挖掘空間。

標簽收集可分成3種類型,一是內容本身的標簽、二是使用內容的人的標簽、三是場景標簽。簡單概括為冷標簽、溫標簽、熱標簽,而熱標簽便是其中可挖掘的爆發點。

至于什么是冷標簽、溫標簽、熱標簽,標簽爆發點在哪兒?我們下一篇推文再詳細分享,敬請期待。

#專欄作家#

卡卡,微信公眾號:卡卡的產品札記,人人都是產品經理專欄作家。8年大型互聯網產品運營經驗。曾負責過稻殼兒、手機主題等產品,對IP字體的打造引領了行業風向標。既當過業務操盤手,也當過自媒體創作者,對產品運營、內容運營有自己的見解。

本文原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!