以短視頻為例,解析推薦機(jī)制要點(diǎn)

~M~
11 評(píng)論 7425 瀏覽 140 收藏 10 分鐘

對(duì)一款內(nèi)容產(chǎn)品來(lái)說(shuō),由于內(nèi)容數(shù)量龐雜、內(nèi)容質(zhì)量參差不齊,為了給用戶帶來(lái)良好的內(nèi)容消費(fèi)體驗(yàn),推薦機(jī)制成了篩選/推薦優(yōu)質(zhì)內(nèi)容的不二之選。而本文也以短視頻模塊的推薦機(jī)制為例,幫助大家了解推薦機(jī)制的要點(diǎn)。

我從事內(nèi)容產(chǎn)品有兩三年了,從最初接觸的長(zhǎng)視頻到現(xiàn)在風(fēng)靡的短視頻,從最初的各類推薦位設(shè)計(jì)到現(xiàn)在的大屏內(nèi)容推薦流設(shè)計(jì),在此過(guò)程中積累了很多的經(jīng)驗(yàn),但卻沒(méi)有停下腳步來(lái)思考和總結(jié)。趁著疫情,我開(kāi)始回想整個(gè)推薦方案,突然想總結(jié)一下,于是就有了如下——我的推薦四步曲。

我現(xiàn)在做的產(chǎn)品是內(nèi)容型客戶端(具體名字不便于透露,望諒解)。從產(chǎn)品核心功能設(shè)定到前后端詳細(xì)功能設(shè)計(jì),到項(xiàng)目跟蹤,到發(fā)布上線,到運(yùn)營(yíng)培訓(xùn),再到用戶數(shù)據(jù)跟蹤和產(chǎn)品維護(hù)都是我參與和推動(dòng)的。

推薦功能只是作為整個(gè)產(chǎn)品的一部分,今天要說(shuō)的是短視頻模塊的推薦機(jī)制。

短視頻推薦機(jī)制經(jīng)歷了如下四步曲:

  1. 發(fā)布時(shí)間排序推薦;
  2. 根據(jù)用戶喜好推薦;
  3. 增加運(yùn)營(yíng)干擾;
  4. 增加平臺(tái)內(nèi)容過(guò)濾機(jī)制。

下面,我按照順序跟大家分步講講。

第一步:發(fā)布時(shí)間排序

在現(xiàn)在這個(gè)信息技術(shù)高速增長(zhǎng)的社會(huì),只要提到推薦,首先想到的是智能學(xué)習(xí),但是我們首先選擇的是發(fā)布時(shí)間排序,原因下面會(huì)說(shuō)到。

1. 項(xiàng)目背景

  1. 缺少內(nèi)容沉淀:我們主要采用公司專有人員創(chuàng)作,所以在內(nèi)容數(shù)量上會(huì)有一定的缺陷。另外目標(biāo)用戶對(duì)內(nèi)容的接受程度待考量,創(chuàng)作人員需要快速試錯(cuò)。創(chuàng)作人員需要根據(jù)的用戶反饋,快速調(diào)整創(chuàng)作方案,再迅速投到產(chǎn)品中等待再次反饋,所以最新的內(nèi)容,從用戶角度來(lái)講是更愿意看到的,從創(chuàng)作者來(lái)講,也是最愿意讓用戶看到的。
  2. 沒(méi)有用戶數(shù)據(jù):新產(chǎn)品,沒(méi)有存量的用戶行為數(shù)據(jù)做參考,如果立即使用智能推薦,對(duì)推薦結(jié)果好壞判斷未知。
  3. 快速上線:產(chǎn)品需要一個(gè)月時(shí)間完成研發(fā)和上線工作。當(dāng)時(shí)的人員配置是:1個(gè)安卓、1個(gè)ios、3個(gè)后臺(tái),在資源和時(shí)間上來(lái)看,難以完成數(shù)據(jù)量極大的推薦機(jī)制。

2. 方式機(jī)制

最終選擇的是按照內(nèi)容發(fā)布時(shí)間倒序?yàn)橹鳌Ⅻc(diǎn)贊量、評(píng)論量、轉(zhuǎn)發(fā)量和收藏量為輔的排序方式。

  1. 發(fā)布時(shí)間倒序:按照內(nèi)容發(fā)布時(shí)間新舊排序,新發(fā)布的內(nèi)容用戶先看到;
  2. 點(diǎn)贊量、評(píng)論量、轉(zhuǎn)發(fā)量和收藏量為輔:如果存在發(fā)布時(shí)間相同的內(nèi)容,先按照用戶點(diǎn)贊量遞減排序;點(diǎn)贊量相同,按照評(píng)論量遞減;評(píng)論量相同按照轉(zhuǎn)發(fā)量遞減;轉(zhuǎn)發(fā)量相同按照收藏量遞減。如果收藏量相同則按照后臺(tái)獲取的優(yōu)先順序排序。

3. 線上運(yùn)營(yíng)情況

產(chǎn)品上線后2-3個(gè)月,不同類型間的內(nèi)容播放數(shù)據(jù)(平均瀏覽量環(huán)比前日增長(zhǎng))出現(xiàn)兩級(jí)分化的情況,有的類型是正增長(zhǎng),而較多類型處于負(fù)增長(zhǎng)主要原因有兩個(gè):

  1. 用戶基數(shù)較小,探究的樣本空間就相對(duì)較小,所以分化比較嚴(yán)重;
  2. 這段時(shí)間為內(nèi)容創(chuàng)作適應(yīng)階段,需要長(zhǎng)期對(duì)標(biāo)用戶,調(diào)整創(chuàng)作方案和創(chuàng)作類型。

在大半年到1年時(shí)間,各類型間播放數(shù)據(jù)差異(平均瀏覽量環(huán)比前日增長(zhǎng))逐步減少,負(fù)增長(zhǎng)類型有了明顯減少,并且用戶次日留存也逐步穩(wěn)定在15%左右。

第二步:根據(jù)用戶喜好推薦

1. 項(xiàng)目背景

上面說(shuō)到按照發(fā)布時(shí)間為主的推薦排序在某些數(shù)據(jù)上表現(xiàn)較好,但是在用戶平均使用時(shí)長(zhǎng)在2分鐘左右,比較低,為了提升用戶平均使用時(shí)長(zhǎng)和進(jìn)一步提升留存,我們進(jìn)入喜好推薦。

2. 方式機(jī)制

用戶喜好推薦是通過(guò)用戶行為和內(nèi)容標(biāo)簽關(guān)聯(lián)的數(shù)據(jù)為依據(jù),喜好強(qiáng)度做判斷,然后按照由強(qiáng)及弱進(jìn)行推薦。做此類推薦首先需要有內(nèi)容數(shù)據(jù)支撐和用戶行為支撐。

  1. 內(nèi)容數(shù)據(jù)支撐:在我們的內(nèi)容庫(kù)里面由運(yùn)營(yíng)人員設(shè)置了108個(gè)內(nèi)容標(biāo)簽;
  2. 用戶行為數(shù)據(jù)支撐:用戶行為數(shù)據(jù)庫(kù)里面記錄了所有已登錄用戶歷史的瀏覽、播放、點(diǎn)贊、分享、收藏?cái)?shù)據(jù)。
  3. 喜好強(qiáng)弱評(píng)定方案:
  • ? 行為分?jǐn)?shù)定義:對(duì)用戶播放、點(diǎn)贊、評(píng)論、轉(zhuǎn)發(fā)、收藏行為按照行為可靠性定義分?jǐn)?shù),總分10分;(每個(gè)平臺(tái)不一樣,我們播放分?jǐn)?shù)5分,點(diǎn)贊2分,其他各1分)
  • 強(qiáng)弱判斷:每條內(nèi)容播放后,根據(jù)用戶行為算出總分,以后就優(yōu)先為用戶推薦得分高內(nèi)容的同類型內(nèi)容;

3. 線上運(yùn)營(yíng)情況

上線后1周,用戶平均使用時(shí)長(zhǎng)上升到了2分鐘—3分鐘;

上線后1個(gè)月,次日留存穩(wěn)定在20%-25%。

第三步:增加運(yùn)營(yíng)配置

1. 項(xiàng)目背景

  1. 運(yùn)營(yíng)需要:運(yùn)營(yíng)活動(dòng)、時(shí)效性內(nèi)容需要強(qiáng)制推薦;
  2. 優(yōu)化上個(gè)方案:完全按照用戶喜好推薦,導(dǎo)致同類型問(wèn)題比較嚴(yán)重

2. 方式機(jī)制

在服務(wù)端返回的每組內(nèi)容列表里面,增加適當(dāng)個(gè)數(shù)的運(yùn)營(yíng)位(每個(gè)平臺(tái)根據(jù)自己的規(guī)則來(lái),我們服務(wù)端每次返回20條數(shù)據(jù),所以我們配置的是第三個(gè)、第6個(gè)為運(yùn)營(yíng)位,原因是平臺(tái)用戶平均瀏覽數(shù)量是4個(gè),所以在第三個(gè)放置,能保證大部分用戶首次啟動(dòng)可以看到,同時(shí)也不會(huì)影響用戶體驗(yàn))。

3. 線上運(yùn)營(yíng)情況

很慶幸,上線后沒(méi)有讓用戶評(píng)價(jià)使用時(shí)長(zhǎng)降低,由于運(yùn)營(yíng)活動(dòng)的有效觸達(dá),用戶次日留存得到了很大提升,達(dá)到30%以上。

第四步:增加內(nèi)容過(guò)濾機(jī)制

1. 項(xiàng)目背景

運(yùn)營(yíng)配置雖然解除了少數(shù)按照同質(zhì)化問(wèn)題(按照用戶喜好推薦,可能會(huì)導(dǎo)致同類型問(wèn)題比較嚴(yán)重),但是運(yùn)營(yíng)配置位置較少,而且具有較強(qiáng)主觀意識(shí)。所以本次為平臺(tái)過(guò)濾內(nèi)容增加了兩個(gè)位置

2. 方式機(jī)制

平臺(tái)內(nèi)容過(guò)濾機(jī)制:指的是通過(guò)平臺(tái)用戶對(duì)內(nèi)容打分,過(guò)濾出優(yōu)質(zhì)內(nèi)容和劣質(zhì)內(nèi)容,將優(yōu)質(zhì)內(nèi)容推送給其他更多用戶,劣質(zhì)內(nèi)容則淘汰不在推送。具實(shí)現(xiàn)方式如下:

  1. 制定隨機(jī)種子:內(nèi)容隨機(jī)推送給100個(gè)用戶(數(shù)量根據(jù)平臺(tái)用戶規(guī)模和庫(kù)內(nèi)內(nèi)容存量定),然后通過(guò)100個(gè)用戶對(duì)內(nèi)容的行為操作統(tǒng)計(jì)分?jǐn)?shù);
  2. 優(yōu)劣判斷:設(shè)定優(yōu)劣分?jǐn)?shù)判定標(biāo)準(zhǔn),150分以上為優(yōu)質(zhì)。(每個(gè)平臺(tái)不一樣,根據(jù)用戶規(guī)模、內(nèi)容情況和歷史數(shù)據(jù)判定)
  3. 優(yōu)質(zhì)推送規(guī)則:100個(gè)隨機(jī)用戶完成打分后,將優(yōu)質(zhì)內(nèi)容按照分?jǐn)?shù)高低推送給其他用戶,同時(shí)優(yōu)質(zhì)內(nèi)容每天也會(huì)再次進(jìn)行重計(jì)分和重排序。
  4. 打分規(guī)則:內(nèi)容得分=完播系數(shù)*分?jǐn)?shù)+是否分享*分?jǐn)?shù)+是否關(guān)注*分?jǐn)?shù)+是否評(píng)論*分?jǐn)?shù)+是否點(diǎn)贊*分?jǐn)?shù)+是否收藏*分?jǐn)?shù);
  • 分?jǐn)?shù):指的是每個(gè)行為占比,這里,設(shè)定所有行為總分=10,完播分?jǐn)?shù)=5,其余各項(xiàng)分別=1;
  • 完播:指的是內(nèi)容完整播放,進(jìn)度條滑動(dòng)不計(jì)算在內(nèi)。

3. 線上運(yùn)營(yíng)情況

  1. 功能上線后,保持每天10條以上優(yōu)質(zhì)內(nèi)容產(chǎn)生,目前來(lái)看,屬于穩(wěn)定的循環(huán);
  2. 用戶平均使用時(shí)長(zhǎng)達(dá)到4分鐘到5分鐘;
  3. 用戶留存達(dá)到35%以上。(留存增長(zhǎng)較快,和運(yùn)營(yíng)、推廣都有較大關(guān)系)。

后話

目前我正在著手機(jī)器學(xué)習(xí)對(duì)接方案,后面上線后再和大家做進(jìn)一步分享。

以上就是截止到今年年初推薦功能的大策略調(diào)整,中間有幾個(gè)小版本迭代就不再這里過(guò)多講述了,希望能和大家共勉。

 

本文由 @pangTT 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 您好,麻煩問(wèn)一下增加運(yùn)營(yíng)后臺(tái)配置是怎么實(shí)現(xiàn)的,每次返回的20條數(shù)據(jù)都有兩個(gè)運(yùn)營(yíng)配置的視頻嗎

    來(lái)自北京 回復(fù)
  2. 請(qǐng)問(wèn)這個(gè)完播系數(shù)是什么,是全看完才算嗎

    回復(fù)
  3. 有幫助到 非常感謝作者的分享

    回復(fù)
  4. 干貨呀,給大佬點(diǎn)個(gè)贊。期待后續(xù)的分享~~

    來(lái)自上海 回復(fù)
  5. 請(qǐng)問(wèn)不優(yōu)質(zhì)的視頻怎么曝光,是否通過(guò)慢曝光的方式,還有機(jī)會(huì)變成優(yōu)質(zhì)視頻,考慮視頻流動(dòng)性的問(wèn)問(wèn)題。

    來(lái)自河南 回復(fù)
  6. 這篇文章干貨滿滿啊,正好需要,可以加個(gè)好友嗎?有寫(xiě)問(wèn)題想請(qǐng)教一下

    來(lái)自廣東 回復(fù)
  7. 運(yùn)營(yíng)人員設(shè)置的標(biāo)簽怎么跟短視頻掛鉤?

    來(lái)自湖北 回復(fù)
    1. 具體方式和公司規(guī)模、資源相關(guān)。以下有部分策略可供選擇
      1、從發(fā)布者角度:根據(jù)發(fā)布者標(biāo)簽選擇、發(fā)布者ip標(biāo)簽屬性區(qū)分;
      2、從平臺(tái)側(cè):利用平臺(tái)內(nèi)容解析(畫(huà)面、NLP技術(shù))區(qū)分;
      3、閱讀者側(cè):利用閱讀者標(biāo)注、閱讀人群標(biāo)識(shí)區(qū)分等。

      來(lái)自北京 回復(fù)
  8. 好文章,收益匪淺,可以加好友嗎,有幾個(gè)問(wèn)題想請(qǐng)教您

    來(lái)自上海 回復(fù)
    1. 可以啊

      來(lái)自北京 回復(fù)
    2. 你好,怎么加好友,我也想請(qǐng)教您

      來(lái)自湖南 回復(fù)