信息流產(chǎn)品是怎么做的?

3 評論 11624 瀏覽 44 收藏 10 分鐘

編輯導讀:信息流產(chǎn)品這個名詞聽上去挺唬人,但其實大家日常生活中經(jīng)常遇見。今日頭條的熱點資訊,大眾點評的推薦餐廳,小紅書的種草筆記等等,都是信息流產(chǎn)品的具體形態(tài)。那么,構建一個最基礎的信息流產(chǎn)品,需要哪些部分?具體是如何操作的呢?本文將從六個方面展開分析,希望對你有幫助。

如今,信息流的產(chǎn)品形態(tài)已經(jīng)貫穿到我們的生活中,與一切都息息相關。每日清晨打開今日頭條,齊刷刷的熱點資訊等著大家去閱讀;休息時點開小紅書,無數(shù)條種草點評映入眼簾;一到飯點饑腸轆轆時點擊大眾點評,不計其數(shù)的同城餐廳等待我們?nèi)ヌ暨x……在現(xiàn)今的移動互聯(lián)網(wǎng)時代,平臺通過成熟精密的召回算法和排序規(guī)則來聚合內(nèi)容,用戶在一個頁面內(nèi)就可以高效流暢地獲取自己感興趣的內(nèi)容。

在以往文章中,我們講述過關于信息流內(nèi)容產(chǎn)品的指標搭建、常見分析思路和優(yōu)化方法。那么,構建一個最基礎的信息流產(chǎn)品,需要哪些部分?每個模塊具體如何操作以及它的作用是什么呢?今天的這篇文章里,大家就能知道想要的答案啦。

一個最基礎的信息流產(chǎn)品,涵蓋了哪些部分?

  • 內(nèi)容:內(nèi)容生產(chǎn)、內(nèi)容理解、內(nèi)容加工
  • 用戶:用戶理解
  • 策略:召回/推薦策略、分發(fā)策略、生態(tài)策略

圖示是構建信息流產(chǎn)品所需的基礎大框架,接下來逐個分析各模塊具體操作及對應作用。

一、內(nèi)容生產(chǎn)

內(nèi)容生產(chǎn)即內(nèi)容的供給,有需求就要有供給,只有供給充足,用戶才能消費到足夠多樣精彩的內(nèi)容。通常有以下幾個方式生產(chǎn)內(nèi)容:

  • 自然創(chuàng)作者在站內(nèi)發(fā)布內(nèi)容
  • 簽約媒體及MCN等機構購買一些創(chuàng)作者/內(nèi)容資源
  • 抓取其他平臺符合調(diào)性的內(nèi)容。

在不同的產(chǎn)品目標階段,不同來源類型的內(nèi)容配比會不同。一些成熟的平臺已經(jīng)有非常完善的創(chuàng)作者生命周期管理和創(chuàng)作者激勵/分成體系,由此可激勵創(chuàng)作者發(fā)布更多更優(yōu)質(zhì)的內(nèi)容。可見,內(nèi)容供給就是內(nèi)容型產(chǎn)品的根本。

二、內(nèi)容理解

內(nèi)容理解即給內(nèi)容打標簽。標簽——描述內(nèi)容本身的特征,可以更好地理解內(nèi)容,將合適的內(nèi)容推薦給合適的用戶。基于內(nèi)容理解的標簽有非常多的用途,除了作新用戶的內(nèi)容推薦外,可以作基于相似標簽的相關內(nèi)容推薦,也可以作個性化的內(nèi)容推薦。內(nèi)容通過海量標簽生產(chǎn)內(nèi)容特征,和用戶的偏好進行匹配,形成千人千面的內(nèi)容分發(fā)方式。

內(nèi)容理解需要大量NLP方法,以及大量人工標注,用以確保標簽的準確性。通??梢詮膬?nèi)容本身和發(fā)布內(nèi)容作者屬性/行為來理解內(nèi)容。例如一個短視頻作品,它的標簽就可以涵蓋:

  • 基礎屬性:時長、封圖、標題、關鍵詞、城市、來源等
  • 類別屬性:城市新聞、娛樂、貓狗等
  • 預測類屬性:原創(chuàng)度、風險分、內(nèi)容評級、內(nèi)容時效性、女生偏好、年輕人偏好等

三、內(nèi)容加工

不論任何渠道抓取、站點抽取或者平臺作者自主發(fā)文的內(nèi)容,通常都需要經(jīng)過層層加工過濾。首先進行通用消重,然后通過機器審核的一些模型及人工審核過濾掉黑名單、低質(zhì)內(nèi)容、抄襲內(nèi)容、不完整內(nèi)容、涉黃涉暴等不適合在平臺內(nèi)展現(xiàn)的內(nèi)容。

然后在內(nèi)容分發(fā)過濾時根據(jù)對應規(guī)則,設定對應特征的內(nèi)容可以分發(fā)給對應特征的用戶等規(guī)則,例如用戶評級評分、垂類等進行分發(fā)過濾。到了前端展示側,根據(jù)頻道主Feed頁的推薦位進行個性化推薦分配,展示給用戶。最后內(nèi)容展示一定時間后會喪失其時效性,便不再展示。

四、用戶理解

用戶理解即精準地去刻畫用戶,涵蓋用戶的基礎信息,職業(yè)、年齡、性別等,以及基于用戶過往行為數(shù)據(jù)興趣偏好標簽,從這些數(shù)據(jù)中,我們可以獲取大量的用戶特征,對用戶有更深層次的認知,例如這個用戶喜歡什么類型的內(nèi)容?更偏好什么類型的賬號發(fā)文?活躍時間在每天的幾點?

基于此可以從不同的維度去刻畫一個用戶,我們刻畫得越精準越詳細,就越能精準地發(fā)現(xiàn)并挖掘用戶的需求,把用戶所需內(nèi)容推薦給目標用戶,內(nèi)容轉化效率將會變得更高。

五、推薦與分發(fā)策略

推薦策略是基于海量數(shù)據(jù)分析基礎上,通過內(nèi)容及用戶的多維度特征組合分數(shù),進行計算,將個性化內(nèi)容推薦給對應用戶,解決信息過載的問題。推薦通常分為兩個階段,即召回和排序。

召回是根據(jù)用戶的一些特征偏好或者一些特殊規(guī)則,在偌大的內(nèi)容池中挑選出一個內(nèi)容集合,圈定推送內(nèi)容。常用的召回方法有:基于FM模型組合特征召回、基于行為的item協(xié)同過濾、基于行為的user協(xié)同過濾等手段等。召回池中都是用戶感興趣的內(nèi)容,而排序階段會在此基礎上進行更精確計算,對每個內(nèi)容進行打分,從召回池的內(nèi)容中挑選出用戶最感興趣的少量內(nèi)容。

內(nèi)容的分發(fā)方式除了推薦算法外,還應該考慮內(nèi)容多樣性等因素,我們可以基于內(nèi)容生態(tài)的考量,對內(nèi)容創(chuàng)作者從不同的維度進行打壓與推優(yōu),把更多的流量分配給優(yōu)質(zhì)內(nèi)容的創(chuàng)作者,提高流量的利用效率和被消費內(nèi)容的質(zhì)量。例如我們會對原創(chuàng)評級更高、質(zhì)量評級更高的作者給予更多的流量。此外,還可以基于社交進行分發(fā)(抖音的關注頁頻道),與地理位置的分發(fā)(抖音的同城頻道、以及熱榜內(nèi)容分發(fā))。

六、生態(tài)策略

早期產(chǎn)品做冷啟動時,內(nèi)容和創(chuàng)作者數(shù)量都遠遠不足,需要通過外部手段來激活站內(nèi)生態(tài),由此不得不抓取大量的站外內(nèi)容到站內(nèi),相應就無法保證內(nèi)容質(zhì)量。但隨著產(chǎn)品的發(fā)展,亟需一批優(yōu)質(zhì)+原創(chuàng)的內(nèi)容來替換原始抓取的內(nèi)容,借此讓站內(nèi)擁有更多的真人優(yōu)質(zhì)創(chuàng)作者,來構建更加健康可持續(xù)發(fā)展的作者及內(nèi)容生態(tài)。

促進UGC的生產(chǎn)可以通過一些運營活動、簽約MCN/官方招募、社區(qū)內(nèi)容引導等方式。同時設計相應策略保證頭部生產(chǎn)者的內(nèi)容權益,對底層劣質(zhì)創(chuàng)作者的內(nèi)容進行打壓,通過針對不同程度的劣質(zhì)/違規(guī)進行不同的手段打擊,最終讓站內(nèi)保持一個良性的循環(huán)生態(tài)。

我們不僅要處理站內(nèi)的違規(guī)用戶和違規(guī)內(nèi)容,還要針對一些擦邊的生態(tài)問題制訂對應的干預策略。如果站內(nèi)若存在大量的低俗內(nèi)容、負能量內(nèi)容、炒作搏眼球內(nèi)容等,雖然這些內(nèi)容并不違規(guī),若其量級夠大則嚴重影響用戶的瀏覽體驗。根據(jù)我們目前的產(chǎn)品階段及調(diào)性,通過模型及人工方式對不同的生態(tài)類問題內(nèi)容進行識別,實施相應的處置及規(guī)則設定,以維護站內(nèi)健康正向的內(nèi)容生態(tài)。

以上,就是我理解一個信息流內(nèi)容產(chǎn)品的主要框架,還有非常多的細節(jié)點,如果有感興趣的朋友,歡迎討論。

 

作者:趙小洛,公眾號:趙小洛洛洛

本文由 @趙小洛 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 接收人接收不到你的專有名詞內(nèi)容……

    回復
  2. 花里胡哨,信息流廣告說白了就是強制性廣告,關鍵詞為主動廣告,尋找用戶標簽就是找愿意看廣告的人強制給這些人看

    回復
  3. 沒聽懂…… 只能怪我經(jīng)驗太少

    回復