千萬級內容類產品中臺應該有哪些模塊?
文章結合牛肉加工的案例,形象地梳理了內容中臺的運作機制,并對各個模塊展開了分析介紹,與大家分享。
說到內容,可以把它想象為一塊牛肉。它首先是一頭牛,然后這頭牛被送進了加工廠,在一系列加工之后,通過物流送到超市,最后,你通過消費獲得這塊牛肉。內容也是一樣,需要經過生產、加工、審核、分發等工序最后展示在用戶面前。本文說的內容中臺便是如此。
一頭牛(內容原料/內容生產)
和通常說的UGC/PGC的分類不一樣,此處的說的中臺將內容來源分為外部創作和內部創作。
外部創作
外部創作指的是爬蟲采集、人工摘錄、渠道合作以及用戶創作內容(UGC)。
(1)爬蟲采集:是指對特定信息源進行機器爬蟲采集、內容入庫。此處說的特定的信息來源通常是公開信息網站,比如gov類的。爬蟲采集要求全、快、準、穩。
- 全,爬取的內容要全,不能把信息源的文章少爬了幾篇。
- 快,采集要快、入庫要快,最好是能在幾秒鐘內就出現在內部文章池,然而現在一般是在五分鐘左右。
- 準,內容要素要準、內容定位準確,比如說不能把作者當成媒體來源。
- 穩,采集程序穩定,而且要有及時的監控報警機制。
(2)人工摘錄:主要是針對那些及時性要求比較高的內容,比如突發性重大新聞。這也側面反映出爬蟲采集存在一定缺陷,比如時效性低,很難做到秒級反應。此外部分來源也設有反爬蟲機制,會使得內容有所缺失。這時候就需要人工摘錄進行補充。
(3)渠道合作:是指由合作商提供接口,除了常規的內容要素,還應該包含增刪改信息,最好是有合適的日志以及信息同步機制。
內部創作
內部創作說的是企業原創,這類又分為兩種:一種是純人工創作,另一種是智能寫稿。
- 純人工創作:也就是原創內容,由強大的編輯團隊一手創作
- 智能寫稿:這個有點像文字填充。產品經理在經過一系列的分析以后篩選出能夠滿足用戶需求并且能被技術支持的文章類型,再對每一類文章編寫模板并規定由機器填寫的字段。此后機器就能自動產出符合要求的內容了。
加工廠(內容加工)
加工廠主要有兩種“機器”,一類是標簽體系(內容分類),一類是內容加工。
標簽體系主要服務于構建文章池并以此作為個性化推薦的基礎。比如說某篇文章的標簽是{A,B},某用戶的標簽也是{A,B},那么這篇文章便可能有很大的概率被推送到這個用戶面前。而此處的標簽體系便是通過對內容的分析給它們打上各種標簽以便于后續的分發和推送。值得注意的是,標簽并不是越多越好,而是要遵循一定的規則,這樣才能盡可能地提高匹配程度,從而提高文章的消費率。
內容加工主要有以下幾步:
- 首先是格式的優化,對于采集過來的文章我們需要把不合適的內容去掉,比如說超鏈、廣告等。
- 然后是內容轉存,將文章的圖片和視頻轉到自己的服務器上(這需要取得對方許可)。
- 其次還有一些附加模塊,這塊主要作用于各前臺的特色功能或者個性化需求,比如在文章中添加圖片、表格、投票、附件、運營模塊(主要是banner)等。
- 最后是蓋戳環節,就像加工廠給牛肉蓋戳一樣,我們需要對內容的合規性、與原文的一致性等進行復核,主要是違規詞屏蔽(也就是你們在王者農藥里顯示不出來的芬芳)、關鍵詞替換、原文比對等。
物流分發(內容分發)
物流分發輸出的就是成品牛肉——文章池,它最重要的元素有:標題、摘要、正文、時間、排序、內容標簽、個性化模塊。分發的邏輯比較復雜,而且也需要配合前臺具體需求,這里就不展開論述了。
最后附上邏輯圖:
本次分享到此結束~
作者:宇觴醉月;公眾號:ZZ的產品筆記
本文由 @宇觴醉月 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
我認為還有一點非常重要的,就是如何數據化沉淀,作為一個中臺,不僅僅是倉庫那么簡單,還要短期/長期了解中臺的產品相關的數據才方便以后的分析與決策。
就比如,現在產品銷售數據化了,知道物流到哪里,銷售了多少。但是作為內容這類數字化產品,如何有效監控數量。謝謝
內容中臺數據可以從這幾個方面入手,①內容中臺的業務支持能力,支撐了多少業務場景;②內容相關數據,包括用戶側的,安全上的等;③內容中臺提升效率能力,比如原來需要三個月的項目,對接中臺可以縮短至2周
這個加工廠需要什么樣的技術支持?
比如一些自動化格式處理,語義分析,監控,預警,熱度算法等等
厲害了,最近也在整中臺