爆款內容的誕生與極致利用
對于想入局小紅書、產出爆款筆記的博主們而言,有哪些規則是需要注意的?與此同時,博主們又可以采取怎樣的運營策略,產出爆款筆記,實現快速增粉?本篇文章里,作者便結合自身經驗,對小紅書的運營策略進行了解讀,一起來看。
Hi,小伙伴,見字如面。
分享自己對于小紅書的一些理解,主題是《爆款內容的誕生與極致利用》。
一、小紅書流量機制解析
小紅書對于筆記流量來源有 2 種略有不同的劃分。
1 種是小紅書創作中心對于筆記流量來源的劃分:
- 首頁推薦;
- 搜索;
- 關注頁面;
- 個人主頁;
- 搜索;
- 其他來源。
另 1 種是小紅書蒲公英對于筆記流量來源的劃分:
- 發現頁;
- 搜索頁;
- 關注頁;
- 博主個人頁;
- 附近頁;
- 其他。
這 2 種劃分實際上差不多,但是小紅書近期有一些調整,所以上述的劃分并沒有及時更新,因此小紅書現在的筆記流量來源有這些:
- 發現頁;
- 關注頁;
- 視頻流;
- 搜索頁;
- 個人主頁;
- 小紅書群聊;
- 其他。
而小紅書的筆記流量來源主要取決于推薦與搜索。
1. 推薦系統基本鏈路
用戶刷新小紅書后,推薦系統會同時調用幾十條召回通道,每條召回通道從數據庫里快速取回幾十到幾百篇筆記,一共取回幾千篇筆記,這些召回通道實際上就是不同的算法/規則在作用,從數據庫里進行去重、過濾、篩選。
然后用規模比較小的機器學習模型,給幾千篇筆記逐一打分,按照分數做排序和截斷,保留分數最高的幾百篇筆記,即粗排與截斷。
之后用大規模的深度神經網絡給幾百篇筆記逐一打分,即精排。
粗排與精排的原理基本相同,實際上就是用不同深度的機器學習模型及神經網絡等,預估用戶對于筆記的興趣,根據預估的興趣分數進行排序。
幾百篇筆記帶著精排分數進入重排,重排會考慮內容多樣性問題,根據精排分數和多樣性分數做隨機抽樣,得到幾十篇筆記,再把相似的筆記打散,避免把過于相似的內容排在相鄰的位置上,最后插入廣告和運營內容,以及根據生態要求調整排序呈現給用戶。
1)召回通道
推薦系統在推薦分發過程里所調用的召回通道實際上就是不同的算法/規則在作用,從數據庫里進行去重、過濾、篩選,所以闡述一下幾條比較重要/常用的召回通道。
① 基于物品的協同過濾
在小紅書推薦系統里,物品即內容,所以基于物品的協同過濾即基于內容的協同過濾。
基于內容的協同過濾的基本思想是根據內容的相似度做推薦,因為用戶對這篇內容感興趣,而這篇內容與另一篇內容相似,所以用戶也很可能會對另一篇內容感興趣。
舉個例子。
我喜歡看《笑傲江湖》,《笑傲江湖》與《鹿鼎記》相似,但是我沒有看過《鹿鼎記》,這個時候推薦系統就會給我推薦《鹿鼎記》,而推薦的理由就是《笑傲江湖》與《鹿鼎記》相似。
至于推薦系統是如何判斷《笑傲江湖》與《鹿鼎記》相似的,其實很簡單。
比如通過知識圖譜,這 2 本書籍的作者相同,所以這 2 本書籍相似;
比如基于所有用戶的行為分析,給《笑傲江湖》好評的用戶,也給《鹿鼎記》好評,所以這 2 本書籍相似,通過用戶的行為挖掘出內容之間的相似性,再利用內容之間的相似性做推薦;
比如基于內容受眾的重合度,喜歡看《笑傲江湖》的用戶跟喜歡看《鹿鼎記》的用戶重合度比較高,所以這 2 本書籍相似……
因為基于內容的協同過濾會基于內容受眾重合度進行推薦,但是又希望 2 篇內容重合的受眾是廣泛且多樣,而不是集中在一個小圈子里的,所以基于內容的協同過濾會給用戶設置權重,解決小圈子之類的問題。
② 基于用戶的協同過濾
基于用戶的協同過濾的基本思想是根據用戶的相似度做推薦,因為我跟某位用戶的興趣愛好之類相似,所以我感興趣的內容很可能這位用戶也會感興趣。
舉個例子,
我跟某位用戶的興趣愛好之類相似,我對某篇內容感興趣,但是這位用戶沒有看過,這個時候推薦系統就會給這位用戶推薦我感興趣的這篇內容,而推薦的理由就是我跟這位用戶的興趣愛好之類相似。
至于推薦系統是如何判斷我跟這位用戶興趣愛好之類相似的,其實很簡單。
比如通過查看我跟這位用戶過往感興趣內容的重合度,判斷我跟這位用戶的興趣愛好之類是否相似;
比如通過查看我跟這位用戶的關注列表的重合度,判斷我跟這用戶的興趣愛好之類是否相似……
但是在這個判斷過程存在一個問題,即不同用戶對于同一熱門內容/作者感興趣的概率極大,這樣就容易導致錯誤判斷用戶的相似度。
舉個例子。
《笑傲江湖》是熱門內容、周杰倫是熱門作者,我喜歡 TA 們,我的長輩也喜歡 TA 們,但是我跟我的長輩興趣并不相似。
所以為了更好地計算用戶相似度,基于用戶的協同過濾會降低熱門內容/作者等的權重,避免產生誤判。
③ 地理位置召回
根據用戶所在的地理位置做推薦;只看地理位置,不考慮用戶興趣,基于地理位置、時間順序、優質內容做推薦。
④ 同城召回
與“地理位置召回”同理,唯一不同的是同城召回是根據用戶所在的城市和曾經生活過的城市做推薦。
⑤ 作者召回
根據用戶感興趣的作者做推薦,因為我對某位作者感興趣,所以這位作者的其他內容我很可能也會感興趣。
舉個例子。
我在小紅書上關注了某位作者,但是這位作者最近新發布的內容我沒有看過,這個時候推薦系統就會給我推薦這位作者最近新發布的內容。
至于推薦系統是如何判斷我對這位作者感興趣的,其實很簡單。
比如通過查看我是否有關注這位作者,判斷我對這位作者是否感興趣;
比如通過查看我是否對這位作者所發布的內容感興趣, 判斷我對這位作者是否感興趣……
因為用戶感興趣的作者可能比較多,所以作者召回會優先級根據用戶最近感興趣的作者做推薦,而用戶之前感興趣,但是最近沒有交互過的作者則不會被推薦。
⑥ 相似作者召回
根據用戶感興趣作者的相似度做推薦,因為這位作者感興趣,而這位作者與另一位作者相似,所以另一位作者發布的內容很可能用戶也會感興趣。
舉個例子。
這位作者跟另一位作者相似,用戶對這位作者感興趣,但是另一位作者發布的內容用戶沒有看過,這個時候推薦系統就會給用戶推薦另一位作者發布的內容,而推薦的理由就是這位作者跟另一位作者相似。
至于推薦系統是如何判斷這位作者跟另一位作者相似的,其實很簡單。
比如通過查看這位作者跟另一位作者的粉絲重合度,判斷這位作者跟另一位作者是否相似……
……
2)預估分數的維度
粗排與精排的原理基本相同,實際上就是用不同深度的機器學習模型及神經網絡等,預估用戶對于筆記的興趣,根據預估的興趣分數進行排序,而排序的主要依據是:
機器學習模型及神經網絡等對于內容點擊率、點贊率、收藏率、轉發率之類的指標做預估,做完預估后,把這些分數按照不同權重比例進行融合,比如行業里經常提及的 CES,CES = 點贊數 * 1 + 收藏數 * 1 + 評論數 * 4 + 轉發數 * 4 + 關注數 * 8……最后按照融合的分數給內容做排序和截斷,保留分數最高的內容,淘汰分數低的內容。
上述的 CES 是 2017 年提及至今的,所以哪怕是真的,也已經是過去式啦。
因為真實的內容預估及融合分數算法是不可知的黑盒,所以就只能通過知曉預估分數的一些維度,把控好變量來提高預估及融合分數啦。
① 用戶畫像
- 性別;
- 年齡;
- 用戶注冊時間;
- 活躍度;
- 新/老用戶;
- 高/低活躍用戶;
- 感興趣的類目、關鍵詞、品牌;
- ……
② 內容畫像
- 內容 ID;
- 內容發布時間;
- 內容年齡(內容發布時長);
- 定位;
- 標題;
- 類目;
- 關鍵詞;
- 品牌;
- 筆記字數;
- 圖片數;
- 視頻清晰度;
- 標簽數;
- 內容信息量;
- 圖片美學;
- ……
內容信息量與圖片美學等內容質量維度是小紅書算法打的分數,在內容發布的時候,小紅書就用模型給內容打分,把內容信息量、圖片美學等內容質量維度的各項分數計入內容畫像。
但是內容信息量并不一定需要多,而是需要精準直白,可被機器學習模型及神經網絡理解,因此會發現有許多爆款內容只是幾張圖片、幾句話,其實就是因為內容信息量不多,且精準直白,機器學習模型及神經網絡知道可推薦給誰。
而圖片美學是個比較感性、主觀的東西,但是會有一些基礎標準在,比如真實、整潔、自然等,并不一定需要有多驚艷,關鍵是不能太凌亂,太做作……
③ 用戶統計特征
- 用戶最近 30 天 / 7 天 / 1 天 / 1 小時等時間段的點擊率、點贊率、收藏率、轉發率等;
- ……
④ 內容統計特征
- 內容最近 30 天 / 7 天 / 1 天 / 1 小時等時間段的曝光數、點擊數、收藏數等;
- ……
⑤ 作者統計特征
- 發布的筆記數量;
- 粉絲數;
- 消費指標:曝光數;點擊數;點贊數;收藏數;……
這些特征反映了作者的受歡迎程度,以及 TA 的作品的平均品質,所以假設一位作者的品質普遍很高,那 TA 新發布的作品大概率也會很高。
⑥ 場景特征
- 用戶當前的定位;
- 用戶當前定位的城市;
- 當前的時刻;
- 設備信息;
- ……
2)新筆記的推薦全鏈路
① 機器/人工審核
筆記發布后,小紅書會對筆記內容進行機器/人工審核。
一般是機器先審,假設機器判定為疑似違規或者不可判定的情況下,會交由人工進行審核。
審核主要是圍繞小紅書的相關規則規范,以及一些隱性規則等進行審核。
假設筆記涉嫌違規,小紅書會根據違規程度進行不同程度的懲罰,輕則限流,重則完全屏蔽。
- 輕度限流:減少流量推薦。
- 重度限流:沒有推薦與搜索流量,僅有私域性質流量,即僅推薦分發給粉絲,在小紅書群聊、個人主頁等私域性質界面均可查看。
- 完全屏蔽:沒有任何流量,筆記不可查看,即除自己以外所有賬號/方式均沒辦法查看。
② 打標簽與打分
筆記在審核的同時,小紅書會對筆記進行打標簽與打分,實際上就是用機器學習模型及神經網絡等,識別筆記內容進行內容質量打分,以及預估用戶對于筆記的興趣分數,因為是新筆記,所以小紅書僅能從這些維度去預估分數:
a. 內容畫像
- 內容 ID;
- 內容發布時間;
- 定位;
- 標題;
- 類目;
- 關鍵詞;
- 品牌;
- 筆記字數;
- 圖片數;
- 視頻清晰度;
- 標簽數;
- 內容信息量;
- 圖片美學;
- ……
b. 作者統計特征
- 發布的筆記數量;
- 粉絲數;
- 消費指標:曝光數;點擊數;點贊數;收藏數;……
③ 實時推薦
新筆記的推薦鏈路跟上述“小紅書推薦系統的鏈路”基本一致,但因為是新筆記,所以筆記缺少信息,需要精準推薦。
所以小紅書會把流量向新筆記傾斜,讓新筆記獲得更多的曝光機會,進而激勵作者的發布積極性。
因此,小紅書會在推薦新筆記的時候,會針對新筆記做推薦全鏈路優化,包括召回和排序,讓新筆記有足夠的機會走完鏈路被曝光,且會盡量讓新筆記的推薦做得準,不引起用戶反感。
小紅書會在推薦新筆記的時候,給新筆記增加單獨的召回通道,比如:
- 類目召回;
- 關鍵詞召回。
根據類目/關鍵詞,按照發布時間倒排,最新發布的筆記排在最前面做推薦。
聚類召回:基于筆記的圖文內容做推薦,假設用戶對一篇筆記感興趣,大概率會對內容相似的筆記感興趣。
……
小紅書會在推薦新筆記的時候,給新筆記在排序階段提權,根據新筆記的內容質量、作者質量,給新筆記單獨定一個曝光保量目標,達到曝光保量目標之后,就會停止扶持,讓新筆記自然分發,跟老筆記公平競爭。
這也是為什么有些博主會感覺自己的筆記發布 1-2 小時數據好,但是 1-2 小時之后,數據突然變差了,實際就是因為在剛發布的時候,筆記有差異化提權保量,但是筆記在達到曝光保量目標之后,就會停止扶持,讓新筆記自然分發,跟老筆記公平競爭,所以流量增長速度變慢啦。
3)小紅書搜索引擎的鏈路
小紅書搜索引擎的鏈路主要是 3 個關鍵環節,查詢詞處理、召回、排序。
用戶在小紅書搜索框輸入想搜索的內容后,搜索引擎會對用戶輸入的查詢詞(想搜索的內容)進行處理,主要是分詞與理解。
在處理的同時,搜索引擎會調用一些召回通道,從數據庫里快速取回幾十到幾百篇筆記,一共取回幾千篇筆記,這些召回通道實際上就是不同的算法/規則在作用,從數據庫里進行去重、過濾、篩選。
取回后,搜索引擎會根據對于查詢詞的理解、相關性、內容質量、時效性、個性化等進行排序,再把相似的筆記打散,避免把過于相似的內容排在相鄰的位置上,最后插入廣告和運營內容,以及根據生態要求調整排序呈現給用戶。
① 查詢詞處理
用戶在小紅書搜索框里輸入想搜索的內容后,搜索引擎就會對用戶所輸入的查詢詞(即用戶在小紅書搜索框輸入想搜索的內容)進行處理。
- 分詞;
- 拼寫糾錯;
- 同義詞改寫;
- 針對所分解的詞進行打分,形成不同權重的關鍵詞;核心詞:核心意圖,去掉之后意思完全改變,沒辦法搜索到用戶想要的結果;重要詞:核心意圖的重要組成部分,去掉之后意思有所改變,但是依然可搜索到用戶想要的結果;輔助詞:修飾意圖,去掉后意思變化比較小,對于搜索結果影響不大,但是有利于個性化推薦。
舉個例子。
用戶輸入的查詢詞是“日系中長發男生造型”,所以:
核心詞:男生造型;
重要詞:中長發;
輔助詞:日系;
- 類目識別;
- 意圖識別;
- ……
所以,在選擇關鍵詞的時候,可基于查詢詞處理的邏輯,把搜索熱詞進行分詞,側重植入核心詞與重要詞,以此提高筆記搜索排名。
② 召回
跟推薦系統的召回類似,搜索引擎會根據對于查詢詞的理解調用召回通道,從數據庫里快速取回幾千篇筆記,所以闡述一下搜索引擎召回通道的一些關鍵性原則。
搜索引擎的召回通道會基于對查詢詞的理解及用戶的個性化做推薦,即把對于查詢詞的理解與數據庫的筆記做匹配,筆記匹配上的關鍵詞越多越好,匹配上核心詞加分多,匹配上輔助詞加分少。
所以一個關鍵詞在一篇筆記里出現 3 次比在一篇筆記里出現 1 次好。
所以匹配上核心詞比匹配上輔助詞。
即把用戶特征等與數據庫的筆記做匹配,筆記所預估的用戶興趣度越高越好。
③ 排序
跟推薦系統的排序類似,搜索引擎會用機器學習模型及神經網絡等,預估內容跟對查詢詞理解及用戶興趣等的融合分數,根據分數做截斷與排序,再插入廣告和運營內容,以及根據生態要求調整排序呈現給用戶,所以闡述一下搜索引擎打分排序的一些關鍵性維度。
a. 相關性
根據對于查詢詞的理解,預估內容跟對于查詢詞的理解的相關性分數。
b. 內容質量
作者 EAT:
- 專業性:作者是否有專業資質;
- 權威性:作者在領域里的影響力;
- 可信賴性:名聲好壞、是否有廣告,包括軟廣。
筆記意圖:
- 有益:分享有用的攻略、知識、信息;
- 有害:傳播虛假信息、散播仇恨。
沒有特別的意圖:
內容質量分;
- 標桿;
- 推薦;
- 普通;
- 不推薦;
內容價值分;
點擊數、交互率等業務指標是否達到 Top 10%。
c. 時效性
- 基于對查詢詞的理解,判斷是否有時效性訴求;
- 內容發布時間比較久遠,是否還有價值;
- 發布時間。
d. 個性化
類似于推薦系統的個性化推薦,但是沒有推薦系統的個性化推薦強,預估維度、方式等跟推薦系統類似。
通過這些維度:
- 查詢詞特征;
- 筆記特征;
- 用戶特征;
- 統計特征;
- 相關性特征。
預估用戶對于筆記的興趣度:
- 點擊率;
- 收藏率;
- 轉發率;
- 完讀/播率。
綜上,筆記互動數據高,并不一定代表筆記會出現在搜索前排,出現在搜索前排的筆記是實際上融合等分數高。
4)其他
① 補充概述
小紅書的推薦與搜索各自獨立,但又藕斷絲連。
- 各自獨立:推薦與搜索互不干擾,所以小紅書筆記的收錄與否并不影響推薦;
- 藕斷絲連:筆記在獲得搜索流量后,一定程度上會影響筆記推薦流量。
小紅書筆記流量激增大概率會觸發小紅書二次審核,而二次審核大概率會是機器+人工一起審核;
所以有些筆記在流量激增后被突然限流、掉收錄等,或許是因為二次審核,以及系統對于筆記的實時預估變化的緣故。
正確判斷筆記是否被收錄的方式并不是搜索標題等,而是在創作中心/蒲公英平臺查看筆記是否有搜索流量,有搜索流量即代表筆記被收錄。
假設對于推薦、搜索機制比較感興趣,想深入學習的話,可看看這些內容。
② 推薦系統公開課
基于小紅書的場景講解工業界真實的推薦系統
鏈接 ?? https://space.bilibili.com/1369507485/channel/collectiondetail?sid=615109
作者:王樹森
小紅書搜推算法工程師、基礎模型團隊負責人
③ 書籍推薦
- 《智能搜索和推薦系統》;
- 《推薦系統實踐》;
- 《SEO 實戰密碼》;
③ 公眾號推薦
小紅書技術 REDtech
5)寫在最后
真實的系統/算法是黑盒,但是我們需要理解系統/算法的基本原理/底層邏輯。
二、不同邏輯下的爆款內容生產
1. 用內容投喂算法
用垂直內容投喂算法建立定向標簽,通過簡單、直接、可復制、可批量化生產的內容去獲取精準流量,雖然流量不會太大,但是比較精準。
內容不需要太復雜、太精美,需要的是簡單、直接、可復制、可批量化生產,因為這樣可極大程度降低內容創作成本,以及讓算法理解到位,之所以會有許多簡單的爆款內容出現,實際上就是簡單的內容有利于算法推薦。
2. 用確定性蒙騙算法
對于爆款內容的模仿、復刻等,實際上就是利用爆款內容的確定性去蒙騙算法,讓算法覺得內容質量、價值高。
但是在模仿、復刻的時候,就需要針對爆款內容進行剖析,哪些是爆款因素,哪些是無關緊要的因素,假設做不到比較好的剖析,那就 100% 復刻,包括場景、構圖、產品等,把變量控制到最小,但是需要有一些無關緊要的變量來提高原創度。
舉個例子:
爆款內容的場景是白天,那就換成晚上;
爆款內容拍攝的是左手,那就換成右手……
用同樣的變量替換一些變量,但是內容質量等不變,算法可理解,用戶依然有觸動。
但是并不是所有爆款內容模仿、復刻之后,依然是爆款,因為有些內容之所以成為爆款,可能是運氣之類,因此并不是所有爆款內容都值得去模仿、復刻,值得去模仿、復刻的爆款內容一般是經過反復驗證的、已經形成一定爆款內容模型/范本的。
綜上,怎么發現值得去模仿、復刻的爆款內容呢?
思路 1. 查看品類下的商業報備筆記
假設有品牌商家已經摸索出自己的爆文模型的話,TA 們大概率會通過效果廣告進行放大,所以可使用小紅書數據分析工具,去查看自己品類下這段時間新增的商業報備筆記,找找看有沒有適合自己的測試內容。
思路 2. 查看競品的筆記
邏輯跟“思路 1. 商業報備”是一樣的,所以可不定期使用小紅書數據分析工具,去查看競品這段時間新增的筆記內容,不一定需要局限于商業報備筆記,找找看有沒有適合自己的測試內容。
思路 3. 小紅書 App 瀏覽與搜索
小紅書 App 的發現頁是基于用戶交互行為等的個性化推薦,所以可優先級多搜索自己品類/產品相關的內容,然后再多瀏覽與刷新幾次發現頁,在看到有類似的爆款內容重復多次出現在自己的發現頁的時候,就可針對這個內容去搜索品牌/產品/標題等進行驗證。
3. 人性洞察
爆款內容是可永恒的,小紅書上出現的爆款內容,可能在其他渠道之前就已經出現過。
爆款內容的內核是對于人性的洞察,而人性大概率是不會發生改變的,唯一改變的是對于人性的闡述,以及表現方式。
明星與醫院,天然有可信度;
藍手套、藥單子,哪怕是假的,用戶依然會覺得是有可信度。
4. 寫在最后
1)內容選題 > 封面 > 標題 > 內容;
2)爆款內容創作需要迎合受眾,而非引領受眾;
因為迎合受眾 = 迎合人性,而引領受眾 = 反人性,難而正確。
三、爆款內容價值的極致化利用
所有的爆款內容得之不易,所以需要把爆款內容的價值進行極致化利用。
1. 基于爆款內容進行延伸與再利用
找到爆款因素,基于此出系列內容,e.g.
- 爆款因素是產品,內容成為爆款之后,同步測評同款不同型號的產品;
- 爆款因素是自己的蛻變,內容成為爆款之后,同步更新自己是如何蛻變的;
- 爆款因素是產品,內容成為爆款之后,同步更新產品的細節;
- ……
利用爆款內容博眼球,e.g.
- 用爆款內容截圖作封面;
- 爆款內容的評論區截圖作封面;
- ……
反復重復爆款內容,e.g.
- 忍不住再發一遍;
- 非商業報備發完、商業報備發、專業號轉載發;
- xx 人看過的 xx;
- ……
2. 基于爆款內容進行復刻、創新
跟上述闡述的“用確定性蒙騙算法”差不多,即找到爆款因素,基于此進行復刻,甚至是創新,然后通過博主種草與效果廣告投放進行放大,e.g. 爆款因素是 藍手套 + 真實痛點 + 真實場景,基于此進行復刻、創新即可。
當然有些內容是沒辦法進行復刻、創新的。
3. 寫在最后
讓有效的爆款內容在渠道里流動,被看見、被放大。
本文由@林卿LinQ. 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
你是不是不敢泄露太多天機啊,為你點贊,期待更多分享啊