公眾號“亂序”猜想
編輯導語:從2018年開始,微信公眾號陸續(xù)推出訂閱號“信息流”改版,文章推送排序也從之前的按照發(fā)布時間變成了根據訂閱號的優(yōu)質程度、用戶對訂閱號的喜愛程度以及群發(fā)文章的內容質量等綜合因素動態(tài)變化。本文作者基于公眾號“亂序”推送,對微信公眾號存在的問題展開了分析討論,并對其“亂序”設計分享了自己的幾點看法,希望能夠給你帶來一定的啟發(fā)。
最近在看《內容算法》,一本有關內容推薦的入門書,前今日頭條產品經理閆澤華寫的。
書不厚,但干貨不少,既解答了我此前對于頭條號、豆瓣、知乎等內容平臺部分功能設計的疑問,也給我關于公眾號“亂序”(官方稱之為公眾號智能推薦)的思考提供了一個解題方向。
01 公眾號此前存在的兩個問題
1. 內容重復
內容重復是內容生態(tài)大繁榮的伴生問題,是所有內容平臺發(fā)展到一定階段的通病,非公眾號一家獨有。
一個熱點事件發(fā)生后,權威新聞源(比如人民日報,城市官媒等)會發(fā)布新聞通告,自媒體會從不同角度進行評論,營銷號會批量產出蹭熱點的內容。所以我們之前經常會在訂閱號列表里看到,“n屏都是看了標題就不想點進去的內容”。
一篇優(yōu)質文章(尤其是爆文)誕生后,大量賬號也會加入轉載行列。比如“得到”公眾號發(fā)布羅振宇2021“時間的朋友”跨年演講全文后,在我關注的公眾號中,包括但不限于“羅輯思維”、“筆記俠”、“騰訊科技”、“深燃”等都進行了轉載,有的是標題、封面、描述不做修改的轉載,有的是調整其中一個或多個元素的轉載(之所以強調這一點,是因為它涉及到內容推薦優(yōu)化的一個邏輯,第二部分會細講)。
大家來看一個數據,新榜1月9日發(fā)布的:據新榜日常監(jiān)測的162萬微信公眾號樣本數據顯示,2020一整年,公眾號發(fā)文總篇數超過了3.87億,其中標注原創(chuàng)篇數為2289萬篇,占比為5.92%。
2289萬篇文章,其中有多少比例是轉載的,這份成績單里沒寫。
不過,我們可以從新榜2017年的數據略窺一二:2017年原創(chuàng)文章占比4.6%(略低于5.92%),其中11月標記轉載和原創(chuàng)的比例是3:1,也就是說,平均每1篇原創(chuàng)內容被轉載3次。
要知道,這數據還是平均過后的,大號每篇文章被轉載的真實數據往往都是幾十幾百的,而且好的文章會在各個大號中互轉,內容重復展現是比較尋常的。
2. 內容“折疊”
這里的內容“折疊”,不單指公眾號次條以下被真實折疊了的文章,還包括那些出于各種原因沒被讀者讀到的文章。
因為職業(yè)需要,我關注了各種各樣的訂閱號,數量有點多,1071個。所以我的訂閱號消息列表每天都會很熱鬧,有好幾百條更新。不過,我獲取一次性消息的對象條數是有限的,一般是兩位數。也就是說,很大一部分內容是沒有被自己看到的。
這不是個例。
據微信團隊統計,在嚴格的時間排序下,用戶在消息列表看到的卡片,大多其實都是完全不讀的帳號,用戶本身常讀號的卡片,大量都沒有被用戶看見。
內容重復和內容“折疊”這兩個內生問題,直接影響了用戶的內容消費體驗。長此以往,用戶會大量流失,創(chuàng)作者會陸續(xù)出走。這樣的情景絕不是微信公眾平臺想看到的,必須作出應對。
公眾號“亂序”(智能排序)就是微信團隊給出的一個解決方案,目的“是為了讓用戶看到更多更好看的內容。”
02“亂序”該怎么設計才合理?
那“亂序”究竟是怎么“讓用戶看到更多更好看的內容”的?
所謂公眾號“亂序”,從表面上看,是系統在原本嚴格的逆序時間線里,把部分歷史文章抽取出來,穿插其中(經觀察,基本都是穿插在發(fā)布5分鐘內的文章之后)。
這就引出大家都很關心的一個問題,系統是怎么抽取這些文章的,存在哪些策略或規(guī)則?
我們把時間拉回2018年,當時公眾號剛內測按逆序時間線排序的“信息流”(行業(yè)內是這么口口相傳的,盡管張小龍本人不認為這是“信息流”),知名自媒體人caoz在體驗后就提出了一套可能的“信息流”設計策略:
- 原創(chuàng)指標,被認證的原創(chuàng)文章可以獲得1小時的優(yōu)先資格。
- 置頂指標,用戶置頂的公眾號,其內容可以獲得8個小時的優(yōu)先資格。
- 好友指標。如果一篇文章在近期有多個好友點贊,或多個好友轉發(fā),我認為這個應該是我會優(yōu)先關注的內容。這個前提是,我已經訂閱的內容。
- 負評指標。當負評達到一定程度,在排序的時候扣除其一定的時間資格,并基于此降低其排序和曝光量。
這套策略已經有“亂序”的影子了,其中置頂指標,有點類似目前微信團隊已經公布出來的“常讀用戶”指標,而好友指標,很可能也是當下“亂序”策略的重要參數??芍^非常有預見性的想法了。
不過,它主要還是站在保護原創(chuàng)者利益的角度出發(fā),是有局限性的。caoz自己也在文章中承認了這一點,“存在屁股決定腦袋的現象,可能不夠公正和中立?!?/p>
還有一點就是,它沒有解決我們前面提到的內容重復和內容“折疊”的問題。所以我在想,有沒有可能引入另外一個指標:內容消費預判指標(指標名字是自己編的,思路來自《內容算法》這本書)來優(yōu)化讀者的閱讀效率。
根據用戶對內容的消費過程,我們可以將讀者對內容的消費拆解為列表頁消費和詳情頁消費。前者關系到點擊前的消費預判(下圖左),后者則代表了用戶點擊后的消費體驗(下圖右)。
基于這兩個維度拆分,我們能夠得到這樣一張表格(如下圖):
三種場景分別對應了公眾號內容重復的三種處理方式:
情況A(甲、乙兩篇內容,詳情頁都相同,即轉載):
從消費者角度看,甲、乙兩篇內容對用戶來說是具有替代性的。用戶消費了甲內容之后,大概率不需要再消費乙內容了。
那么,如果讀者關注的公眾號中相近時間段內發(fā)布了甲、乙兩篇相同的文章,且讀者已經讀過甲文章了,乙文章就沒必須通過“亂序”穿插到前序消息列表中;但如果讀者兩篇文章都沒看過,系統可以根據其它維度比如原創(chuàng),選擇其中一篇文章進行穿插。
情況B(甲、乙兩篇內容,列表頁相同/相似,詳情頁不同,即同選題):
前面提到,每次熱點事件發(fā)生后,都會產生大量追熱點或蹭熱點的文章。盡管用戶點擊后的消費體驗不同,但是相似的列表頁展示(標題、封面和描述)會給用戶帶來消費決策上的困惑。
如果用戶點擊過了甲內容,他很有可能會認為乙內容和甲內容是重復的,或者并不想在當下密集地看到相似內容,從而忽略/錯過了乙內容。對于乙內容來說,這會導致曝光減少。對于這種情況,應該拉長兩篇內容的展示間隔,通過呈現順序的改變,將相似的內容分散開,從而避免用戶視覺疲勞。
當然,這里的拉長依然遵循當下的“亂序”規(guī)則,不是指在發(fā)布后的5分鐘內。
情況C(甲、乙兩篇內容,列表頁和詳情頁都不同):
這種情況是最簡單的,兩篇完全不同的內容,互相不構成對用戶消費預判的影響,從其它維度進行“亂序”排列即可。
最后,來聊聊官方已經公開的另一個指標,即時效性指標。
公眾號“亂序”功能上線后,一些對時間敏感的用戶比如我們做媒體要求新聞時效性,就會很不習慣。對于這一點,微信團隊在接受知曉程序采訪時透露,“我們的團隊也在加緊對時效性的問題進行更新,我們不是讓時效性的文章一定會出現在所有用戶的第一位,我們會通過算法調節(jié),讓喜歡看時效性文章的用戶,他的時效性文章能夠更快地排到前面去?!?/p>
這段話大有深意,不僅直接表達了時效性指標的存在,也間接說明了公眾號完全可以根據我們的內容消費標簽,實現相對精準的內容排序展示。
注:以上僅代表自己對公眾號“亂序”的猜想,不代表當下公眾號“亂序”的真實算法。
03“亂序”建立的新秩序
微信團隊關于“亂序”的解讀中,我覺得有一段話非常值得深思:
“我們會認為讀者點關注這個按鈕,代表的是過去的他關注了過去的你,因為你的內容也是在變化的,他的喜好、行為習慣其實也都是在發(fā)生變化的,人都是在變化的,內容也都是在變化的。他關注的時候僅僅是代表那個時候的他喜歡那個時候的你,并不能代表未來。
看到一篇好文章,我一般會認為創(chuàng)作它的公眾號會是一個高質量賬號,然后會不吝惜點下“關注”按鈕。
但隨著看到的好文章越來越多,關注的公眾號列表也越來越長,原本嚴格時間線排列帶來的秩序,反而造成了一種混亂和錯位。
有些賬號可以給當時的你大致符合需求的內容,你開始也確實非常喜歡覺得還不錯,當你的訂閱號列表被這些已經不太喜歡的內容占據時,你真正想看的內容的位置就被擠占,比如你通過一個公眾號已經獲取了你看似需要的內容,那你去獲取新內容的動力就已經不太強了。
而“亂序”的出現,就是嘗試打破這種看似有序的平衡,進而建立新的秩序。
這種新秩序,關于內容,也關乎內心。
作者:一拳超人的弟弟,互聯網媒體人,產品愛好者;個人公眾號:游牧志(ID:nomadic-diary)
本文由@游牧志 原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載
題圖來自pexels,基于CC0協議
邏輯太強了,點贊收藏
好文