繼純銀視奸渣浪之后,我們來詳聊微博feed流算法問題
繼純銀視奸渣浪之后,本文作者作為從業者+PM,對于微博feed流算法問題,也談了一些自己的看法。
不得不感嘆,在微博清一色被各類大號“林丹出軌”跟風式的刷屏之后,果然我大互聯網行業依舊迸發著陣陣清流,一片欣欣向榮。
其中,以純銀為典范,筆耕不輟。昨天一時興起又聊起了微博算法的問題。視奸渣浪的feed流算法 如此敬業,對于“互聯網欠他一個成功”的說法我至此深信不疑。
好了,話不多說,既然話題拋出來了,作為從業者+PM,也談一些自己的看法。
其實,純銀談論的核心內容很簡單,采用大白話式的普及貼,相對于不那么晦澀,也有利于各年齡段的用戶理解,但確實有點淺嘗輒止。
回顧昨天純銀的文章,幾句話來概括一下:
- 微博對部分營銷號做了標記,對內容推送做了限制,方式是先灰度測試,根據效果擴大范圍;
- 對普通用戶的部分行為做了降權,比如長圖,轉發等;
- 微博開啟了信息流優化,打亂了時間序,增加了未讀池。
微博打亂 time line 的必要性
純銀提到,微博大概分為兩個階段,對藍V、營銷微博和普通用戶特定內容進行限制分發。事實上,降低低質量的互動內容,惡意營銷行為,進一步提升優質內容在站內的傳播曝光,一直是微博在優化的方向。
但為什么要特別強調營銷號和大V呢?是基于產品屬性而言。對于微博來講,社交關系鏈(“關注”的設計)無疑是產品的核心,內容的傳播也是依靠關系鏈的節點做分發和過濾。而微博在其媒體屬性的輔助下,”fellow”關系的影響愈演愈烈。
營銷號和大V無疑是微博的頭部用戶,是所謂的利益所得者。一方面他們掌握站內的流量分配權,占據著絕大多數用戶的互動時間,無疑提高了新的內容生產者獲得流量的機會成本,降低了傳播低質內容的成本。
僅僅是微博面臨這種問題嗎?當然不,微信也有類似“意見領袖”。所以微信也出臺了折疊訂閱號,限制外鏈和遏制H5在朋友圈傳播等種種措施,規避社交分發機制帶來的弊端。
至于灰度測試內容推送,根據效果進一步擴大傳播范圍,并不能單純理解上是打壓。 因為或許在微博看來,只是把它當做優化信息分發的方式,以減少由于單一賬號短時間內,多頻次產生內容帶來的“效果折扣”而已。
不太理解純銀所講的,被“未讀內容池”逐漸取代,是何種意思。因為他并不是“未讀內容池”推出之前微博的低級解決方式,況且此種策略,不僅僅局限于營銷號和藍v,它至今依舊存在于微博的內容生態之中。
況且, ?微博亦可以通過標簽詞挖掘、用戶影響力判定,通過聚類、關聯等相關算法進行聚合,構建分類模型識別出來,無需其所說的折騰得要死的方式,人工梳理、標記。
說的再明白點,即便微博回歸 feed按照time line的排序方式,統一時間維度內,訂閱PO主產生的所有內容也并不是都會刷新出來。(微博M站貌似依舊可以按照時間序)
?微博有沒有對普通用戶降權的說法
大多數情況下,微博用戶被降權,是指系統會通過一系列在線分析策略(包括發布頻率、文本分析、用戶行為、賬號可信度查驗等),系統根據會判斷結果,作出對應的處理動作,比如刪除內容、限制行為等。
但對于類似內容含有敏感字等進行處理,視為某一階段微博對用戶降權,說法是非常不嚴謹的,應屬于反 spam 的范疇。
唯一能夠查到的是,微博確實賦予了頭條文章最高的權重,默認按照熱門微博排序。背后的出發點是微博需要打造原創內容生產平臺,促進自媒體商業形態的形成,屬于戰略和業務驅動。
而假想之中的轉發被降權,是微博引入不同權重因子,推導出相應的衰減公式,并通過衰減效果的對比,逐步確定了相關衰減參數的數值,最終得出了不同用戶內容權重的時間衰減函數,而動態調整排序,一般被運用在熱門微博和找人的場景。
由于微博調整了算法規則,打亂了時間軸,所以,理論上會出現內容權重隨時間衰減導致排序調整的情況, ?但絕對不是純銀列舉的那么簡單。
新浪微博列表頁
微博演變過程運用到了哪些產品策略
之前已經提到過,社交分發機制在內容平臺中,存在種種不完美的現象。所以,為了打破社交等級分化帶來的頭部用戶濫用流量分配,就必須建立新的算法過濾機制和規則。
很早的時候,大概兩三年之前,微博就已經在嘗試,根據用戶的關注、興趣、文本等信息,對相關內容進行合并,依據興趣、熱度等維度對內容進行“智能排序”。
曾經在很長的一個周期內,微博用戶只依賴于關注等強用戶行為操作(關注或熱門微博搜索),而產生內容的閱讀、消耗,再傳播的機會,為了不至于刷不出來內容,渣浪也使用了作弊手段。是不是大家都會或多或少的感覺,“渣浪又給關注了莫名其妙的人!” (現在的動機,更多是商業化的考量)
有限的產品損耗,是為了滿足產品的核心價值。
之后,隨著內容幾何級的遞增,微博逐步將算法融入其社交分發機制,推出了多條產品策略:
- 增加了互動朋友的行為動作提示,比如朋友互動過的內容,朋友新的關注好友操作,并提升好友分享過新聞的權重;
- 在時間流的頂部呈現用戶錯過相關性大的微博;
- 基于用戶自主設置,提升特別關心人的微博權重(微博頭條就不算了,付費項目)
- 檢測用戶近期互動行為的相似性,對關注的人,互動性頻繁的好友,優先分發,提升互動行為;
- 小范圍內嘗試打亂時間線,根據相關性和興趣組織內容。
所以可以看出來,微博正在結合用戶的社交關系以和算法對于對信息的二次過濾來確立內容的組織方式。
這也就驗證了,微博打亂Time ?line 的終極目標,不在于是否用戶錯過了有價值的微博,也不是關心單位時間內用戶刷不刷得到新的內容,而是解決在內容過載的背景下,潛在優質內容的分發問題。
(而純銀的表述給我的理解是,微博是在解決,沒有內容刷或優質內容錯過了看不看得到的問題,我理解是用戶在使用期間內,微博應該解決讓用戶看什么的問題,這本質上是兩個問題。)
建立在如此論據下,微博依據某一時間內,內容的冷卻衰減公式,結合互動行為,重新定義內容的排序方式,增加了未讀優質內容曝光的機會,是比較容易營造出“未讀內容池”(看過+沒看過內容)的直觀感受。
@來去之間 曾經也提到了他的擔憂:
互動行為增速沒有用戶規模增速快,主要還是信息流內容增速太快,比如你關注了100人,可能你每天閱讀的信息和您收到的信息大概是十分之一不到,這是一個核心的問題。比如像央視新聞這樣的賬號,內容發的太多太快,普通用戶發的內容被稀釋的越來越厲害了,這種稀釋對普通用戶來說是不利的。
最后,個人表示非常認同純銀的某些觀點:
- 微博調整算法排序后的時效問題。對于微博的定位,傾向于它是“基于興趣的社交媒體平臺” ,與FB式的設定仍有細微區別。部分用戶也是將它作為新聞客戶端的替代品去看的,所以時效非常重要,錯亂的時間序有點炒冷飯的味道,有損內容的價值。
- 調整后會提升微博的閱讀量和互動行為,制造更多令人發指的商業變現場景。
當然,也有不認同的,比如這句:
從產品專業的角度來講,當feed流速到了某一個地步,用算法來優化內容構成就是一件不可避免的事情,挨罵也是一件不可避免的事情。
諾,看看微信朋友圈,多克制。
本文由 @錢熠辰Mlio?原創發布于人人都是產品經理。未經許可,禁止轉載。
寫成這樣程序員大哥可能還得拉你過來讓你用大白話解釋一遍~
看不懂~
?? 說實話,這篇好水。。。寫的都什么玩意????????
“而是解決在內容過載的背景下,潛在優質內容的分發問題”這個是匯報時候用的術語。大多數團隊和產品在做這個改進時,做的就是純銀描述的那么淺顯易懂。
叫微博的技術來寫點干貨吧!