B站的推薦算法機制大揭秘!

1 評論 6588 瀏覽 50 收藏 7 分鐘

本篇文章以2023年5月最新公開的兩份b站推薦算法為例,具體分析其中的兩大算法:安全算法和推薦算法。作者對這兩種算法進行簡單舉例,方便讀者理解。希望能對你有一定的參考幫助。

最近,有塘友讓挖塘人分享一下B站的推薦算法,今天就來詳細說一說。

B站的推薦算法機制大揭秘!

如今,b站已經是不再是之前的那個二次元內容網站了,它現在被稱為「中國版的YouTube」,流量和用戶近幾年上漲很快,內容也在不斷地向多元化發展。

從創作者或者商家的角度來看,它是一塊香甜的流量蛋糕,但要想吃到這塊蛋糕,還是需要方法和技巧的。下面挖塘人就給大家捋捋B站的內容推薦算法機制。

在正文開始之前,我們說兩個事實:

1)算法不斷更新

其實,b站的運營方法和機制在幾年前挖塘人就分享過,但現在回過頭看,變化太多了。

所以我們需要明白一個事實:那就是各個平臺的智能算法都會不斷更新,不斷地完善。大家不要想著「一成不變」,更不能使用遠古的運營方法來運營現在的平臺,必須與時俱進。

當然,挖塘人也會及時給大家分享各平臺的動態。

2)算法不是玄學

很多人看平臺推薦算法的文章都是別人加工后的或者說根據自己的經驗猜的,但看的人傳來傳去就變成了玄學。

其實,算法不是玄學。它是有依據,有數據指標的,以2023年5月最新公開的兩份b站推薦算法為例,它里面就明確說了很多具體的數據指標。

B站的推薦算法機制大揭秘!

下面,我們來說說,這兩份b站算法報告具體包含了哪些數據指標和運行原理:

一、安全算法

很多人以為作品發布后就會進入系統的推薦池。其實不然,作品發布后首先是被安全算法過一遍,安全算法或者叫過濾算法是各大ugc平臺都有的一種算法,它的目的就是識別不符合要求的內容。

根據嗶哩嗶哩內容安全算法公開的內容介紹,安全算法主要包含三個部分:

  1. 內容理解模塊,它是負責內容識別的模型。
  2. 運營工具,這個主要是方便平臺的維護,可以通過某個特性批量識別某些內容,比如要屏蔽某個劣跡藝人,運營人員可以在數據庫里操作就可以了。
  3. 訓練模塊,這個屬于給算法喂數據的環節,它會讓安全算法越來越完善,這也是我們上面說的算法會不斷更新。

B站的推薦算法機制大揭秘!

那么具體有哪些內容不能通過安全算法呢?

這個在b站的社區中心里都說的很明白,對于一些比較突發的或者平臺臨時在數據庫加的規則,平臺也會作出對應的說明。

二、推薦算法

通過安全算法,只要不違規都可以,但要玩轉推薦算法就沒有那么容易了,因為它的影響因素太多了,而且邏輯也多。

首先,公示的算法機制機理內容明確提到影響一個作品的數據指標有作品的播放量、點贊、投幣、收藏、關注以及分享等正向因素,還有點踩、不感興趣等負向因素。

其次,把這些作品通過上述數據指標會對一批內容進行綜合排序,但并不是排完序就直接展示給用戶。它還需經過去重、打散等處理環節,最后再輸出最終的排序并展示給用戶。

B站的推薦算法機制大揭秘!

按照上面的解釋,大家可能看不懂,這里挖塘人畫了一張圖來幫助大家理解:

B站的推薦算法機制大揭秘!

其中有兩個主要的信息需要我們重視,一個是作品的互動數據,另一個是作品的權重。

1. 互動數據

算法說明里面提到兩個方向的因素,即正反向因素。如果正向因素好,作品的推薦流量就好越多;反之就會減少推薦。

2. 作品權重

算法里的去重和打散等處理其實是在給入圍的作品進行加權排序,它是通過各種系數計算得出的結果。

比如有ABCD四個賬號分別發布了作品abcd,這四個賬號的權重分別為1、2、2、1,作品的綜合排序權重為2、3、2、1。

而根據加權公式:

最終排序權重=作品權重*0.8+賬號權重*0.2

我們可以得出以下結果:

B站的推薦算法機制大揭秘!

所以展示給用戶的順序為bcad。

當然,這里只是為了方便大家理解舉的一個例子。b站的實際加權公式要更復雜,而我們可以操作的是加強作品的互動數據和賬號權重,這樣不管平臺的加權公式是怎樣的,我們的數據都可以盡量得到最大值。

以上就是今天的內容,希望對你有幫助。

作者:挖塘人,微信公眾號:挖塘人

本文由 @挖塘人 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. B站排序中,考慮不同維度因子的正負向傾向是什么意思呢

    來自北京 回復