從B站審核變慢現(xiàn)象,聊聊內容社區(qū)產品的內容風控要點
B站是中國年輕世代高度聚集的文化社區(qū)和視頻平臺,近年來更是財報喜人。不過它最近卻受到UP主對審核速度以及審核機制的吐槽。這背后有什么深層原因呢?本文從產品和商業(yè)角度對此追根溯源,同時也試著分析一下內容社區(qū)產品在內容風控策略上的一些要點。
3月18日,B站公布了截至2019年12月31日的第四季度和全年未經審計的財務報告。2019財年總營收達67.8億元人民幣,同比增長64%,其中第四季度營收同比增長74%,達20.1億元人民幣,連續(xù)七個季度超市場預期。
UP主們一方面欣喜于“小破站”規(guī)模越來越大,另一方面也越來越對B站孱弱的變現(xiàn)能力、混亂的MCN生態(tài)和越來越長的稿件審核時間、越來越嚴苛的內容審核標準表示不滿,尤其進入3月以來,B站UP主投遞一篇稿件,審核時間少則五六小時,多則竟然超過24小時,很多稿件錯過了最佳的發(fā)布時間。
我前不久投遞的一個稿件,審核了超過20小時,作為一名產品經理,我認為有必要從產品和商業(yè)角度,找一找B站審核變慢的原因,同時也可以試著分析一下內容社區(qū)產品在內容風控策略上的一些要點。
一、B站審核為什么這么慢?
一個內容社區(qū)的用戶角色,大致可分為內容生產者(創(chuàng)作型用戶)和內容消費者(瀏覽型用戶),既有內容的生產創(chuàng)作,又有觀眾能夠消化掉創(chuàng)作產能,形成良好的社區(qū)內容生態(tài)。
對于B站來說,UP主們?yōu)閻郯l(fā)電是B站快速增長的重要基礎,也是B站拿下國內最大視頻UGC社區(qū)地位的重要基石。如何服務好這一波內容生產者,是B站一個很關鍵的命題。
B站的社區(qū)氛圍和觀眾品味,都導致了社區(qū)用戶對于作品的要求極為苛刻,UP主們費盡心機,要討好“觀眾老爺”,那UP主受的委屈,當然要在小破站上找回來,平臺要是伺候不好UP主,那UP主就要炸毛了。
因此,3月以來,審核時間大幅變長,引發(fā)了UP主大面積的抱怨,很多追熱點的稿件,等審核發(fā)布出來,熱點都過去了。近日B站審核為什么這么慢?其實正如近幾日美股屢次熔斷一樣,B站審核變慢也是多重原因共同作用的結果。
1. 稿件量激增,創(chuàng)作者作品成倍增長
從2019年開始,B站“破圈”的跡象就越來越明顯,如今,B站已經從一個小眾的亞文化社區(qū),變成多元的大眾化平臺,隨便一個用戶,都能明顯地感受到,來B站做UP主的人變多了。
數(shù)據(jù)也支撐了這一點。根據(jù)B站2019年第四季度財報,B 站月均活躍UP主數(shù)量突破100萬,同比增長80%;其月均投稿量同比增長66%達280萬。與數(shù)量增長相輔相成的,還有稿件類型的多樣化,例如在這段時間入駐并快速大火的“巫師財經”“半佛仙人”、入駐但沒火的“宇宙維修隊亨哼”等UP主,都在印證著B站內容創(chuàng)作在各個領域的破圈。
在進入2020年以來,受疫情隔離影響,B站用戶數(shù)再次大規(guī)模激增,同時受到實體經濟不景氣影響,開始兼職UP主的專業(yè)人士也相應增多。我根據(jù)av號(B站視頻唯一編碼)做了一個保守的大致估算,2018年12月,B站日審核視頻量大約為6萬個,而今年3月,達到了13萬個。
如此快的稿件增長,B站的審核系統(tǒng)很難快速響應擴容,原有的審核資源再繼續(xù)啃翻倍的工作量,自然壓力很大。
同時還有一點,大量作品新增,原有的服務器資源也壓力倍增,視頻轉碼和壓制時間也相應變長,這可以從視頻投稿后的轉碼時間看出。
2. 受疫情影響,B站審核力量難以全量支持
疫情隔離對于用戶來說,是空閑在家有時間創(chuàng)作更多的視頻,但對于平臺來說,意味著大量員工難以正常返崗。
2018年7月,B站在國家多部門約談并要求后整改后,投入運營了位于武漢的新審核中心,擴增一倍以上審核人力。
之后,B站大量的稿件審核都由武漢審核中心完成審核,此次受疫情影響,其他城市陸續(xù)返工,但武漢恢復正常工作秩序尚需時日。
上??偛康膶徍肆α勘旧聿蛔悖覂热輰徍诉@個工作的離職率相當高,年前離職的空缺,年后因為疫情,一時也不能快速補充新的人進來。
一面是入水口變粗,一面是出水口變窄,自然泡在審核池子里的稿件就越積越多。
3. 新規(guī)定帶來新的審核標準
去年12月,國家網(wǎng)信辦針對互聯(lián)網(wǎng)內容亂象,出臺了《網(wǎng)絡信息內容生態(tài)治理規(guī)定》,明確了網(wǎng)絡信息內容服務平臺的責任,從2020年3月起正式開始實行。
在剛剛開始正式施行的這一關頭,誰都不敢松懈,B站也相應地調整了審核尺度的把關,同時,由于新規(guī)定需要更多的培訓向基層審核人員普及,也需要時間適應。
4.B站的內容風控審核機制
相較于其他平臺,B站的審核屬于比較慢的那一種。這當然是由于國情使然,不過也反映出了平臺審核機制的效率問題。如何利用機器審核和人工相配合,如何權衡效率和成本,是B站亟需想明白的問題。
插一句,不存在思考“效率和標準松緊”的問題,內容風控不容半點馬虎,必須以最嚴苛標準為準繩,一條違規(guī)信息,都可能導致整個平臺萬劫不復。
二、內容風控策略的核心要點是什么?
對于一款產品來說,其基本業(yè)務框架的抽象模型可以總結為“業(yè)務”、輔助業(yè)務的“增長”、保障業(yè)務的“風控”和支撐以上三點的“數(shù)據(jù)”。
“業(yè)務”自然是產品最關鍵的地方,“增長”“風控”和“數(shù)據(jù)”都是輔助業(yè)務良態(tài)運行。對B站的內容業(yè)務來說,協(xié)調內容生產者和內容消費者,形成良好的內容生態(tài)是關鍵的核心,輔以用戶增長(包括用戶增長和創(chuàng)作者增長兩個方面),并且對社區(qū)進行風控。
通過業(yè)務的發(fā)展和增長、風控的積累,形成用戶基礎數(shù)據(jù)、注冊信息、瀏覽行為、視覺偏好、用戶標簽等數(shù)據(jù),然后通過這些數(shù)據(jù),再反向支撐業(yè)務發(fā)展,形成產品內的數(shù)據(jù)打通。
本文所要著重分析的,就是風控這一環(huán)節(jié)。 金融產品、信貸產品有風控非常好理解,但其實,所有類型的產品都需要有風控。電商產品要防薅羊毛,社交產品要防欺詐,而內容產品,則是要對平臺內容的質量和合規(guī)性進行風險控制。
對于內容社區(qū)等UGC產品來說,風控線就是生死線。內容和社區(qū)產品的風控壓力來源于監(jiān)管側,風控對象是用戶在平臺發(fā)布的內容。
1. 內容風控要“控”什么?
來自內容側的風險主要有三類。
政策層面的內容合規(guī),要符合監(jiān)管的要求。
監(jiān)管要求的內容可參考最新實行的《網(wǎng)絡信息內容生態(tài)治理規(guī)定》,對于各項違規(guī)內容都做了詳細規(guī)定,大致概括可分為涉政、違禁、暴恐、色情等四類,這部分是政策紅線,一旦觸及,輕則約談,重則下架、封禁。
社區(qū)氛圍的良性導向,如謾罵、隱私等。
這一類型的內容雖然不會觸及監(jiān)管紅線,但倘若內容社區(qū)充斥各種負能量,對于社區(qū)氛圍是非常嚴重的損害,傷及用戶體驗,導致用戶流失,影響產品商業(yè)利益。
這一類型內容風控還包括對于產品運營主體的保護,例如對吐槽公司工作人員的內容進行限流處理、對平臺和產品的詛咒進行刪除等,屬于商譽和公關層面的維護,同時也是對產品官方公信力的維護。
社區(qū)用戶安全的保證。
對于內容和社區(qū)產品而言,平臺內一定會存在導流、灰產、詐騙等不法手段,如何保護平臺內用戶的財產安全和產品體驗,是非常關鍵的,互聯(lián)網(wǎng)發(fā)展至今,導流、詐騙等行為往往是成熟的灰黑產產業(yè)鏈所為,他們擁有豐富的反監(jiān)查和防過濾經驗,揪出他們并進行處理,需要平臺與其斗智斗勇。
2. 內容風控的方法和手段
在最早期的階段,對內容進行風險控制,只能通過編輯人工進行審核。這種方式需要大量的人力物力,而且稿件審核需要時間長,時效性也被大大削弱。一般的公司,很難負擔起龐大的內容審核團隊。
之后,誕生了關鍵詞過濾等手段,成為成本較低,并且使用最為廣泛的內容風控措施。對于命中預設的違禁關鍵詞的內容,直接阻止發(fā)出或者轉交人工審核。這種方式性價比極高,耗費成本小,但基本可以過濾掉大多數(shù)的違規(guī)內容。
關鍵詞過濾存在的問題也很明顯,準確率較低,經常出現(xiàn)誤傷和漏網(wǎng)的情況,對于內容和社區(qū)平臺來說,這是不能容忍的,前文已經講過,哪怕一篇違規(guī)內容被放出來,產品都有可能被封禁。
再加上網(wǎng)絡的普及,越來越多的人學會了通過拼音、亂碼、諧音等方式繞開關鍵詞,關鍵詞過濾逐漸不再能勝任內容風控的工作任務。
以上基本還屬于規(guī)則的范疇,之后內容風控的發(fā)展,就進入了AI+策略的時代。
AI方面,其實叫機器學習更加準確,這是一套組合拳。舉個例子,對于一個視頻稿件的審核,就需要對整個視頻進行逐一拆幀,然后通過OCR文字識別檢查字幕,此時對于字幕的檢查和文字內容的檢查基本一致,文字識別涉及到NLP分詞、語義理解等AI技術;
對于畫面,則是圖片識別,識別圖片中可能出現(xiàn)的違禁內容,這里涉及到一個準確率的問題,暴恐視頻不能夠通過,但游戲視頻也存在戰(zhàn)斗畫面,如何保證不誤傷;對于音頻,則需要兩個方面的審查,一方面是視頻當中的語句,將語音轉文本,再通過文字的審核策略來審核,另一方面是音調識別,例如識別音頻當中的嬌喘等無語句的聲音。
機器學習還是就稿件論稿件,而一個優(yōu)秀的內容風控平臺,是需要配合策略的。策略產品經理是近幾年一個特別火的崗位,提供更精細化的、動態(tài)的、效率的產品解決方案。對于策略來說,內容的風控不能只在單個內容上,還需要結合更高的維度,給與更加精細化的識別判斷。
策略要從單個內容出發(fā),延伸到發(fā)布該內容的用戶基礎信息、關系鏈、過往內容、實名可信度等等諸多維度進行調參和計算,以判斷這名用戶的這條內容是否需要更細致的識別。
這里要特別強調一點,即使平臺的機器算法再先進,所有的內容還都需要過人審核。所有內容過人,所有內容過人,所有內容過人,重要的事情說三遍,至于原因,還是上面那一條,內容和社區(qū)平臺不容有半點閃失。
不過機器平臺越先進,能夠為人工審核提供的輔助也就越全面準確,人工審核的效率自然也就變高,審核人員的壓力也相應減弱。
另外,對于內容風控,又會有前置風控(先審后發(fā))和后置風控(先發(fā)后審)等不同的方式,關于這一點,以后有機會再詳細分析優(yōu)劣和適用場景。
對于B站來說,隨著內容量越來越大,單純的對審核人工進行擴容,恐難以解決問題。相比抖音、今日頭條、西瓜視頻等頭條系產品、背靠百度AI的愛奇藝、騰訊視頻、阿里大文娛旗下的優(yōu)酷視頻,B站崛起晚、資源少、技術儲備弱,在機器輔助審核上還比較弱勢,今后加強內容風控技術,優(yōu)化內容審核策略,改善審核后臺的體驗,不失為一個好方法,畢竟工欲善其事,必先利其器。
作者:亨哼,一個正經的互聯(lián)網(wǎng)產品人,微信公眾號:亨哼陣地(ID:hengpaper)
本文由 @亨哼 原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載
題圖來自pexels,基于CC0協(xié)議
有個問題沒想通,風控積累的用戶基礎數(shù)據(jù)、注冊信息、瀏覽行為、視覺偏好、用戶標簽等數(shù)據(jù),都是紅線的數(shù)據(jù),怎么反向支撐業(yè)務發(fā)展
用戶基礎信息 行為信息 交易行為 應該是個中臺資源,在做風控、用戶增長、交易方面都會用到這個
光收藏不點贊是人性的什么特點~
懶的點2下
收藏僅代表個體意識,不需要客觀環(huán)境表明自己的立場
幾個詞就能概括 ?
入駐但不火??
審核離職率很高? 看來還是要掌握技能啊
原來有個武漢審核中心啊 怪不得