智能算法:個性化推薦到底是不是今日頭條們的原罪
近日,人民網連發《不能讓算法決定內容》、《別被算法困在“信息繭房”》、《警惕算法走向創新的反面》三篇評論文章,指出以今日頭條為代表,單純依靠算法推薦的平臺存在價值觀缺失、制造信息繭房、競爭手段屢破底線三大問題。
而后,人民網又發表文章《今日頭條如何用算法打擊“標題黨”》,為算法正名。
人民網如此頻繁的關注智能算法推薦,那么智能算法推薦到底是什么?于今日頭條意味著什么?為今日頭條帶來了哪些問題?今日頭條的智能算法推薦又當何去何從?
一、智能算法推薦是什么?
所謂智能算法推薦,是把合適的內容推送給合適的人,平臺相當于流量分發機器。推薦算法大致分為三類:基于內容的推薦算法、協同過濾算法、基于知識的推薦算法,此外還有以加權、串聯、并聯等方式融合以上算法的方法。
相比人工推薦,智能算法推薦投入產出比更高、覆蓋面更廣、個性化程度更高,但風險把控能力相對較低。
近來年,智能推薦算法在信息分發市場中的地位越來越重要,甚至已呈現出算法推薦超過人工推薦的趨勢。
盡管智能推薦算法五花八門,在內容分發市場發揮的作用也越來越大,但是算法沒有思維,有思維的是隱藏在算法背后的人,算法的呈現形式由人的價值觀決定,由人的利益驅使。
人工智能技術與服務提供商第四范式的互聯網業務負責人周開拓在接受記者采訪時表示:
“算法推送出的內容是企業自己在其中進行權衡的結果”
“人工智能,其實先有人工,后有智能,算法本身是沒有傾向的。我們在推行的時候會把用戶體驗拆成兩小塊,一個是短期體驗,另一個是長期體驗。所以長期和短期體驗的權衡,不是算法決定,而是人為決定?!?/p>
二、智能算法推薦于今日頭條意味著什么?
2012年,移動資訊平臺領域仍是騰訊新聞、搜狐新聞等傳統PC端媒體的天下,其內容提供手段沿襲傳統媒體模式:優質內容+編輯精選。然而隨著泛娛樂化、社交化時代的到來,用戶已不滿足于被動接收信息,他們渴望生產內容、渴望創造影響力,傳統移動資訊平臺難以滿足用戶的個性化需求。
張一鳴緊緊抓住這一機遇,于2012年3月創立今日頭條,致力于為用戶提供個性化、社會化的移動資訊平臺,基于數據挖掘,為用戶推薦有價值的、個性化的信息,提供連接人與信息的新型服務。誕生僅一年多時間,今日頭條便已在中國手機新聞客戶端活躍用戶分布榜單中占據一席之地,并高居用戶滿意度榜單榜首。
(圖片來源:艾媒咨詢2013年中國手機新聞客戶端活躍用戶分布)
(圖片來源:艾媒咨詢2013年中國手機新聞客戶端用戶滿意度)
2014年6月,今日頭條估值為5億美元,截至目前,經過三輪融資,估計已近200億,其估值在三年內增長約40倍。
據公開數據顯示,2017年5月,今日頭條激活用戶數已經超過7億,月活躍用戶數超過1.5億,單用戶日均使用時長超過Facebook,達到76分鐘,日均啟動次數約9次。
智能算法推薦在今日頭條的個性化服務及快速崛起中扮演著至關重要的角色。據了解,今日頭條共有4萬臺服務器進行運算,來保證以秒級速度收集信息,對用戶特征作出反應并推送信息,2016年更是成立人工智能實驗室,主要研究自然語言理解,計算機視覺,?機器學習(算法與系統),人機交互等AI技術。
憑借著智能算法,今日頭條快速抓取用戶數據,精準分析用戶需求,高效把關內容質量、進而實現個性化推薦,這也是今日頭條能夠殺出重圍,在移動資訊領域站穩腳跟的核心優勢。
智能算法推薦帶來了哪些問題?
智能算法推薦于今日頭條的發展功不可沒,然而由于根據閱讀量、閱讀時長、轉發量、過往閱讀行業實施推薦,缺少必要的內容審核機制,容易導致為抓住用戶眼球而犧牲文章質量問題的出現。
正如人民網《不能讓算法決定內容》一文所說:
內容能否推送、推送給誰,由機器說了算,依據的標準就一條:能不能抓眼球、能不能吸引用戶。單一的標準不僅容易忽視優質內容更為豐富的面向和維度,也增加了把關內容產品的難度和成本。
這也就不難理解,為什么即使事后不斷處罰違規的內容賬號,卻無法停止劣質內容的再次生長。
今日頭條質量低下問題已多次引起官方關注。
2017年以來,今日頭條三度遭約談,成為低俗內容重災區。
- 1月6日,北京市網信辦發現今日頭條”頭條問答“欄目多次登載”庸俗討論話題“,對今日頭條提出嚴肅批評,并責令其整改;
- 4月,央視曝光了今日頭條向用戶推送”艷俗“直播平臺:火山直播
- 4月18日,北京網信辦、市公安局、市文化市場行政執法部隊聯合約談今日頭條、火山直播等平臺,責令限期整改。
- 7月,北京市網信辦約談今日頭條、微博等網絡信息平臺,并永久”封殺“了一批”內容低俗“的違規自媒體帳號。
今日頭條自己不生產內容,依靠智能算法抓取別人的內容,容易導致侵權問題的發生。粗略統計,近半年來,今日頭條涉及的版權糾紛就有近10起。
今日頭條內容質量低下、版權糾紛等問題的出現,真的是智能算法推薦的錯嗎?
人民網《今日頭條如何用算法打擊“標題黨”》一文中提到,”很多“標題黨”常用的內容元素其實都是可以在文本層面進行總結的,交由機器處理的效率會更高“,實則間接為智能算法推薦正名。
正如周開拓所說:
“人工智能,其實先有人工,后有智能,算法本身是沒有傾向的”
“算法推送出的內容是企業自己在其中進行權衡的結果”。
內容質量低下,源于平臺的利益目的及部分用戶對“低俗”內容的需求。
今日頭條的算法推薦與內容識別大部分是依靠用戶的行為,會在用戶瀏覽信息時智能抓取關鍵詞,并給用戶畫像,對用戶進行歸類,進而根據關鍵詞匹配出相關內容,最后將這些內容推薦給用戶,若用戶閱讀的低俗內容多,則相應推薦的低俗內容也會多。
智能算法推薦是技術發展的產物,技術本身并沒有錯,只是在高速發展的背景下,承擔了平臺利益屬性及部分用戶“低俗“需求的罪過。
今日頭條智能算法推薦的出路在哪?
人民網的一評、二評、三評,根源直指內容質量低下,為走出困境,今日頭條需提高內容質量,重視人工編輯的作用。
1、今日頭條遲遲不愿在提升內容質量上發力,源于其兩難選擇
今日頭條的內容質量問題自成立之日起,便為大眾所詬病,然而直至今日,仍是漏洞重重。2017年4月,經過北京市網信辦、北京市公安局、北京市文化市場行政執法總隊聯合調查,今日頭條并未能有效履行主體責任,在信息審核、應急處置、技術保障等方面存在制度缺失,在直播內容、用戶分類管理、真實身份信息認證、處理公眾舉報等方面存在重大管理漏洞。
究其原因,在于剔除較為低俗的內容和作者會導致大量用戶流失,而用戶的流失又可能會使優質原創作者將重心轉移到到其他自媒體平臺。對今日頭條而言,主動嚴格監管廣告內容勢必會影響其商業利益,但放松監管又會對平臺信譽產生影響,兩難境地必將經過一番博弈。
2、時至今日,面對官媒的連續實捶,今日頭條不得不直面問題
9月21日,今日頭條對人民網的三評做出回應稱將“正視不足,勉力前行”,并指出,“機器學習和人工編輯,在現階段,是相輔相成的。未來也是如此。再聰明的人工智能,也只是一個需要不斷升級的工具,而人是不可替代的。這是一個不斷磨合和優化的過程。這也是人民網三篇評論的價值所在。”
3、今日頭條欲走出困境,提高內容質量、重視人工編輯的作用是關鍵,算法推薦+人工編輯是大勢所趨
信息爆炸時代,如果沿用過去的人工推送的形式,顯然會面臨效率低下、難以滿足“千人千面”的個性化需求等問題,而算法推送則大幅提升了推送效率和推送針對性,使用戶從海量信息中解放出來。但是由于無法準確判斷內容價值,單純依賴算法進行個性化推薦容易導致內容質量低下,需要人工編輯修正對機器進行干預,降低點擊率對算法推薦的影響,加強對高價值內容的人工干預,算法推薦與人工干預相結合將是大勢所趨。
面對普遍存在的內容質量困局,已有平臺開始實踐算法推薦+人工編輯的優化路徑。
- 2016年10月,一點資訊請來原新浪網總編輯陳彤做總編輯,CEO李亞在也毫不掩飾的說:陳彤加入一點資訊,就是因為機器算法有缺陷。
- 2016年12月16日,Facebook上線Fact-Checking(事實審核)機制,將用戶舉報過多的信息交付機構記者來判斷,如果記者判斷這則內容是假新聞,就會將內容標記為存在爭議,一方面會在前端頁面提示給用戶此內容可能失實,另一方面會從分發量的角度進行控制。
- 2017年5月,扎克伯格發帖稱Facebook會再招聘3000名內容審查員,在此次招聘后將會達到7500人。審查員會過濾社交媒體上的不適當內容,如戀童癖、身體暴露、種族仇恨等內容。
面對官媒的壓力、大眾的輿論,今日頭條需及早完成流量與質量博弈,找到一條算法推薦和人工編輯的平衡之路。
作者:智能相對論(微信id:aixdlun):2個前人工智能行業管理咨詢老鳥+1個老媒體人組成的三人幫,深挖人工智能這口井,評出咸淡,講出黑白,道出深淺。
本文由 @智能相對論 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自 Unsplash ,基于 CC0 協議
低俗內容不是今日頭條原創的,是那個原始數據來源的平臺上的,只是因為今日頭條的用戶多信息量大,曝光率也就高了。算法背了這個鍋。希望有關單位不要只盯著算法,還要整治低俗內容的來源。
但是這是今日頭條的核心競爭力,現在要改的話,估計傷筋動骨。