頭條的算法推薦,并不神秘!
近日以來,總能看到許多用戶隱私泄露的事件,在紛紛擾擾的質疑聲中,今日頭條也中箭了。事實上,頭條的精準推薦并非獲取了用戶隱私,而是采用了縝密的算法機制,讓我們看看筆者是如何分析的吧?
大數據時代,用戶對于個人隱私無處安放表現出極度的不安全感,近年來315曝光的一些用戶隱私泄露、甚至公民信息被非法販賣的事件,可謂觸目驚心!而每年兩會采納的相應用戶隱私保護提案,也正逐漸完善相應的法律保護邊界。
內容推薦引擎、個性化定制千人千面自從今日頭條大放光彩之后,開始被很多知名APP所采納。不過,用戶與信息流平臺之間的關系有些微妙,一些用戶既享受到了App通過數據收集帶來的便利,也擔心過于精準化的推薦所帶來的“煩惱”。
3月下旬,網上出現一些對餓了么、美團外賣等餐飲O2O平臺通過錄音權限竊聽用戶隱私的質疑。餓了么、美團官方均予以否認,并認為利用錄音提取關鍵詞進行本地商品服務推薦是一種“無端的猜測”,況且相應的技術條件還達不到。
幾乎在同時,今日頭條在類似的質疑和謠言中并未幸免,大致的描述通常是這樣的——“我和我朋友昨天在談論xx,第二天頭條就向我推薦了xxx”;“我在某某App剛看過xxx,第二天頭條就向我推薦了xxx”等等,一些用戶也帶入到是否頭條也通過錄音竊聽用戶隱私的“自證預言”之中。盡管頭條官方辟謠,但由于今日頭條在內容興趣推薦精準度方面逐漸提升,類似用戶的“猜測”并沒有釋然。
這種現象本質上是很多用戶對算法不了解,從不了解到恐懼,甚至產生了一種“迷信”態度,誤以為內容推薦引擎是一種“讀心術”,可以知曉人很多隱私。事實上,從頭條、快手的崛起可以看出:興趣引擎(機器主動精準推薦)已經開始逐漸取代搜索引擎(人發起需求精準找),成為新的底層技術架構。在未來二者之間的融合也會成為信息分發平臺的主流,這也是目前百度App、今日頭條從不同擅長領域進取的方向。如果懂的人不講,不懂的人瞎說,以訛傳訛只會加深了對新技術的誤解。
一、對用戶隱私的獲取邊界,是算法的權限
推薦引擎與搜索引擎的區別在于:前者是系統給用戶推薦,而后者是用戶主動發起尋求;所以,推薦引擎在啟動期的時候,需要放在內容池中測試用戶的興趣,再基于用戶上網的行為數據進行定制化推薦,顯然更依賴用戶上網所產生的數據。
關于這一點,今日頭條在《隱私政策》中并沒有否認:
第(1)條即為“為了保障產品的正常運行,實現個性化推薦、發布信息、互動交流、搜索查詢等核心功能以及其他功能,我們會收集你的部分必要信息?!?/p>
第(2)條中提到了收集的是用戶的哪些信息,“在你進行注冊認證、發布信息、互動交流或使用基于地理位置的服務時,基于法律要求或實現功能所必需,我們可能會收集姓名、聯絡方式、通訊錄、圖文、音視頻文件、地理位置等個人信息?!?/p>
根據網絡評論實名制的要求,上述條款在如何一款資訊類App之中幾乎都是一樣,而所收集的“音視頻文件”與“圖文”是已發布的信息,并且是基于法律要求或實現功能所必需才進行收集,在第(5)條又重申“我們將努力采用合理的安全措施來保護你的個人信息。特別地,我們將采用行業內通行的方式以盡最大的商業努力來保護你個人敏感信息的安全?!?/p>
(圖片來自頭條隱私政策)
如果把頭條的推薦引擎比作一臺人工智能(AI)機器——人工智能的特點“比你更懂你自己,幫你干活還不累”,應用在信息分發領域,要實現智能推薦,須有足夠豐富的用戶大數據作為算法的訓練場景,這些數據的源頭活水即用戶“關注、收藏、搜索、瀏覽偏好等”等上網使用行為數據,作為個性化推薦的“燃料”。
并且AI還能根據“反饋、發布、點贊、評論等用戶主動發起的行為以及明確授權同意開啟的地理位置信息”來動態調整算法推薦,因而說到底,算法的推薦也是“后置的”分析處理,并沒有“先知”窺探能力。
對于通過“錄音竊聽用戶隱私”的擔憂,筆者發現條款里是這樣寫的,“你使用上傳圖片、發布音視頻功能時,我們會請求你授權相機、照片、麥克風等敏感權限”。就跟使用微信不開啟麥克風無法發送語音消息、使用滴滴沒有授權用戶地理位置無法打車是一個道理,開啟麥克風這一“敏感權限”只會在上傳音視頻時才會主動由用戶開啟,而所謂的“竊聽”則是在用戶不知情的情況下后臺開啟并用于不正當用途。
(圖片來自頭條隱私政策)
至于App開啟用戶麥克風進行錄音竊聽,需要遠程操控用戶手機,一般是黑客在用戶手機先放病毒安裝包,市面上的手機系統和病毒軟件把這樣的安全漏洞也解決了。即使是App通過麥克風錄音要綜合考慮語速大小、音量大小、環境音大小、語音清晰度以及地域口音等因素,其語音識別準確率非常有限、商業用戶價值不大,遠遠不如通過用戶上網行為數據進行推薦來得直接有效。
算法推薦除了用戶個性化資訊push外,還應用在廣告精準推送和營銷上,這構成了目前信息流產品的主要商業模式。
二、從微頭條、抖音推薦內容中管窺社交在算法機制中作用
頭條系產品的形態不一樣,但是底層技術是一致的,尤其是基于用戶上網行為分析出興趣圖譜、推薦潛在感興趣或有用信息的引擎是一樣的。
頭條產品在2017年4月份上線微頭條之后,頭條系統推薦內容的確更加精準化了,此前很多媒體人罵頭條內容low,現在基本上是聽不到了。
原因有以下兩點:一方面,頭條的流量上漲吸引了很多優質原創作者,導致其內容生態整體質量上有提升;另一方面是引入微頭條等社交關系鏈之后,系統在啟動期不需要釋放不同類型、關鍵字領域的內容來測試讀者的興趣點,而是會參考互動頻次最高的網友,以篩選或相關領域的內容推送給關系鏈上的用戶,通過社交緊密程度輔助內容個性化推薦的準確率。
如果用戶有兩臺手機分別不同的頭條賬戶就會發現,“在微頭條中互動的頻次比較高,并且會直接影響到系統內容推薦。而系統推薦的一些大V,往往也是好友所關注的,這加速了一些大V吸粉的效率。”一位關注阿星微頭條,并且經?;拥暮糜严蛭曳答?,“頭條不只是完全的信息‘流’,很注重粉絲的留存。”
(第一張圖和第二張圖是新手機頭條賬戶;第三張圖是我經常使用頭條號頁面,相關度很高)
社交關系鏈的引入對頭條內容進化來說是一次“蝶變”,以往頭條的推薦只需要根據用戶本身上網數據進行興趣推薦;引入到社交因素之后,除了根據機器默認用戶興趣偏好以外,還會把好友已經看過的西瓜視頻、小視頻、悟空問答等推薦給新用戶,從而大大產品的使用粘性。
類似的作用機制與微信公眾號中好友通過點贊“在看”篩選優質內容如出一轍,不過,以社交推薦內容的方式在頭條相對隱蔽,也更為數據化。
同樣的機制也會出現在抖音的流量推薦之中,第一步是機器測試、積累數據后識別用戶的興趣愛好;第二步開始引入互動高頻的抖音好友完播、點贊、評論的內容,從而讓用戶在刷抖音時獲得沉浸式體驗。
在第一階段的抖音,機器會更換美女、帥哥、美景、搞笑、萌娃、寵物、才藝、技能、情感、干貨等不同類型進行測試,在興趣標簽相對寬泛時,信息流推薦容易出現審美疲勞,并導致火爆的視頻創意演變為套路化的程式。
而在引入社交相關度個性化推薦之后,用戶刷到的下一個短視頻,推薦權重最高的是——很多概率會是抖音上互關的好友點贊過短視頻,會做優先呈現;如果你關注的好友很少,這種體會將更加明顯,機器默認為好友感興趣的視頻你也會喜歡。這一點上看,抖音進行流量推薦也并非神秘莫測。
「假如你有兩個抖音賬戶,你會發現抖音推薦的小秘密?,那就是會直接推薦關系鏈上(互關的、互動高頻的朋友)看過的視頻。比如:在另一個手機上點的視頻,會推薦到另一賬戶之上;要是找不到此前看過短視頻,只要在另一臺手機上一直往下刷,一定可以刷到!另外,西瓜視頻的推薦也是如此,這讓我找到了自己喜歡刷西瓜視頻的原因,因為機器默認我的朋友大體上和我的欣賞趣味是一致的,所有看起來厲害的算法推薦,其實也是有社交的?!?/p>
我曾把這個微頭條征求其他好友確認,發現這并非個別情況:
(同時兩臺不同手機登陸不同的賬戶刷抖音,重合率非常高并非偶然現象)
在微頭條、抖音之中都有一個特點是:每一條更新內容的流量與粉絲量的大小并無強關聯,頭條的算法推薦擺脫了自媒體對私欲流量的依賴,只要是優質的并且有高強度的互動率內容,都有可能“爆”。這表明:社交因素在其中既起到了甄別內容質量作用,也引導著賬戶間互動。
三、理解算法機制,信息流平臺“懂用戶”是靠技術
算法型驅動產品不僅在信息分發中逐漸成為主流,還大量應用在電商以及O2O交易平臺之中,這也是為什么現在淘寶強調內容電商、拼多多強調“去中心化的商品興趣推薦”的原因。頭條用戶、市場人常文平認為,“算法推薦雖然方便,應用在電商平臺,系統會結合用戶此前的搜索數據結果顯示推薦,一些已購買的商品重復推薦會白白浪費一些流量位置?!?/p>
這意味著,在內容領域“篩選”已消耗的優質內容的邏輯是否能真正在電商領域跑通,依然在摸索之中。
信息流平臺的推薦算法引擎被認為容易導致用戶獲取其他視角或領域的內容受到局限;一些盲目的、無意識的點擊都會在后續帶來大量并不會真正想看到的內容,在新用戶啟動期時容易出現。
解決此類問題的辦法是用戶有意識地訓練手機的應用里的機器,才能得到高效、適合自己的個性化頁面;與此同時,算法產品會越來越重視“好友圈”,通過人群親密程度與共同話題來更新用戶的興趣圈層。當然,如果以后信息流平臺能夠設置到“特別關注”好友,把好友認可的內容分享給關注對象,或許能有助于優質內容獲取到更多的流量。
頭條用戶稱呼“太準了”以致于出現對用戶隱私利用的猜疑,背后也反映出今日頭條產品在“個性化推薦”上的確愈發成熟化。根據筆者的觀察,今日頭條之所以能夠達到這種境界,與其他信息流平臺有兩個不同的特點:
一是,頭條產品的流量是復合利用的。頭條為了實現人機互動的高頻,不斷在今日頭條App接入新的功能:自媒體資訊、西瓜視頻、火山直播、小視頻、微頭條、悟空問答、電商櫥柜、付費專欄、圈子、小游戲……用戶使用產品功能越多,平臺識別用戶的畫像體系越清晰,系統推薦就越個性化。
二是,頭條系眾多產品把技術力量和流量資源的“復用”發揮到極致、邊際成本降低。而其他很多公司如果不看到這一點,盲目去做多個App就會陷入到兵力分散、人才浪費的困境之中。
結合頭條算法結合興趣社區與社交因素的推測可以看出:頭條做社交特點并不是表現在及時溝通上,而是通過內容作為共同連接點,拉近粉絲與自媒體、用戶與用戶之間的聯系。如果說微信的內容是為了社交粘性服務的,那么頭條的社交如微頭條、多閃等并非突出聊天,更是為了內容推薦更精準、用戶粘性更高,從而實現推薦“場景化”,以致于“懂用戶”信息流平臺被誤會有“用戶隱私”的不安全感。
四、結語
用戶隱私保護在全球范圍內都是一個永恒話題,去年Facebook因為泄露用戶隱私負面事件導致市值大跌;國內用戶對于用戶隱私的焦慮和關切也與日俱增,隔一段時間國內就出現一些濫用用戶隱私的質疑,這需要引起平臺型企業的重視——堅持把用戶利益放在首位。
通過機器記憶的辦法來進行自發推薦,是信息分發更加智能化的表現,也使得用戶隱私保護自然成為更為敏感環節。用戶敏感隱私與網友所產生的數據本身是有區別的:前者屬于法律范疇,后者是技術范疇。個性化推薦意味著平臺對相應的隱私保護的升級,這事關信息流平臺生存的根本;沒有用戶數據資源為基礎,信息流平臺的個性化推薦和商業化也是空中樓閣。
對頭條算法上述解讀不難發現:內容推薦算法既離不開用戶上網行為數據化,也離不開用戶所關注的人,是“信息找人”與“人找信息”相輔相成;算法由人創造,也可以服務于人,其邊界和權限也可以由人來控制的,無需進行妖魔化或者神秘化。
#專欄作家#
靠譜的阿星,微信公眾號:靠譜的阿星,2018年人人都是產品經理年度作家。外國哲學碩士,專注于互聯網行業分析,寫文章力求透徹落地。CMO訓練營導師兼專業合伙人,靠譜匯創始人。
本文原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
點贊
內容管理