個性化信息流做錯了什么?
個性化信息流可以個性化地給用戶推薦他們想看的內(nèi)容,其中包含了興趣訂閱、系統(tǒng)推送、好友動態(tài),商業(yè)廣告等等,達到千人千面的效果。
2019年4月11日,新浪微博更新其Android客戶端,新增完全按關(guān)注與時間進行排序的“最新微博”功能,引起了一波小小的矚目。這事實上并非是一個全新的功能,而是找回了微博最初的信息排布方式。
微博公布更新后,迅速引發(fā)好評
無獨有偶,F(xiàn)acebook也在今年4月1日公開了兩項關(guān)于信息流的新舉措,其一是“為什么我會看到這個”功能,是2014年“為什么我看到這個廣告?”的延伸。這一功能試圖向用戶解釋在個性化信息流中為何會在此時展示這條信息。
另一舉措是Facebook計劃將嚴肅新聞與社交內(nèi)容拆分,對嚴肅新聞報道向傳統(tǒng)媒體學(xué)習(xí)采用更多的人工編輯進行干預(yù),用于減少假新聞與謠言對用戶及平臺的傷害。
與十年前“個性化信息流就是絕對正確”的趨勢相比,個性化信息流似乎突然“失寵”了。在這十年中,發(fā)生了什么?個性化信息流變得一無是處了嗎?
也許并沒有,只是用戶和平臺都更能客觀地認識到個性化信息流帶來的益處與害處。
一、什么是信息流?
信息流一般指一個聚合了無數(shù)個動態(tài)的頁面,因此信息流類產(chǎn)品普遍又叫NewsAggrerator(信息聚合器)。信息流并非都是以個性化算法驅(qū)動的,恰恰相反最早的信息流以RSS協(xié)議驅(qū)動,往往嚴格采用“關(guān)注-時間”兩個要素進行排序。即只有用戶主動關(guān)注的主體發(fā)布的動態(tài)會出現(xiàn),所有動態(tài)嚴格依照發(fā)布時間排序。只是在個性化算法引入之前,信息流的概念在國內(nèi)并不流行。
國內(nèi)流行的信息流,一般指個性化信息流,它通過個性化算法驅(qū)動,“關(guān)注”與“時間”兩個要素降級為個性化算法中的兩個參數(shù)受權(quán)重影響。即便是用戶沒有關(guān)注的或者是較早發(fā)布的內(nèi)容,只要算法判斷用戶可能對該內(nèi)容感興趣,便也可能出現(xiàn)在信息流里。
個性化信息流可以個性化的給用戶推薦他們想看的內(nèi)容,做到千人千面。這些信息的來源包含興趣訂閱、系統(tǒng)推送、好友動態(tài),商業(yè)廣告……它們共同聚合而成了今天絕大部分產(chǎn)品里的信息流頁面。
與完全采用“關(guān)注-時間”排序的時間流相比,個性化信息流有兩個較為顯著的差別:
1. 時間流受到用戶關(guān)注范圍的限制,單位時間內(nèi)可供閱讀的內(nèi)容有限,個性化信息流往往是無限的;
2. 用戶對時間流內(nèi)出現(xiàn)的信息往往有較強的控制能力,可以通過關(guān)注、取消關(guān)注或設(shè)置關(guān)鍵詞抓取、關(guān)鍵詞屏蔽增減某一類信息。
這兩種差別帶來的用戶體驗有好有壞,無限的內(nèi)容意味著用戶可以在一定的時間內(nèi)充分閱讀,但同時也會占用用戶更多的時間;由算法篩選信息代替用戶手動篩選,降低了普通用戶在使用內(nèi)容產(chǎn)品時的門檻,避免了用戶“不知道去哪找信息”、“不知道該看什么”的問題,但也助長了信息繭房、謠言與標題黨問題。
從Facebook,到微博微信,再到個性化新聞客戶端,越來越多的信息流產(chǎn)品和廣告用數(shù)據(jù)證明了其強大的威力,它改變了新聞的分發(fā)模式,也為社交媒體開創(chuàng)了全新盈利的模式,甚至培養(yǎng)了用戶的在線新聞消費習(xí)慣。
二、信息流簡史
與許多人印象中的不同,最初的社交媒體并非以信息流排布,無論是時間順序還是個性化順序都不是。比如在Facebook之前的流行的另一美國社交網(wǎng)站MySpace上,用戶面對的不是一個排布著好友最新動態(tài)的頁面,而是自己的個人主頁。
早期的MySpace界面
用戶想要看到好友內(nèi)容得去列表里搜索,進而查看他們的動態(tài)與留言。這在內(nèi)容的分發(fā)、實時性和互動關(guān)系上,都是一種低效率的產(chǎn)品形態(tài)。
改變這一現(xiàn)象的是信息流的鼻祖Facebook,在其問世兩年后的2004年推出了NewsFeed,這款產(chǎn)品第一次將用戶好友不斷更新的信息整合到用戶可見的一個單一頁面上,形成了信息流的雛形。
2009年,F(xiàn)acebook加上了贊(like)功能,開始按照熱門程度而不僅僅是時間線對Feed進行排序,當(dāng)整個頁面在好友量達到一定程度且足夠活躍時,就會具有很強的實時感。
與之前的社交平臺對比,Newsfeed在實時、分發(fā)和交互等特性上取得了完勝。有無信息流首頁可以對一個關(guān)系鏈模式類似的產(chǎn)品造成巨大的差別。
隨著社交媒體的發(fā)展,信息流也在不斷優(yōu)化改變,F(xiàn)acebook的EdgeRank算法的推出以“個性化”取代“時間順序”的一個里程碑事件。
EdgeRank算法就像是Google的PageRank算法一樣,決定了用戶在自己的頁面里能夠看到什么。這最初的目的可能是被用于應(yīng)對移動互聯(lián)網(wǎng)崛起帶來的信息爆炸——
每個人在社交網(wǎng)站上都有太多的好友,每個好友都發(fā)了太多的信息,而用戶卻不一定有時間看完所有的信息,與其讓最新的但用戶可能不關(guān)心的信息淹沒了那些更有價值的內(nèi)容,不如通過算法來調(diào)整一下信息的排布順序。
諷刺的是,按現(xiàn)在我們已知的結(jié)果,個性化信息流事實上與“節(jié)省用戶時間,將注意力放在更有質(zhì)量的內(nèi)容”這一初衷幾乎相反。
2010年左右第一版EdgeRank算法問世。EdgeRank主要有三個因素在起作用:
- 親密度:量化考慮平常里你和這個朋友“走動”是否頻繁,連接是否緊密。是點贊之交,還是評論之交,或是私信之交。
- 邊的權(quán)重:點贊、評論、發(fā)一條文字、發(fā)一張照片、發(fā)一個鏈接,背后用戶付出的成本不一樣,反應(yīng)在邊的權(quán)重上也就不一樣,成本越高的,權(quán)重越大。
- 新鮮程度:新的新鮮事總體上更可能得到用戶的喜愛,F(xiàn)acebook用了一個與時間相關(guān)的指數(shù)衰減函數(shù)來量化動態(tài)的新舊程度。
值得注意的是,此時的EdgeRank基本上只考慮了社交方面的因素,而沒有考慮太多內(nèi)容本身對用戶吸引力,也就是說EdgeRank并不是個性化算法,只是打破了信息一定與時間相關(guān)的這一慣性思路。這在以關(guān)系為主的社交網(wǎng)絡(luò)中比較有效,但不太適合Twitter、微博和后來的個性化新聞客戶端這種媒體屬性較強的網(wǎng)絡(luò)。
2011年之后,F(xiàn)acebook不再提起EdgeRank算法,進入到了后EdgeRank時代。同年Twitter在其信息流中插入商業(yè)化內(nèi)容,正式推出了信息流廣告產(chǎn)品。2012年新浪微博推出信息流商業(yè)化產(chǎn)品,將信息流廣告引進國內(nèi)。
2013年Facebook對信息流的可視內(nèi)容進行加強,開始依照每一項信息的內(nèi)容本身進行權(quán)重排序。同時,無論任何的故事,照片、事件、動態(tài),都會以圖片為主題在NewsFeed里進行顯示,文字的主體性被大大削弱。
充分利用圖片與視覺內(nèi)容的同時,F(xiàn)acebook還試圖把朋友的分享和公共分享區(qū)分開,不僅讓大家只看到熱門文章,還能看到和自己更相關(guān)的朋友和家人的分享。目的是讓新版NewsFeed能給用戶帶來“個性化報紙”的體驗。
2015年,新浪微博開始灰度測試“智能排序”,打破“按關(guān)注帳號發(fā)布內(nèi)容的時間順序排序”,這一功能在日后成為新浪微博的唯一設(shè)置。雖然智能排序上線后,新浪微博的用戶活躍、用戶總量、使用時長等數(shù)據(jù)均有較大幅度上升。
但在民間更愿意用“亂序時間流”這個極具反差的名字來稱呼這一模式,對于使用微博記錄生活和最新資訊(時間強相關(guān))的用戶來說,這種個性化信息流有不少值得吐槽的尷尬,比如在首頁看到三天前的八卦、在早上看到晚安……
網(wǎng)友曾吐槽百度,認為搜索引擎無需增加信息流功能,但在百度上線信息流一年后Google也上線了信息流
次年,UC瀏覽器、百度搜索引擎等App也紛紛上線了信息流,信息流市場的競爭格局正式形成。
到了2017年,國內(nèi)外的信息流產(chǎn)品已經(jīng)是紅海一片?;谏缃魂P(guān)系嘗試輕推薦的微信看一看功能上線,讓微信可消費的內(nèi)容又多了一個維度。老牌搜索引擎Google也上線了GoogleFeed。
谷歌,百度、騰訊不約而同紛紛加碼信息流產(chǎn)品,近兩年更是形成了“有流量就有信息流”的蓬勃姿態(tài),逐漸從傳統(tǒng)的人找信息演進到信息找人。
然后,來到了故事的開始,那些最早啟用性化信息流的平臺,如今又開始了去個性化之路。
三、個性化信息流的愛與恨
為什么“喜愛”個性化信息流?
如果用一句話來說明,為何各大互聯(lián)網(wǎng)公司都跟進了信息流,并且最終都導(dǎo)向與時間無強相關(guān)的個性化信息流。那么理由一定是:信息流,確實好用。
這里的好用分為兩個方面,對用戶和互聯(lián)網(wǎng)平臺個性化信息流都有好處。一方面對用戶來說,盡管有一些爭議,但用戶行為數(shù)據(jù)(活躍度、用戶粘性、用戶時長)指出,大多數(shù)用戶喜愛個性化信息流超于時間順序信息流;另一方面,由于得到了用戶的喜愛,信息流往往有著更好的商業(yè)價值。
(1)對用戶:更好的用戶體驗
信息流“信息找人”的整體思路,革新了自搜索引擎誕生以來的信息檢索模式,是更適合互聯(lián)網(wǎng)的信息傳播方式。
在過去,一個不知道某個信息的人,如何找到某個信息其實在一定程度上是一個悖論。即假設(shè)一個人不知道某項知識,那么它在圖書館里也不可能讀到這項知識,因為圖書館里的書太多,這個人不會注意到相對應(yīng)的書籍。
信息流前的互聯(lián)網(wǎng),與無網(wǎng)時代的信息組織形式相似,需要由專業(yè)的編輯對信息進行篩選、推薦,搜索引擎等信息檢索服務(wù)則需要用戶自身給出問題才能進行反饋。
而信息流的出現(xiàn),更符合信息從“傳者中心”到“受者中心”的現(xiàn)代傳受關(guān)系轉(zhuǎn)移的趨勢,這種趨勢無疑是給予用戶更好的信息接收體驗:
媒體細分化發(fā)展的規(guī)律,更好地滿足了用戶的差異化信息需求,生成個性化的推薦列表。千人千面的形式非常符合現(xiàn)今人們獲取信息的途徑。
同時不斷優(yōu)化的推薦算法也在逐漸迎合用戶的心理,例如強調(diào)社交關(guān)系交互的Facebook,通過從大量的信息中有效地過濾掉用戶不關(guān)心的內(nèi)容,讓用戶可以不錯過自己關(guān)心和聯(lián)系緊密的新鮮事。對大部分用戶來說是在提高單位時間的信息價值,減少噪聲的干擾。
(2)對企業(yè):強大的商業(yè)潛能
從Facebook、微博、新聞客戶端等產(chǎn)品對個性化算法的表述來看,用戶確實更喜歡信息流。因為當(dāng)信息流出現(xiàn)在產(chǎn)品中后,用戶的使用時間更長,頻率更高。搜索是一種有限的業(yè)務(wù),它的邊界受制于用戶初始的認知邊界,但信息流是無限的。
對于商業(yè)公司來說,更長的用戶時間和更多樣的內(nèi)容呈現(xiàn),顯然更利于以廣告位驅(qū)動的商業(yè)模式。穩(wěn)定的用戶粘性給信息流帶了了商業(yè)潛能,通過信息流提升用戶使用時長,也就產(chǎn)生了更多的廣告變現(xiàn)機會。
同時信息流的個性化分發(fā)方式給了廣告主精準定位的可能性,提升了變現(xiàn)的幾率。對于廣告主而言,信息流整合了傳統(tǒng)與新媒體的優(yōu)勢,主動向潛在用戶提供易于接受營銷信息,形成了全新的營銷藍海市場。
為什么“討厭”信息流?
既然信息流在表面上看是平臺與用戶雙贏的,那么為何在經(jīng)歷了僅10年的發(fā)展后,各大平臺卻主動對信息流模式進行了反向調(diào)整,弱化信息流在產(chǎn)品中的地位呢?因為信息流帶來的好處并非完全沒有代價,一味的將整個產(chǎn)品押注信息流,對用戶和平臺自身都有一定傷害。
(1)增強平臺媒體屬性
與搜索算法不同,信息流算法尤其是個性化信息流算法與這個更為難以解釋的內(nèi)部運作機制。最終的產(chǎn)品呈現(xiàn)可能與開發(fā)者和用戶所最初期待的并不一致,而對于一款媒體屬性較強的產(chǎn)品來說這并不一定是件好事。
在美國,信息流遭遇的“假新聞”、“影響大選”等質(zhì)疑,便是這一問題的集中體現(xiàn)。
社交平臺在發(fā)展過程始終存在著與媒體的博弈。美國心理學(xué)家羅伯特·愛潑斯坦研究發(fā)現(xiàn),在美國大選期間,谷歌總是顯示有利于希拉里·克林頓的正面搜索關(guān)鍵詞建議,而對特朗普則總是顯示負面搜索關(guān)鍵詞建議,同時會屏蔽對希拉里的負面搜索關(guān)鍵詞建議。
Facebook也曾遭遇過類似的指責(zé),然而這并不一定是Google或Facebook公司的本意,因為按照這些科技公司的解釋,他們的算法在很大程度上是“自動運轉(zhuǎn)”的。
大眾媒體有四項功能,傳播信息,引導(dǎo)輿論,教育大眾和提供娛樂。社交平臺的媒體屬性讓它們逐漸增強了輿論引導(dǎo)的趨勢。今年5月的一期《經(jīng)濟學(xué)人》雜志甚至指出:facebook不再僅僅是一個虛擬社交的目的地,而是一家可以影響或塑造公眾態(tài)度的媒體機構(gòu)。
信息流可以讓用戶直接從朋友或某些源頭更快地獲取消息,但在引入個性化算法和針對不同內(nèi)容的權(quán)重之后便不再只是如此。算法像是一個黑箱,它作為一種新型的內(nèi)容推薦方式,讓社交平臺的媒體屬性增強,左右用戶能看到和不能看到的新聞與信息,進而影響到用戶的情緒,而更令人不安的是它究竟在往哪個方向影響是連其研發(fā)者也不能完全掌握的。
(2)信息繭房-比想象的更嚴重
面對初次接觸的用戶,機器算法主導(dǎo)的精準分發(fā)可以提升閱讀體驗,但隨著使用時間的延長,也極易導(dǎo)致由信息收窄帶來的一葉障目。信息繭房往往被用于形容那些只使用個性化信息流產(chǎn)品的用戶,由于算法只會向他們推薦他們感興趣的內(nèi)容,長期來看此類用戶的閱讀邊界必然會收到限制。
但事實上,這不僅降低了用戶在一個產(chǎn)品中的使用體驗,同時還讓所有的信息流產(chǎn)品變得“千篇一律”,因為用戶無論進入哪個產(chǎn)品看到的都是自己喜歡的話題與自己感興趣的形式。這與個性化信息流剛剛出現(xiàn)時所代表的“千人千面”正好相反,讓同一個用戶面對不同產(chǎn)品時“共享疲倦感”,消解了互聯(lián)網(wǎng)產(chǎn)品之間差異化競爭的意義。
因此,信息繭房并非對長期用戶體驗有所傷害,僅以平臺商業(yè)利益來講也絕非好事。
(3)多數(shù)人的“暴政”,治理難度增大
對“低俗”的追求,往往與人類共同的原始欲望相關(guān),現(xiàn)代文明社會的規(guī)則讓人們懂得只在私人空間中表達自己的需求。
但遺憾的是,算法并不能理解這一點。
不排除許多用戶在某些情境下,對“低俗”內(nèi)容有一定需求。但沒有人一直對“低俗”內(nèi)容有需求,也不意味著所有人都對低俗內(nèi)容有需求。
“低俗”的信息會刺激人性中的陰暗面,吸引點擊量。當(dāng)大多數(shù)人都會在一些情境下忍不住點擊低俗內(nèi)容時,創(chuàng)作低俗內(nèi)容就會帶來更多的流量與關(guān)注。在沒有人工把控的情況下,算法只會放大這個反饋循環(huán)而不會加以限制。
不知不覺用戶的信息流上便充斥了打著擦邊球的內(nèi)容。
信息流平臺并不總是像公眾質(zhì)疑的那樣有意縱容低俗內(nèi)容,因為一個充斥低俗內(nèi)容的信息流會顯著窄化其目標用戶,將女性、未成年人、老人、格調(diào)較高者拒之門外。
但除非直接引入人工干預(yù),否則算法自身似乎很難理解究竟什么是低俗,因為低俗是一個道德與品味相關(guān)的概念,在不同國家與地區(qū)、不同受教育階層、不同的社會階層、不同文化語境甚至不同時間段里有著完全不同的釋義。
讓算法理解低俗的難度不亞于讓算法理解人類道德,往往流于某些剛性而簡單的判斷標準,比如赤裸暴露、臟話等。而對于那些并非直接色情或直接暴力語言的內(nèi)容,比如帶有映射的黃段子、并不暴露帶有性暗示意味的圖片和視頻,算法卻很難識別到,而后者才是低俗中的“主力軍”。
(4)隱私泄露
用戶隱私保護是互聯(lián)網(wǎng)中長期存在的問題,推薦算法需要用戶的歷史行為信息,或者用戶的人口統(tǒng)計屬性信息,不能很好保護用戶隱私的產(chǎn)品和平臺會讓用戶沒有安全感,F(xiàn)acebook的隱私事件就是很好的例證。但矛盾點是當(dāng)算法擁有足夠多的隱私和信息時,才能夠更為精準地投放。
另一方面,當(dāng)社交屬性與推薦流結(jié)合起來,很多人也會認為這種曝光影響了自己的社交自由程度。一些雜糅的功能雖然是主動性的選擇,但卻提高了社交壓力,更多地暴露了隱私,使原本是匿名的行為成了能被查看的輕度推薦。
四、未來的思路:讓個性化恰如其分
從簡單的時間順序到需要考慮上千個潛在元素,不斷完善的信息流成就了更加個性化的互聯(lián)網(wǎng)社區(qū)。但這個被稱為Facebook10年間最成功的賭注,依然需要在利弊權(quán)衡中摸索前行的方向,尋找到矛盾點中的平衡。在當(dāng)下看來,最好的做法似乎是在算法與人類(用戶與編輯)主動權(quán)之間做好平衡——即并非否定個性化信息流,而是只在恰當(dāng)?shù)那榫诚率褂脗€性化算法。
基于算法推薦的Feed流一定程度上把主動權(quán)交給了機器,在不改變以個性化信息為主導(dǎo)或唯一產(chǎn)品形態(tài)的前提下,用戶、信息生產(chǎn)者乃至平臺管理者自身都處于被動地位。當(dāng)信息繭化、信息無序化紛紛出現(xiàn),用戶的選擇權(quán)和體驗感被削弱等長期負面效應(yīng)漸漸顯露之后,許多平臺選擇改變個性化算法在產(chǎn)品中的唯一地位。
在社交產(chǎn)品領(lǐng)域,設(shè)置多個不同排序方式的流讓用戶自主選擇可能是當(dāng)前一種較好的解決思路。
新浪微博此前推出的“新浪微博國際版”客戶端,一直保持時間排序的方式,便是多流共存的一種模式。本次在主客戶端中“最新微博”功能的回歸,給了更多微博用戶以自主選擇的權(quán)力。
而Facebook對主信息流的算法調(diào)整,減少內(nèi)容分發(fā),讓用戶看到并參與更多“有意義的”內(nèi)容,這里的有意義指的是人的互動,評論、轉(zhuǎn)發(fā)和分享,并計劃建立嚴肅內(nèi)容的另一個流的做法也是希望“社交的歸社交,媒體的歸媒體”。
事實上,在微信中一直存在這種多流并存,微信的“朋友在看”提供的是社交排序、“精選”則是個性化排序、“訂閱號頁面”是時間流排序、“朋友圈”則是將嚴肅內(nèi)容與社交內(nèi)容區(qū)隔開來。
而在純粹的內(nèi)容平臺中,給“信息流”設(shè)置截斷功能便是一種嘗試的方向。例如Netflix的“信息流”隔斷功能,將影片按照內(nèi)容等要素進行細分,用戶先選擇興趣點再進入“信息流”,用戶既有可能被多元化的內(nèi)容吸引,也不會因無限的信息更新造成信息過載。
一些平臺還選擇了將自動化的信息推薦變?yōu)榘胱詣踊?,為用戶的選擇權(quán)做出讓步。例如通過“查看更多”功能選擇是否繼續(xù)閱讀,通過“不感興趣”標簽主動過濾內(nèi)容,通過用戶對信息的標注對內(nèi)容進行評級或屏蔽。
然而也有聲音認為人的篩選機制并不如算法穩(wěn)妥高效,同時給予用戶太多的主動性丟掉了推薦流的本質(zhì)與初衷。因此如何更好地平衡算法與用戶參與度中尋找平衡仍是未來需要探究的方向。
在關(guān)于對個性化信息流的批判上,有許多聲音往往導(dǎo)向于平臺利益與用戶體驗并不能共生。但反觀個性化信息流過去十年在產(chǎn)品界走向巔峰又跌落神壇的路徑,恰恰說明從長期來看用戶體驗與平臺利益實際上是相互依賴的關(guān)系。
對于互聯(lián)網(wǎng)公司來說,找到每一個階段恰當(dāng)?shù)钠胶恻c,便是成功的關(guān)鍵。
— END —
作者:湯甜、王健飛,公眾號:騰訊研究院(ID:cyberlawrc)
來源:https://mp.weixin.qq.com/s/nMZzLkEe7Cfk6Wu5560m9w
題圖來自Unsplash,基于CC0協(xié)議
千人千面該進入下一階段了~
千人千面只是解決了用戶細分的問題,但是沒解決用戶自我更新的問題。
請教下自我更新是指?