內容分發三分天下?編輯、算法與社交

4 評論 23652 瀏覽 116 收藏 14 分鐘

文章探討了編輯、算法與社交三種分發方式適應的場景以及它們在內容分發系統里的應用。

先拋出個人的結論:編輯(中心人工主導)分發、算法(機器主導)分發、社交(離散人工主導)分發各有千秋。內容分發服務追求的是分發所能觸及的遠景,為了達成遠景,就需要探尋每一種分發更合適的應用場景,而不是要在“劍宗”和“氣宗”里爭個高下。

本節試圖探討的,就是每種分發方式適應的場景和它們在內容分發系統里的應用。

編輯分發 vs 算法分發

從紙質報紙雜志到廣播電視,再到門戶網站,盡管信息傳播的載體發生了變化,但是內容傳播始終保持著中心化分發,展示位有限、千人一面的狀態,信息傳播的決策權始終握在編輯手中。

編輯分發的優勢在于,借由專業背景知識完成了從海量內容到有限展示位置的過濾和篩選,經過篩選的內容,其平均質量是相對較高的。然而,基于專家的判斷難免會出現偏差,為了降低“叫好不叫座”或單個編輯偏差的情況,內容分發方也上線了相應的策略。比如傳統紙媒會有編委會投票機制,通過多人判斷選題,又如門戶網站分時段上首頁,點擊率一定時間不達標自動下架等措施。

引入了機器推薦算法的分發系統,由于達到了千人千面的效果,展示位數量得到了大量的擴展。在篩選人力不足以匹配展示位數量的情況下,編輯又起到怎樣的作用呢?

首先,人工同機器一定不是對立的,不然,今日頭條也不會吸引到如此多資深的傳媒背景從業者。 我和組內的同事不止一次的真心贊美吳達(時任頭條號運營總監):“我們的運營團隊都是豪華高配的文化人。我跟吳達老師聊天,是要帶字典的orz”。

編輯能夠幫助推薦系統更好的理解內容,也能幫助我們更好的理解站在內容背后的創作者群體。

在內容層面,編輯和審核團隊是能夠決定什么樣的內容是低質的,不應被系統收錄和推薦的。編輯和審核評估團隊就像是內容推薦系統的門神一樣,對于不OK的內容Say NO,對于低質背后的做號者Say NO。

作為最大的信息和社交分發平臺,Facebook也在事實甄別和低質內容管理上強依賴編輯和審核的人工工作。

2016年12月16日,Facebook上線了Fact-Checking(事實審核)機制,將用戶舉報過多的信息交付機構記者來判斷。如果記者判斷這則內容是假新聞,就會將內容標記為存在爭議,一方面會在前端頁面提示給用戶此內容可能失實,另一方面會從分發量的角度進行控制。

2017年5月,扎克伯格發帖稱Facebook會再招聘3000名內容審查員,在此次招聘后將會達到7500人。審查員會過濾社交媒體上的不適當內容,如戀童癖、身體暴露、種族仇恨等內容。

除了Say NO之外,編輯同樣會對什么樣的內容特別值得推薦Say Yes。

以推送場景為例,作為強打斷的場景,被推送的內容需要被審慎的篩選出來,以保證打斷用戶是值得的。在新聞客戶端上,一貫強調篩選出“Breaking News”,當重點新聞發生時,編輯一定是24小時值守的,驗證真實性、確定推送范圍和推送級別,只為了不錯過每一條值得用戶關注的內容,讓用戶能夠更準確快速的獲得最新的消息。在這一過程中,技術能夠輔助更快速的構建新聞候選集,比如追蹤社交媒體、追蹤重點網站的發布情況(如氣象局、交通局)等,但人工才是做出最終裁決的角色。

當然,為了保證系統的可擴展性和有效性,我們希望在日常推薦中盡量避免人工的直接干預,如對內容進行調權、對展示量進行干預等等。但是,不直接干預并不代表缺位,編輯始終在扮演一個“糾偏”的角色,當發現主觀覺得好的內容沒有得到應有推薦量的時候,當發現主觀覺得差的內容得到過高推薦量的時候,都會給產品和技術做出反饋。在這種情況下,產品、技術、編輯(內容運營)會坐下來探討:其一,這是不是一個問題,如果是問題的話,是不是一個頻發的問題,以此來確定解決與否和優先級;其二,探討更系統性的解決方案,讓這一類而不是這一個問題得到更系統性的解決。

在創作者體系層面。我們常說,做產品要有用戶視角。作為平臺方,你在面對了億萬用戶的同時,也在面對萬量級的作者。作者同樣是內容分發系統的用戶。編輯會更理解創作者的語境,成為創作者和作品的代言人,來影響系統的迭代。與此同時,他們也能夠以創作者更可理解的方式去傳遞平臺的規則,幫助不同階段的創作者在平臺更好的成長。

題外話,我發現吳達老師的案頭擺了本《python數據分析》了:文化人懂技術,誰都擋不住,笑。

社交分發 vs 算法分發

在Facebook、微博、微信覆蓋了越來越多的用戶之后,內容的分發逐步去中心化:每個人都可以創作內容從而成長為自媒體,每個人都可以借由社交關系評論、轉發從而完成傳播。信息的傳播權從傳統的精英編輯讓渡到每個普通人受眾,相當于每個人都成為了編輯,成為了內容分發的中心。

社交分發首次讓信息的傳播變成了“千人千面”。每個用戶都有了個性化的內容消。2010年,Facebook主頁訪問量超過Google訪問量,意味著“社交分發”已經成為了主流的分發方式。援引皮尤研究中心此前的調查,美國成年人中有62%通過社交媒體獲取新聞,18%高度依賴該平臺,通過Facebook閱讀新聞的人數占比高達44%。

當然,社交分發也帶來了新的問題:

一方面,進入穩定期后,流量出現了新的壟斷:一些大V由于擁有海量的粉絲、保持了高頻的發布量,事實上掌握了平臺的流量分配權。比如,微博上大部分流量被營銷號和大V所占據,新的內容生產者獲取流量的成本劇增。

另一方面,隨著社交關系的不斷擴張,微博微信已經成為了線上名片,用戶關注了越來越多的來源,基于社交分發的內容質量也逐步下跌。朋友圈中盛行的養生文、微商、曬娃等等就是最好的例證。

社交分發讓人們免于信息匱乏,卻同樣帶了信息過載的問題。為了優化用戶的信息消費體驗,Facebook率先在自己的News Feed中應用算法進行排序。

Facebook最初的排序方式,稱之為邊際排名算法(Edge Rank Algorithm)。

算法的核心計算公式為:E = uwd:

  • u:用戶與內容發布者之間的親密度分數,互動越高的關系分數越高
  • w:不同反饋動作具有不同的權重,如展示、評論、點贊等。比如評論動作的權重就會顯著高于點贊。
  • d:基于時間的衰減,越新的內容權重越高

借由上面的公式不難看出,親密度和動作的引入,極大的抑制了大V和營銷號刷屏的情況。此前,企業賬號一旦獲得了粉絲就相當于獲得了穩定的廣告位,所有新廣告以幾乎0成本的形式展現在這些粉絲的信息流中。但此后,沒有互動的粉絲就只是停留在頁面上的一個數字而已,企業賬號必須同時下力氣來維護自己的粉絲群體。

在隨后的日子里,Facebook致力于借由機器學習方式改進排序算法,除了最初的3個EdgeRank因素之外,不斷追加新的特征和排序方式,如Story Bumping(系統對用戶錯過的信息中進行二次判斷,如果判斷為重要,則會跳過時間序進行置頂展示),Last Actor(系統根據用戶最近頻繁互動的50人,進行信息排序的調權,放大短期興趣的影響)等等。

無獨有偶,在國內,微博也逐步意識到自己的流量被大V和營銷號所挾持的問題,開始越來越多在信息流之上應用推薦算法,將原有的時間排序調整為智能排序,以控制刷屏、廣告泛濫等問題,優化用戶的使用體驗。如果你有關注過微信朋友圈的分發,就會注意到,某些被疑似過度傳播的內容(微商廣告、轉發集贊)是被微信降頻過濾的。

微博、Facebook將關注關系作為篩選因素,將用戶的點擊、評論行為作為調權因素,是在“關注關系產出內容”的候選集上進行算法排序。相較起來,頭條將關注關系也弱化為調權因素,從而獲得了一個更廣泛的候選集范圍(用戶相當于在頭條上關注了所有的頭條號),在此之上進行的排序能夠有更高的效率匹配性和更好的可擴展性。

算法分發 分發的終局?

某種角度來看,算法分發或許可以被稱之為終極解決方案。

為什么這么說呢?因為推薦算法是個筐,什么都能往里裝。它是基于我們對現實世界理解進行的抽象和建模,所有我們關心的因素(編輯分發、社交分發)都可以轉化為算法推薦的參考因素。

如果我們化簡這個問題,將推薦的因素收斂到編輯因素、社交因素、模型因素三個部分,那么,一個內容在系統中的得分可以表示為下列公式:

內容得分= a編輯因素 + b社交因素 + c*模型因素

a,b,c分別為三個因素的權重。如果我們把某個因素的權重置為1,其他因素的權重置為0,那么算法分發就能夠等同于編輯分發或社交分發。

各種權重的調節,則完全是以平臺的價值感導向所決定的。以FaceBook為例,其認為來自真實好友關系的生活記錄內容更重要,在分發過程中就會加強真實好友生活記錄內容的權重,而弱化他們轉發內容的權重,進一步弱化媒體所發布內容的權重等等。

事實上,我們所熟悉的各類內容分發產品,無論起步如何,如今都走上了一條多元素融合的道路上:依賴中心化編輯引導和干預,依賴去中心化用戶生產傳播,應用機器學習提升效率。新版的微博也在關注頻道的旁邊放置了熱門頻道,提供了不依賴于訂閱關系的內容推薦服務,微信都上線了實驗室功能“看一看”。

沉迷氣宗劍宗之爭的看官們,還是散了吧。

 

作者:閆澤華

來源:http://www.jianshu.com/p/af99c4dd08fa

本文由 @閆澤華 授權發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自PEXELS,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 瞎幾把扯

    來自福建 回復
  2. 請問模型因素是指什么呢

    來自湖北 回復
  3. 請問模型因素如何影響內容得分呢?

    回復
  4. 內容得分= a編輯因素 + b社交因素 + c*模型因素,這個吊

    來自廣東 回復