內(nèi)容算法時代,如何引爆用戶流量?
對于算法分發(fā)很多人會有所誤解,這或許源自遠(yuǎn)觀而缺乏了解,才會覺得算法猛如虎。而當(dāng)你走近了算法分發(fā),有了一定的了解之后,可能會有重新的認(rèn)知:算法如虎,細(xì)嗅薔薇。
一、算法分發(fā)知多少?
盡管算法分發(fā)中應(yīng)用了各種高深的算法,但其基礎(chǔ)原理卻是樸素的:更好地了解待推薦的內(nèi)容,更好地了解要推薦給的人,才能更高效的完成內(nèi)容與人之間的對接。
從這個角度來看:斷物識人,是一切推薦行為的起點(diǎn)。
對于斷物識人,我們可以將它理解為打標(biāo)簽的過程。標(biāo)簽是對高維事物的降維理解,抽象出了事物更具有表意性、更為顯著的特點(diǎn)。在不同的業(yè)務(wù)場景下,我們會選擇不同的標(biāo)簽進(jìn)行使用,來對內(nèi)容和用戶進(jìn)行標(biāo)注。
在內(nèi)容畫像層面,以音樂為例,最典型的有兩種標(biāo)簽產(chǎn)出的方式:
- 專家系統(tǒng):潘多拉(Pandora)的音樂基因工程(Music Genome Project)。在這項工程中,歌曲體系被抽離出450個標(biāo)簽,細(xì)化到如主唱性別、電吉他失真程度、背景和聲類型等等。每一首歌曲都會被經(jīng)由工作人員耗時30分鐘左右,有選擇性標(biāo)注一些標(biāo)簽,并以從0到5的分值代表這一標(biāo)簽的表征程度。
- UGC產(chǎn)出:在豆瓣,給音樂打標(biāo)簽的活則從專家產(chǎn)出,轉(zhuǎn)為了普通網(wǎng)友貢獻(xiàn)。群體的力量為豆瓣積累了大量具有語義表意性的標(biāo)簽。當(dāng)然,由于用戶的多樣性和編輯的開放性,用戶標(biāo)簽系統(tǒng)需要經(jīng)過特定的清洗和歸一化才能投入使用。
在用戶畫像層面,可以分為靜態(tài)和動態(tài)兩部分。
用戶畫像中靜態(tài)的部分比較好理解,即你的設(shè)備信息、地理位置、注冊信息等等,這些可以被理解為是業(yè)務(wù)無關(guān)的信息。具體到業(yè)務(wù)場景中,用戶產(chǎn)生了更多的行為,就生成了業(yè)務(wù)相關(guān)的動態(tài)信息,即利用人的各種顯式和隱式行為來對用戶的偏好性進(jìn)行的猜測。
以知乎讀書會為例,你的顯式行為是點(diǎn)擊、收聽、評分、評論等等;隱形行為則是收聽完成度、是否有拖拽快進(jìn)、頁面停留時長等等。
通常,由于顯式行為不夠豐富,我們往往需要使用隱式行為來擴(kuò)充我們對于用戶的理解。完播率、是否快進(jìn)、詳情頁停留時長等指標(biāo),都會被系統(tǒng)統(tǒng)計,用來判斷你是否真的喜歡某個人的講解、喜歡某本書的內(nèi)容。
在內(nèi)容畫像的部分,可以看到一篇文章通過文本分析進(jìn)行了一級和二級分類,并抽取出文章內(nèi)的關(guān)鍵字、實體詞,進(jìn)一步的還會通過聚類的方式,將這篇文章與其相似的內(nèi)容聚成一個簇類。之所以會有聚類,是因為專家系統(tǒng)的分類體系一定是對于變化不敏感的,響應(yīng)不及時的,而聚類能夠挖掘出更多內(nèi)容的隱含信息。
在用戶畫像的部分:
“今日頭條常用的用戶標(biāo)簽包括用戶感興趣的類別和主題、關(guān)鍵詞、來源、基于興趣的用戶聚類、各種垂直興趣特征、以及性別、年齡、地點(diǎn)等信息。性別信息通過用戶第三方社交賬號登錄得到。年齡信息通常由模型預(yù)測,通過機(jī)型、閱讀時間分布等預(yù)估。常駐地點(diǎn)來自用戶授權(quán)訪問位置信息,在位置信息的基礎(chǔ)上通過傳統(tǒng)聚類的方法拿到常駐點(diǎn)。常駐點(diǎn)結(jié)合其他信息,可以推測用戶的工作地點(diǎn)、出差地點(diǎn)、旅游地點(diǎn)。這些用戶標(biāo)簽非常有助于推薦?!?/p>
(摘錄自今日頭條推薦算法原理全文詳解——曹歡歡博士)
內(nèi)容畫像和用戶畫像,是一個相互影響的循環(huán)系統(tǒng)。
內(nèi)容畫像決定人的畫像,自然是最容易理解的。在音樂場景下,你收聽、收藏、評分了很多爵士類的音樂,那么系統(tǒng)就會判定為你是一個喜歡爵士音樂的用戶。在讀書的場景下,你閱讀、收聽了哪些書籍,哪些書籍聽完了、哪些書籍重復(fù)收聽了很多遍,都會影響系統(tǒng)中,你的用戶畫像。
因此,“你的選擇決定你的畫像”可以說絲毫不為過。
而反過來,人的畫像也會影響內(nèi)容的畫像。我們可以看作是基于用戶的行為,對內(nèi)容做出的后驗投票。在一個大體量的視頻上傳體系里,我們基本放棄了依賴人工打標(biāo)簽的方式,而轉(zhuǎn)而利用用戶的播放行為來試圖猜測內(nèi)容屬于哪一類。
一個典型的Case:死神來了??礃?biāo)題的文本信息,最大概率就是一部電影,但事實上觀看這個視頻的大面積是喜歡獵奇類視頻的用戶,深挖內(nèi)容才會知道,這其實是一個車禍視頻集錦。
二、協(xié)同過濾,應(yīng)用群體智慧
如前所述,標(biāo)簽是我們對事物的抽象理解,那有沒有一種方式能夠讓我們放棄標(biāo)簽?zāi)??以人的行為來?biāo)記內(nèi)容,這就是協(xié)同過濾的基礎(chǔ)思想。
舉一個生活中的場景:初次為人父母,“無證上崗”的新手爸媽們內(nèi)心是激動而又惶恐的。打聽,成了他們育兒的重要法寶之一?!澳慵覍殞氂玫氖鞘裁淬逶∫喊?、你們有沒有上什么早教班啊…”親子群中,無時無刻不在發(fā)生這樣的討論,這樣的討論也構(gòu)成大家后續(xù)消費(fèi)決策的主要因素之一。
這種基于人和人之間的相互推薦固然是弱社交關(guān)系分發(fā)的一種形態(tài),但是促成大家有價值信息交換和購買轉(zhuǎn)化的,其實是人和人之間的相似點(diǎn):為人父母、擁有相似的價值觀和消費(fèi)觀。
把用戶的消費(fèi)行為作為特征,以此進(jìn)行用戶相似性或物品相似性的計算,進(jìn)行信息的匹配,這就是協(xié)同過濾(Collaborative Filtering)的基礎(chǔ)思想。
協(xié)同推薦可以分為三個子類:
- 基于物品(Item-based)的協(xié)同
- 基于用戶(User-based )的協(xié)同
- 基于模型(Model-based)的協(xié)同
1.基于用戶的協(xié)同
即切合了上面的例子,其基礎(chǔ)思路分為兩步:找到那些與你在某一方面口味相似的人群(比如你們都是新手爸媽,傾向于同一種教育理念),將這一人群喜歡的新東西推薦給你。
2.基于物品的協(xié)同
其推薦的基礎(chǔ)思路是:先確定你喜歡物品,再找到與之相似的物品推薦給你。只是物品與物品間的相似度不是從內(nèi)容屬性的角度衡量的,而是從用戶反饋的角度來衡量的。使用大規(guī)模人群的喜好進(jìn)行內(nèi)容的推薦,這就是在實際工程環(huán)境里,各家公司應(yīng)用的主流分發(fā)方式。
3.基于模型的協(xié)同
是應(yīng)用用戶的喜好信息來訓(xùn)練算法模型,實時預(yù)測用戶可能的點(diǎn)擊率。比如,在Netflix的系統(tǒng)中就將受限玻爾茲曼機(jī)(Restricted Boltzmann Machines, RBM)神經(jīng)網(wǎng)絡(luò)應(yīng)用于協(xié)同過濾。將深度學(xué)習(xí)應(yīng)用于基于模型的協(xié)同,也成為了業(yè)界廣泛使用的方式。
以協(xié)同的方式,通過用戶行為的聚類發(fā)現(xiàn)許多隱層的連接。
以讀書會的場景為例,我們邀請不同的名家來領(lǐng)讀書籍。從領(lǐng)讀人的角度,更容易直觀的將同一領(lǐng)讀人的作品視作一個聚類,比如馬家輝老師領(lǐng)讀的《對照記》、《老人與?!穬杀緯ㄟ^人工預(yù)判的前置規(guī)則,我們很容易將這兩本領(lǐng)讀書音頻推薦給同一類用戶。
但是,通過協(xié)同的方式,我們會發(fā)現(xiàn)喜歡馬家輝老師領(lǐng)讀作品的用戶,同時也會喜歡楊照老師領(lǐng)讀的《刺殺騎士團(tuán)長》一書。這種聯(lián)系,是很難通過標(biāo)簽信息發(fā)現(xiàn)的,只有通過用戶的行為選擇,才會建立聯(lián)系,提升內(nèi)容和用戶之間連接與匹配的效率。
三、從冷到熱:內(nèi)容和用戶在分發(fā)中的生命周期
作為連接內(nèi)容與人的推薦系統(tǒng),無時無刻不在面對著增量的問題:增量的用戶,增量的內(nèi)容。
新的用戶、新的內(nèi)容對于推薦系統(tǒng)來說都是沒有過往信息量積累的、是陌生的,需要累積一定的曝光量和互動量(閱讀、分享等)來收集基礎(chǔ)數(shù)據(jù)。這個從0到1積累基礎(chǔ)數(shù)據(jù)的過程就是冷啟動,其效果的好壞直接關(guān)系到用戶端、作者端的滿意度和留存率。
如果我們假設(shè)一篇新內(nèi)容要經(jīng)過100次閱讀才能夠得到相對可信的內(nèi)容畫像,新用戶同樣需要完成100次閱讀之后才能夠建立起可用的用戶畫像。那么一個最直觀的問題就是:怎么樣達(dá)成這100次有效的閱讀?這就是冷啟動面臨的問題。下面我們從內(nèi)容和用戶兩個維度來分別論述。
在推薦系統(tǒng)中,通過分析一篇內(nèi)容的標(biāo)題、關(guān)鍵字來確定要向哪個目標(biāo)人群進(jìn)行探索性展示,借由探索性展示完成了從0到1的用戶反饋積累過程。在這個冷啟動過程中,如果沒能得到足夠正面的用戶反饋(點(diǎn)擊行為和閱讀體驗),系統(tǒng)就會認(rèn)為這篇內(nèi)容是不受歡迎的,為了控制負(fù)面影響,就會逐步降低這篇內(nèi)容的推薦量。
反之,如果內(nèi)容在冷啟動過程中順利找到了自己的目標(biāo)人群,收獲了很高的點(diǎn)擊率,就有可能被推薦系統(tǒng)快速放大,具有了成為爆款的可能。因此,冷啟動決定一篇內(nèi)容命運(yùn)的說法,可以說絲毫不為過。
而對于用戶冷啟動,推薦服務(wù)的是一個大目標(biāo):用戶的留存率。
只有保證了用戶留存的前提下,才會考量推薦的興趣探索效果如何,是否在有限的展示里全面探索出了用戶的偏好。對于慢熱型的用戶,我們并不急于獲悉他的方方面面,而是以“留住用戶”作為第一目的。
時下,最火熱的莫過于快手、抖音類的PUGC視頻應(yīng)用了。那么,這些短視頻內(nèi)容的推薦方式是什么樣的呢?
回歸到豐富先驗信息、依賴后驗信息的角度來闡述整個通用的流程。
一個短視頻應(yīng)用里面,大體上會有三類人:半職業(yè)或職業(yè)的生產(chǎn)者、工具的使用者、短視頻的消費(fèi)者。從消費(fèi)性的角度來看,大概率是第一類人生產(chǎn),第三類人消費(fèi)。先驗信息就是盡可能挖掘出第一類人生產(chǎn)內(nèi)容的固有特征,比如作者是誰、配的音樂是什么、是否有參與活動話題等等,對于足夠的頭部生產(chǎn)者還可能會以運(yùn)營介入的方式人工標(biāo)注,去完善先驗信息。
客觀上說,小視頻的先驗信息是遠(yuǎn)小于文本內(nèi)容的。從信息量的角度來看,我們將其類比微博類的短文本內(nèi)容或者全圖片內(nèi)容可能會更合適。先驗信息的缺乏,就會更依賴協(xié)同算法支撐下,用戶參與行為的后驗信息的補(bǔ)充。
將一則小視頻冷啟動推薦給特定類別的用戶來查看,從用戶角度去統(tǒng)計不同特征、不同聚類用戶的有效播放,從而以用戶的行為去刻畫小視頻的特征。
比如,時下很熱的海草舞,不同的生產(chǎn)者都會上傳類似主題的視頻,哪個更好?在業(yè)務(wù)場景里,真正值得依賴的一定是普通用戶觀看行為的投票,才能選擇出更值得擴(kuò)散內(nèi)容,優(yōu)化全局的效率。
四、三分天下?編輯、算法與社交
不夸張的說,算法分發(fā)將是未來信息分發(fā)行業(yè)的標(biāo)準(zhǔn)配置。
為什么這么說?因為算法是個筐,什么都能往里裝。
在內(nèi)容展現(xiàn)和推薦的過程當(dāng)中,可以參考下述公式:
算法分發(fā)權(quán)重=編輯分發(fā)權(quán)重 + 社交分發(fā)權(quán)重 + 各種算法產(chǎn)出權(quán)重
將任意一個權(quán)重設(shè)置為1,其他部分設(shè)置為0,算法分發(fā)系統(tǒng)就會變成一個標(biāo)準(zhǔn)的編輯分發(fā)系統(tǒng)或者是社交分發(fā)系統(tǒng)。也就是說,算法分發(fā)的基線就是編輯分發(fā)或社交分發(fā)。從這個角度來看,只要算法應(yīng)用的不太差,基本上引入算法分發(fā)一定是正向。因為它在有限的貨架里,圍繞用戶展示了無限的貨品。
在業(yè)務(wù)層面,我們通常會復(fù)合型使用三種分發(fā),在不同的環(huán)節(jié)應(yīng)用不同的因素,才達(dá)到最好的效果。
以知乎讀書會為例,我們將其劃分為:內(nèi)容生產(chǎn)、用戶觸達(dá)和反饋改進(jìn)三個部分。
在內(nèi)容生產(chǎn)中,為了保證調(diào)性,一定是需要引入編輯專家去選人、選書的。選擇的書是否有價值,選擇的人是否是行業(yè)專家而非職業(yè)的拆書人,都是體現(xiàn)產(chǎn)品價值觀判斷的事情。
進(jìn)入觸達(dá)環(huán)節(jié),人工干預(yù)的作用就會相對弱化。
舉一個例子:運(yùn)營一定會有今日推薦的需求,推薦給用戶今日讀書會上新了什么大咖領(lǐng)讀的書籍。比如,一本物理學(xué)的書籍,由一位物理學(xué)大咖進(jìn)行解讀。從編輯的角度,領(lǐng)讀人是大咖,書是經(jīng)典,編輯權(quán)重一定非常高。
這聽上去似乎很合理,但當(dāng)你進(jìn)入用戶的場景時,就發(fā)現(xiàn)有點(diǎn)差異:首先,用戶不是每天都來的。如果他一周來一次,在他沒來的這一周內(nèi)同樣有文學(xué)、互聯(lián)網(wǎng)、藝術(shù)等專業(yè)人士的領(lǐng)讀,你該給他的是今日推薦,還是本周推薦呢?進(jìn)一步考慮到用戶偏好問題。你是應(yīng)該把物理學(xué)大咖的內(nèi)容強(qiáng)加給他,還是推薦給他一個朋友們最近都好評的一本領(lǐng)讀書(社交分發(fā)),又或者是他自己已經(jīng)標(biāo)注了“想讀”的一本藝術(shù)類書籍的解讀呢?
當(dāng)我們收集到了足夠多用戶數(shù)據(jù)的時候,又可以反過來影響內(nèi)容的二次迭代,編輯的作用又凸顯了出來,結(jié)合數(shù)據(jù)的反饋來對內(nèi)容進(jìn)行調(diào)整:內(nèi)容的播放完成率為什么低?是稿件問題,還是領(lǐng)讀人語音的問題,是否需要重新錄制等等。
五、算法的價值觀
算法有沒有價值觀呢?算法沒有價值觀,算法背后的人卻是有價值觀的。
因為我們優(yōu)化推薦系統(tǒng),一定會有一個數(shù)值目標(biāo),這個數(shù)值目標(biāo)的合理性決定了整個推薦系統(tǒng)的合理性。
單獨(dú)以點(diǎn)擊為優(yōu)化目標(biāo),一定會導(dǎo)致標(biāo)題黨泛濫;點(diǎn)擊加時長目標(biāo)能夠一定程度抑制標(biāo)題黨的產(chǎn)生,但是也有可能導(dǎo)致用戶多樣性的喪失。在這里舉兩個內(nèi)容消費(fèi)的場景,我們可以通過這兩個場景一窺各個內(nèi)容分發(fā)產(chǎn)品的調(diào)性所在。
1.新用戶冷啟動:
大家可以以新用戶的身份去嘗試各種內(nèi)容消費(fèi)服務(wù)。比較之下,你就知道各家的價值觀怎樣的了。
因為新用戶是通過不同渠道獲取的,你獲取到的是怎樣的用戶,你就會推薦怎樣的內(nèi)容;進(jìn)一步的,基于馬斯洛需求模型,越底層的內(nèi)容越有更廣泛的受眾。這就是為什么很多小視頻應(yīng)用,打開來之后,全都是白衣?;ù箝L腿的原因了,人性爾。
2.推薦多樣性:
多樣性是另一個評估分發(fā)產(chǎn)品調(diào)性好壞的所在。喪失多樣性,深挖用戶的局部興趣點(diǎn),一定是短期收益最大化的。
比如我喜歡看科比,那么你把科比的比賽視頻推給我,可以讓我刷到深夜兩點(diǎn);但是從一個產(chǎn)品的長線來看,我們需要更長久的留住用戶,而不是短期讓用戶沉迷。在短期時長和長期留存中,就依賴于產(chǎn)品設(shè)計者的價值觀判斷了。
六、不同平臺下的自媒體生態(tài)
對于平臺來說,創(chuàng)作者是什么?
如果把平臺比作一個商場的話,不同的平臺會有不同的選擇,最典型的兩種類型莫過于:自營?V.S?第三方運(yùn)營。
一種情況下,整個商場全部是直營的店鋪。在這樣的平臺下,每個貨架都是商場自營,所有的創(chuàng)作者對于商場而言,都只是供貨商。
另一種情況下,商場只提供位置,所有交得起入場費(fèi)的店鋪都可以入駐。在這樣的平臺下,每個貨架都是創(chuàng)作者自己運(yùn)營的。
直營商場的好處當(dāng)然是體驗可控、甚至于能夠在某個特定垂類人群身上做到近乎可量化范圍內(nèi)的極致。由于其收取的是商品流通中的利潤,所以在短期內(nèi)可以攫取巨大的紅利,并用這些利潤去給商場自身打廣告,做新客獲取。
但這樣做的壞處也很顯然:就在于供貨商的角度缺乏靈動性,只作為供貨商的創(chuàng)作者,由于缺乏足夠的利潤激勵,很難生長出全新的品牌。
開放給第三方運(yùn)營的商場,其好處當(dāng)然是供貨商的靈活性和多樣性,商場賺取的是房租而非商品流通過程的利潤。一個常見的問題是:這種完全開放給第三方運(yùn)營的商場是否會用戶體驗崩塌,比如會有各種在商場入口發(fā)小廣告的,以各種圖謀短線的方式來吸收商場的流量。這就是局部失控與全局可控的關(guān)系。
在國內(nèi),全部直營的商場比比皆是;近乎完全開放給第三方運(yùn)營的大商場,則恐怕只有微信了吧。在所有平臺都在告訴你什么是對的時候,只有微信很克制地告訴你什么是錯的。
七、數(shù)據(jù)驅(qū)動自媒體迭代
站在自媒體的角度,又該如何面對平臺?如何應(yīng)用數(shù)據(jù)驅(qū)動的方式,更加目標(biāo)導(dǎo)向的面對不同平臺呢?
首先,自媒體面臨的問題是平臺選擇。
由于不同的平臺有不同的分發(fā)規(guī)模和不同的發(fā)展階段,所以,更應(yīng)該選擇適合自己品牌調(diào)性的平臺,選擇符合自己長線商業(yè)化變現(xiàn)角度的平臺。要區(qū)分清楚,哪些平臺是叫好不叫座、哪些平臺是叫座不叫好。
如果做電商導(dǎo)向的自媒體,那么基本上微博微信是必選項。考慮到目前各個平臺相對封閉,不提倡向微博微信導(dǎo)流,那么其在其他平臺可能更多的在于曝光量和品牌建設(shè)的貢獻(xiàn),而不會對電商的銷售轉(zhuǎn)化有太大的貢獻(xiàn)。
但對于承接品牌廣告的自媒體而言,其利潤更多的和內(nèi)容的傳播量有關(guān),在傳播量導(dǎo)向的角度來看,就應(yīng)該更多的選擇和自己品牌調(diào)性相符的、哪怕是一些垂直類的內(nèi)容分發(fā)網(wǎng)站。通過匯集全網(wǎng)各平臺的流量,來實現(xiàn)自己對廣告主的全網(wǎng)閱讀量(播放量)的承諾。
因為每個平臺的投入都需要牽涉到運(yùn)營人力,所以如果一個平臺的投入產(chǎn)出比不能夠達(dá)到預(yù)期,就應(yīng)該主動止損,避免進(jìn)一步的資源投入。
在自媒體確定了自己選擇的平臺之后,就需要深究不同平臺的分發(fā)特點(diǎn),來進(jìn)行針對性的運(yùn)營從而提升自己在相應(yīng)平臺的曝光量。常見的三種平臺:編輯分發(fā)、訂閱分發(fā)和算法分發(fā)平臺。
1.對于編輯分發(fā)平臺
最快速的方法一定是維系好和平臺的關(guān)系。因為在這樣的平臺上,其推薦位置都是人工分配的,更好的編輯關(guān)系能夠保證自媒體有更好的流量曝光。在編輯分發(fā)的平臺上,時不時的會有相應(yīng)的官方活動、積極地配合官方導(dǎo)向,就能從流量傾斜政策中獲取紅利。
2.對于訂閱分發(fā)平臺
做粉絲,做垂直品類粉絲是不二法門。借由微信,其實大家能夠看到一些常見的誘導(dǎo)分享的手段。由于微信是一個規(guī)定行業(yè)下限,而非設(shè)定上限的開放式環(huán)境,所以在這樣的平臺上進(jìn)行運(yùn)營,首先需要保證自己有足夠高的敏感度,對于一些新的傳播形態(tài)可以及時跟進(jìn),從而最大化的獲取時間差的紅利。
比如,最近的微信小游戲,在前兩周鋪天蓋地的通過微信群分享獲得拉新機(jī)會;而最近幾日,這條通路就完全被官方封禁了。
3.對于算法分發(fā)平臺
盡管平臺關(guān)系維護(hù)和粉絲數(shù)積累都需要,但是最需要投入的還是對于內(nèi)容的包裝。因為你的內(nèi)容不僅僅要抓住人的眼球,同時也要能夠?qū)C(jī)器算法的胃口,通過研究過往一段時間的平臺熱門關(guān)鍵詞,能夠給內(nèi)容的標(biāo)題封面包裝提供一些借鑒。
在我看來,運(yùn)營的非常好的一個自媒體品牌非二更莫屬,細(xì)細(xì)觀察,其在不同的平臺上都有不同的運(yùn)營策略。比如,在頭條上的分發(fā),二更就全面的在使用雙標(biāo)題、雙封面的方式進(jìn)行自己的內(nèi)容包裝。一些視頻內(nèi)容能夠在非常短的時間內(nèi)就獲得了上百萬的曝光量。
不同平臺上的不同運(yùn)營方式,本質(zhì)上還是一個數(shù)據(jù)驅(qū)動,目標(biāo)導(dǎo)向的過程,以下進(jìn)行更細(xì)粒度的拆解。
他山之石可以攻玉,首先和大家介紹的是在國外,將數(shù)據(jù)分析指導(dǎo)內(nèi)容生產(chǎn)做的非常極致的BuzzFeed。
員工總數(shù)逾千人,擁有全球新聞團(tuán)隊、自家視頻制作工作室、尖端數(shù)據(jù)運(yùn)算中心和內(nèi)部創(chuàng)意廣告機(jī)構(gòu),每月全網(wǎng)超過50億次閱讀——這就是BuzzFeed,怎么看都是一個龐大的媒體集團(tuán)。
然而,當(dāng)我們深入了解BuzzFeed的工作流程后就會發(fā)現(xiàn):與其說它是一家媒體公司,不如說它是一家科技公司。
“數(shù)據(jù)驅(qū)動內(nèi)容創(chuàng)作”
這是BuzzFeed給自己貼上的標(biāo)簽。
在這家公司的內(nèi)容創(chuàng)作和分發(fā)過程中,反饋閉環(huán)(Feedback Loop)是出現(xiàn)頻次最高的術(shù)語:通過將市場環(huán)境和讀者反饋數(shù)據(jù)盡可能的量化和結(jié)構(gòu)化,及時反饋給運(yùn)營人員、內(nèi)容編輯,從而構(gòu)成了輔助創(chuàng)作的一個閉環(huán)。
由于很早就樹立了“將內(nèi)容分發(fā)到用戶常駐的平臺,而非吸引用戶到自己的平臺看內(nèi)容”的思路,YouTube、Facebook,Twitter、Vine等一眾平臺都成為了BuzzFeed的戰(zhàn)場。為了更好的理解用戶反饋,BuzzFeed追蹤收集并匯總了各個平臺上的閱讀傳播和互動數(shù)據(jù)。比起閱讀量、分享量這些結(jié)果指標(biāo),其更關(guān)心內(nèi)容分發(fā)和傳播的過程。
以下圖為例:如果只看終態(tài)數(shù)據(jù),那么報表展示給你的無非是一篇內(nèi)容從不同的平臺渠道上獲取了多少流量而已(下圖左)。但是深究下來,這些流量是如何來的呢?是通過Facebook或Twitter上的分享,還是通過郵件的傳播?哪些節(jié)點(diǎn)帶來了更大的輻射量和擴(kuò)散量?只有深入分析傳播路徑,才能給出這個問題的答案(下圖右)。
不止于結(jié)果, BuzzFeed開始探究一篇內(nèi)容的傳播軌跡,他們開了一套名為Pound(Process for Optimizing and Understanding Network Diffusion)的系統(tǒng),通過給同一頁面的不同分享追加不同參數(shù)的方式,來追溯內(nèi)容在網(wǎng)絡(luò)上的傳播過程。
通過這套系統(tǒng),人們意識到:傳播并不是一棵簡單的傳播樹,而是一片密集的傳播森林。
每一次分享都構(gòu)成了一棵新樹,如果一個人的社交好友很多,那么這個節(jié)點(diǎn)的一度關(guān)系觸達(dá)就會很廣;如果內(nèi)容的質(zhì)量一般沒有引發(fā)進(jìn)一步的傳播,那么就會止步為一棵低矮的樹;如果內(nèi)容引發(fā)了大量的傳播,就會變?yōu)橐粋€繁茂的大樹。
由于社交傳播對于內(nèi)容的影響力貢獻(xiàn)巨大, BuzzFeed在衡量內(nèi)容價值時,會更看重社交分享所帶來的閱讀量,并以名為“病毒傳播提升系數(shù)(Viral Lift)”的指標(biāo)來衡量這一過程。
對于粉絲已經(jīng)超過百萬、內(nèi)容閱讀篇篇10W+的自媒體大號來說,這一衡量指標(biāo)的制定不難理解:如果一篇內(nèi)容的閱讀構(gòu)成主要來自于自己的粉絲,那么就意味著粉絲們更有可能是基于慣性打開的,但是由于內(nèi)容并沒有觸及到它們的興奮點(diǎn)、沒能引發(fā)認(rèn)同,從而失去了進(jìn)一步擴(kuò)散傳播的可能,也失去了觸達(dá)更多潛在粉絲的機(jī)會。
對于BuzzFeed而言,在相近的總閱讀量下,一篇“病毒傳播提升系數(shù)”更高的內(nèi)容,因為收獲了更多的社交傳播而變得更有價值。有了技術(shù)追溯的支持,內(nèi)容團(tuán)隊才能夠總結(jié)出不同平臺之上的內(nèi)容偏好和病毒傳播模式。
人們往往會夸大BuzzFeed的內(nèi)容三把斧“清單體、短視頻和小測驗”,卻忽視了在這些內(nèi)容背后更深層次的數(shù)據(jù)支持。
具體到我們?nèi)粘5膬?nèi)容閱讀分析和粉絲分析過程當(dāng)中,有哪些可以供分析注意的數(shù)據(jù)?
對內(nèi)容分析來看,可以分為一次打開和打開后的體驗。
一次打開是指不依賴于社交傳播和搜索傳播所帶來的閱讀量。對于微博微信等粉絲分發(fā)平臺,是指粉絲帶來的閱讀量;對于頭條、快報等推薦分發(fā)平臺,是指經(jīng)由推薦帶來的應(yīng)用內(nèi)閱讀量。
影響內(nèi)容一次打開率最直接的因素有兩個:活躍粉絲量和內(nèi)容包裝。
無論是粉絲分發(fā)平臺還是推薦分發(fā)平臺,活躍粉絲量都會影響內(nèi)容展示的基本盤,只是傳導(dǎo)系數(shù)不太一樣罷了;對于粉絲分發(fā)的平臺,你有多少活躍粉絲就意味著有相應(yīng)比例的基礎(chǔ)展示量;對于非粉絲分發(fā)的平臺,你的活躍粉絲量會被視作你在平臺上的貢獻(xiàn)程度和受眾情況從而影響分發(fā)權(quán)重。同樣的一篇內(nèi)容,10萬活躍粉絲的賬號發(fā)布一定比1萬活躍粉絲的賬號發(fā)布會獲得更大的基礎(chǔ)展示量。
內(nèi)容包裝影響的是從展示量到閱讀量的轉(zhuǎn)化過程,更好的標(biāo)題和封面圖就像是精致的產(chǎn)品包裝一樣,有助于更好的促成轉(zhuǎn)化。比如在頭條號平臺上,就支持了一個非??岬碾p標(biāo)題雙封面功能,能夠給創(chuàng)作者對內(nèi)容不同包裝的機(jī)會。
對于標(biāo)題,我習(xí)慣于引用咪蒙的觀點(diǎn):
“不能在一秒鐘看明白的標(biāo)題,不適合傳播,不是讀者理解不了,而是他只能給咱們一秒鐘?!?/strong>
在咪蒙的工作方式中,她會把當(dāng)天寫好的內(nèi)容發(fā)出來,交于自媒體小組的員工開始取標(biāo)題。15-20分鐘內(nèi),每人至少取5個標(biāo)題。這樣,每一篇內(nèi)容背后,都有近100個標(biāo)題!咪蒙隨后會從中挑出5-6個標(biāo)題,放到3個由用戶顧問群里投票(每個顧問群都有人負(fù)責(zé)統(tǒng)計票數(shù))。 咪蒙會參考最終的投票結(jié)果,決定用哪一個標(biāo)題。這種方式,其實就構(gòu)建了一個最樸素的AB系統(tǒng)來驗證標(biāo)題對于內(nèi)容一次打開率的影響。
為了便于比較,我們通常計算一次打開率而非打開量。
對于粉絲分發(fā)平臺:
一次打開率=閱讀量/粉絲量
對于推薦分發(fā)平臺:
一次打開率=應(yīng)用內(nèi)閱讀量/推薦量
一次打開率對于不同分發(fā)模式的平臺有不同的意義:
- 在粉絲分發(fā)的平臺上,一次打開率能比閱讀量更好地衡量自媒體賬號的價值。為了保證更高的一次打開率,需要更科學(xué)地獲取精準(zhǔn)粉絲、重視粉絲群體的互動維護(hù),使得自身始終能夠保持較高的粉絲觸達(dá)率。
- 對于推薦分發(fā)平臺,一次打開率考量了自媒體對平臺分發(fā)特點(diǎn)的認(rèn)知和對內(nèi)容包裝功力。一次打開率(推薦點(diǎn)擊率)高就意味著具有成為爆款的可能。甚至?xí)斋@比粉絲分發(fā)平臺更大的閱讀量。
八、閱讀體驗
如果說一次打開代表了上門推銷人員成功敲開了用戶的房門,那么閱讀體驗衡量的就是用戶是否會為這次推銷最終選擇買單。
用戶是帶著對作者品牌和對標(biāo)題封面的認(rèn)知預(yù)期打開內(nèi)容的,只有實際消費(fèi)體驗與預(yù)判一致、甚至超出預(yù)判,才算得上是好的閱讀體驗。我們之所以抵觸標(biāo)題黨,并非因為它駭人聽聞,而是因為用戶抱著駭人聽聞的預(yù)期,點(diǎn)擊進(jìn)入詳情頁之后才發(fā)現(xiàn)內(nèi)容平淡無奇。
想要衡量消費(fèi)體驗,內(nèi)容的消費(fèi)比例是一個重要的指標(biāo)。
對于圖文來說這個指標(biāo)是平均閱讀進(jìn)度和閱讀速度;對于視頻來說是播放進(jìn)度和播放時長(因為用戶會有快進(jìn)的行為,所以100%的播放進(jìn)度并不意味著100%的播放時長)。平均消費(fèi)比例越高,代表用戶的認(rèn)可度越高、消費(fèi)體驗越好。
除了內(nèi)容消費(fèi)比例指標(biāo)以外,內(nèi)容是否引發(fā)了讀者互動也是一個常見的考察角度,如評論、點(diǎn)贊、收藏、轉(zhuǎn)發(fā)等,這些指標(biāo)的橫向?qū)Ρ韧ǔS糜诮M織內(nèi)部考核不同編輯的創(chuàng)作能力。
其中,個人建議需要額外關(guān)注的是評論和轉(zhuǎn)發(fā)兩個指標(biāo):
- 評論擴(kuò)展了內(nèi)容的深度,更多的用戶評論給正文提供了不同的視角分析和信息補(bǔ)充,可以有效的引發(fā)圍觀用戶的閱讀興趣,提升用戶在內(nèi)容頁的整體停留時長。促進(jìn)評論的提升算是有一些技巧性的部分:選題有沖突性或者有代入感,在正文中留有懸念,主動引起討論、投票,在評論區(qū)中帶節(jié)奏等等都是行之有效的方式。
- 轉(zhuǎn)發(fā)擴(kuò)展了內(nèi)容的廣度,更多的轉(zhuǎn)發(fā)能夠帶來更多面向潛在受眾的曝光,這一點(diǎn)對于以粉絲分發(fā)為主要模式的系統(tǒng)尤甚。對于轉(zhuǎn)發(fā)指標(biāo),我們可以套用BuzzFeed的病毒傳播系數(shù)的計算方式:Viral Lift = 1 + 傳播閱讀量 / 一次閱讀量。
九、粉絲增長分析
對于自媒體而言,虛高的粉絲數(shù)除了忽悠投資人和廣告主以外,對自身成長是毫無意義的。想要可持續(xù)發(fā)展,只有精準(zhǔn)的粉絲才有價值。那什么是精準(zhǔn)的粉絲?我想,應(yīng)該是指能夠給自媒體帶來變現(xiàn)價值的粉絲。
粉絲增長分析,就是圍繞有變現(xiàn)價值粉絲算的一筆賬:如果一個粉絲能給自媒體帶來5塊的凈利潤,那么花低于5元的成本來購買這個粉絲就是劃算的。
首先,引入三個概念——LTV、CAC和ROI
- LTV(Life Time Value):生命周期總價值。一個粉絲從關(guān)注你的那一天開始到取關(guān)或者脫離平臺為止,能夠帶來的收益。通常按渠道來計算,如果某個渠道或某個平臺的用戶不精準(zhǔn)、付費(fèi)意愿差,那么這個渠道的用戶LTV就相對較低。
- CAC(Customer Acquisition Cost):用戶獲取成本。同樣跟渠道有關(guān),自媒體需要持續(xù)的發(fā)現(xiàn)低價、優(yōu)質(zhì)的渠道,搶占紅利期。比如2015年初,微信廣點(diǎn)通渠道的公眾號漲粉,單個用戶獲取成本只有1-2塊錢。
- ROI(Return On Investment):投資回報率。計算公式為(收入-成本)/成本。應(yīng)用于粉絲增長場景就是(LTV-CAC)/CAC,衡量的是:你從一個粉絲身上掙到的錢,是否能夠覆蓋獲取這個粉絲的成本。
通常應(yīng)該做ROI>1的事情,這樣才能夠保證業(yè)務(wù)的可持續(xù)發(fā)展。后續(xù)也都圍繞這個角度展開。
首先,現(xiàn)身說法,舉一個親身犯下的“人傻錢多”的蠢事:
15年初,微信朋友圈集贊的路數(shù)還很火熱,我們也不能免俗,搞了三場集贊有禮的活動。三場集贊有禮的活動,表面上看起來一面光鮮,各種指標(biāo)在活動日都有顯著的提升。但是興奮過去之后的分析,卻讓人笑不出來了。三次活動中,發(fā)起活動的老用戶重疊度越來越高,帶來的新用戶越來越少,同時,新用戶的次日留存情況也越來越差。
于是,我們開始反思用戶為什么要參加集贊有禮的互動?唯利爾。
老用戶發(fā)起活動,他所帶來的新用戶無非是看一眼品牌廣告,幫朋友支持一下。如果實物獎品價值還不錯,那么這個新用戶也會發(fā)起,但目的在于獎品而非公眾號。此外,設(shè)計過高的門檻使得有的用戶不樂意參與,有的用戶則自建了群開始互相點(diǎn)贊,達(dá)不到拉新的作用。
想要提升用戶增長的ROI,就必須降低新用戶中非精準(zhǔn)用戶的比例,從而拉升渠道用戶的LTV,降低用戶獲取成本CAC。
由此入手,我們優(yōu)化了轉(zhuǎn)發(fā)集贊拉新的方式:
新一期集贊活動的禮品是凱叔西游記第二部的部分章節(jié)收聽權(quán),每個用戶只需要拉5個用戶就能獲得。因為是虛擬產(chǎn)品,CAC得到了顯著降低。而兒童故事音頻跟微信賬號捆綁只能自用,用戶如果不是真有需求就絕不會參與活動,從而提升了新增用戶的精準(zhǔn)程度。在后續(xù)的此類活動中,我們都有意識的對禮品的形態(tài)進(jìn)行了控制:實物禮品用于鼓勵已有的活躍老粉絲,虛擬禮品用于激活和拉新。
運(yùn)營微博、微信這樣的平臺,我們很容易沉迷于追求短期粉絲數(shù)字的飆漲而舉辦各種活動。某些活動拉新從CAC的角度看或許是劃算的,但深究其所帶來的真實活躍粉絲,就往往會發(fā)現(xiàn)ROI遠(yuǎn)遠(yuǎn)小于1,充其量只能算是一次展示廣告曝光,做了一筆又一筆的蝕本生意。
想要算清楚用戶的ROI,有賴于用戶身份的識別和渠道的追溯。在這一點(diǎn)上,微博和微信的基礎(chǔ)建設(shè)比較完善。
以微信為例,基于平臺提供的二維碼,我們可以追溯不同用戶的來源并標(biāo)識,就像是安卓應(yīng)用下載對于不同的應(yīng)用市場打不同的渠道包一樣。進(jìn)而,通過平臺提供的外鏈功能、私信功能,來識別用戶的活躍情況。
對于付費(fèi)增粉渠道,每隔一段時間暫停一些,比較渠道暫停前后自己粉絲量的增長情況和粉絲閱讀占比、線上活動粉絲參與量情況,建立起對付費(fèi)渠道更清醒的了解。
通過數(shù)據(jù)分析的方式,能夠讓我們更加清醒的審視內(nèi)容創(chuàng)作的消費(fèi)性好壞,粉絲積累的性價比高低,從而以更經(jīng)濟(jì)的方式提升自己的增長速度。
作者:數(shù)據(jù)俠,閆澤華。微信公眾號:DT數(shù)據(jù)俠(ID:DTdatahero),第一財經(jīng)旗下數(shù)據(jù)社群,集數(shù)據(jù)俠專欄、數(shù)據(jù)俠實驗室活動和數(shù)據(jù)俠聯(lián)盟于一體,旨在聚集大數(shù)據(jù)領(lǐng)域精英,共同挖掘數(shù)據(jù)價值。
本文由 @DT數(shù)據(jù)俠 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自 pexels,基于 CC0 協(xié)議
- 目前還沒評論,等你發(fā)揮!