如何設計數據干預策略?
編輯導語:數據干預策略雖然被廣泛使用,但不少朋友可能不清楚這其中的原理,數據干預是怎樣對運營起作用的?怎樣才能做到高質量引流?本文全方位透徹地為你分析了數據干預策略的設計理念,一起來學習一下吧~
8月27日,國家網信辦就《互聯網信息服務算法推薦管理規定(征求意見稿)》公開征求意見。在此背景下,數據干預行為即將由以前的灰色地帶轉為違法行為。
在法律條文正式落地以前,本文將基于筆者的個人經驗分享“數據干預”這一大部分人“聽過、沒見過”的設計要點。
一、數據干預的價值
1. 什么是數據干預
這里所講的“數據干預”指的是平臺方主動發起的、對平臺上的內容(視頻、課程、文章……)的外顯互動數據(點贊、收藏、分享、投幣、播放、打賞、贊賞、關注、訂閱……)進行修改(通常是注水)的行為,在閱讀本文時需要與 用戶側發起的黑產刷數據行為進行區分,也不涉及金融領域的業績造假。
2. 為什么要做數據干預
數據干預是純粹的運營導向行為,其價值邏輯主要體現在:
通過為內容資源的互動數據注水(脫水),提高(降低)目標內容在資源紛發中的推薦權重,使得該內容對象有更高/低幾率出現在首頁、推薦頁等用戶側頁面。更高/低的曝光率又能帶來更高/低的真實用戶參與互動。
換言之,運營可通過干預外顯互動數據,為目標內容導流。
舉例來說:
運營發現視頻A質量優秀,但是因為各種原因,視頻播放量太低;播放量起不來的話極易被系統識別為低質視頻,降低推薦權重;推薦權重降低后,視頻A曝光率降低,普通用戶難以觸達;普通用戶難以觸達,挖掘不了該“寶藏視頻”,又會進一步導致視頻的播放量起不來。如此形成了一個負向閉環。
此時,運營可利用“互動數據干預策略”,為該視頻投放1萬個虛假播放量、5000個虛假點贊量,投放時間為1天。投放生效后,分發系統識別到該視頻最近24H內互動數據快速增長,有爆火潛力,就會將視頻推薦到視頻首頁、今日top排行榜。
普通用戶在首頁、排行榜看到該視頻,就會嘗試觀看,發現質量很高,慷慨打賞;視頻的真實互動數據因此快速、持續獲得增長,最終該優質視頻的真實互動數據與其質量匹配,跨過了“寶藏無人識”的尷尬局面。
觀眾獲得了優質的觀看體驗,up主獲得收益,平臺獲得用戶數據增長,三贏局面。
除此之外,“小閑”型用戶在消費內容前,會觀察所選內容的各項外顯數據量。運營通過干預策略,使得外顯的互動數據量顯得不那么寒酸,從用戶心理上引導用戶繼續消費路徑。
舉例來說:視頻的播放量、點贊量是0時,對于普通用戶的吸引力極低,即使分發系統已將視頻曝光至用戶側,用戶仍然不會進行最終消費;如果外顯播放量是1000,那么普通用戶會自然地點開播放按鈕,真正地消費內容,
如果平臺運營提出此能力需求,一般基于以下業務目的考慮:
產品冷啟動:產品冷啟動階段,平臺內所有的內容資源的曝光率不足,用戶真實互動數據全部為0或極低,推薦系統難以有效執行. 此時做數據干預對于紛發的影響效果立竿見影。冷冷清清的氛圍也難以吸引首批用戶,通過數據干預營造“虛假繁榮”對于小閑用戶留存非常重要。
流量扶持:“流量扶持”是一種經常被用到的運營策略,數據干預策略是流量扶持的一種主要實現形式。當平臺大戰、互挖創作者時,運營可將“流量扶持”作為簽約條件吸引優質創作者入駐;平時亦可將“流量扶持”作為平臺活動獎勵。
降低長尾創作者流失率:對于廣大長尾創作者來說,很難通過創作盈利以解決吃飯問題,因此大部分創作動機來源于熱愛、嘗試心理。
矛盾的是,因為發布內容頻率低、賬號沉淀的粉絲少、平臺未簽約導致運營扶持政策少等綜合因素導致這些小創作者“為愛發電”創作的內容很難得到足夠曝光,更難得到觀眾互動回應。
“辛辛苦苦忙碌一周,發布后觀看、點贊的觀眾不足10個”,這種努力過后得不到回應的感覺對于這些憑熱情創作的創作者無異于當頭澆了一盆冷水,極大摧毀創作積極性。
通過為長尾創作者執行普遍化地數據干預策略,使得他們的創作內容普遍能收獲幾十個點贊量,從而鼓勵他們堅持創作,不至于從平臺流失。
3. 什么是“好”的數據干預策略?
數據干預行為本身是數據造假行為,“造假”的最高標準自然是無限接近真實,用戶(內容創作者、內容消費者)對干預行為毫無察覺。
要想達到這個標準不是件容易的事,競爭對手、黑粉、忠實用戶很容易通過關聯的蛛絲馬跡發現端倪。建議產品經理在做設計時、運營在進行策略配置時,重點注意以下方面的控制:
(1)關注互動數據項之間的整體均衡
當內容有多個互動指標時,經過干預后的外顯數據整體看起來必須足夠均衡、合理。若某篇文章的閱讀量小于點贊量,那么這就是腦溢血型數據干預;若某個英語學習視頻的分享量大于點贊量,那么看起來會“一眼假”,用戶會明顯察覺不合理。
某視頻平臺,單個視頻的互動量比例不自然
(2)關注互動數據項與內容質量的匹配度
一般來說,運營做數據干預的原始初衷是幫助優質內容增加曝光量,那么質量低劣的內容資源就不應該享受太高的數據注水,否則一方面會擠占真正優秀視頻的紛發空間,造成劣幣驅逐良幣、平臺創作環境惡化,另一方面大量“小閑”用戶通過“爆火”標簽查看視頻時,卻發現“名不副實”“受到了欺騙”,自然產生對平臺的惡感,產生用戶流失。
(3)關注互動數據項與創作者收益的平衡
內容創作平臺為了進行創作者激勵,通常會將內容的互動數據表現作為創作者收入的影響因子。
具備數據干預能力后,創作者收益計算時,必然使用的是真實互動數據。然而由于信息壁壘,創作者不知道自己的外顯數據為灌水后的數據,會自然地使用外顯數據計算收益預期。
當最終收益下發時,創作者發現收益與預期不符,會產生強烈的被騙感,與平臺的關系自然跌入冰點。解決該矛盾的通用做法是:
- 收益計算公式對創作者不透明(即不會明確告知各項互動數據指標在收益計算中的比重)
- 提供多種收益渠道(創作激勵、廣告分成、直接打賞、活動獎勵等),降低互動數據對收益的影響比重
- 引入中間指標如“熱度”“喜愛度”等,教育創作者“最終收益與中間指標直接關聯,中間指標不僅受互動數據量影響,也會被互動數據比、up主活躍度、產出頻率、原創類型、創作者類型等等因素影響”。
因此,當創作者的外顯互動數據量因運營干預有了較大增長,收益卻未獲明顯上漲時,平臺方可拿其他因素進行解釋。只要數據造假不至于太離譜,創作者也能接受收益與預期不符的事實。當然,總體設計上仍需要保證“互動數據表現越好,收益越高”的基本原則。
某站的收益類型多,并且不會明確告知互動數據影響收益的計算公式
(4)關注互動數據項與其他關聯數據項的匹配度
互動數據通常在內容消費路徑中展示,用戶直接觸達,因此做好上述3點平衡后,一般用戶不會對干預行為有察覺。但是,有心人可以通過其他關聯數據間接推測出數據干預行為的存在。
例如:若某個創作者內容平均瀏覽量為10萬,但是該創作者的關注粉絲數只有10個,那就出現“一眼假”;若某個主播專欄作者每篇文章在平臺內的閱讀量平均10萬+,但是平臺的對外財報顯示月活躍用戶一共10萬+,那么競爭對手就可以揣測出該專欄作者的數據有水分。
某博主,粉絲數1億,單條內容評論量只有600
互動數據與其他關聯數據的匹配極易成為大坑,主要是因為:
“其他關聯數據”的計算、產出、發布、展示通常不受互動產品經理和策略運營控制、負責。例如上述舉例中,“關注”功能歸屬于用戶體系設計范疇,“對外財報”更是財務、數據等多部門配合的結果。若需進行協調,往往涉及跨部門的合作,非??简灝a品經理和策略運營的個人能力。
“其他關聯數據”的類型不可控。在做產品設計和具體的干預策略設計時,產品和運營可能已經對潛在的其他關聯數據類型做了摸排,確保所有的相關數據看起來協調、自然。
但是隨著時間的推移,其他業務線新增的功能體系可能會導致新的關聯數據類型產生,又由于數據干預的敏感性、保密性很高,關聯業務負責人不掌握具體干預信息,導致新的數據類型在設計、產出、發布時沒有兼顧數據干預系統的存在,最終使得互動數據與其他關聯數據不匹配。
二、實戰復盤
1. 數據干預的支撐系統——Bot假賬號系統
最廣為人知的Bot假賬號是微博的僵尸粉、直播平臺的機器人觀眾。這類系統在數據干預體系中扮演基礎設施的作用——被干預的虛假數據由這些賬號來模擬真實用戶路徑從數據層進行承載。
舉例來說:運營配置干預策略,為某篇文章注入100個虛假收藏量。系統即向Bot賬號系統中提取100個賬號,將這篇文章收藏至自己的收藏夾。后續若有第三方讀者可以在假帳號的收藏夾內找到該文章。文章創作者也會收到文章被用戶ABC收藏的消息推送。
Bot假帳號系統能極大提高數據干預的真實性,既可以通過體驗層模擬真實用戶行為,“騙”過內容創作者、內容消費者,又能夠在數據層面瞞過第三方數據爬取、統計機構的數據過濾系統。
那么,Bot假賬號系統的搭建設計有哪些注意要點呢?
1)重視通用性
Bot假帳號系統之所以被定義為“基礎設施”,原因在于:
- 其服務的業務方向多樣。最常見的如互動數據干預系統、用戶體系干預系統。
- 單個業務方向,具體的數據指標多樣。例如互動數據干預系統內包含點贊、收藏、分享,每一個指標的實現都有其獨特性。
因此Bot假賬號系統在初始搭建時應以組件思維進行規劃,以適應后續可能接入的多業務類型。
2)重視賬號調取的效率
- 能配合干預業務需求進行及時、高并發、大數據量的賬號調取、模擬
- 能避免同一賬號對同一內容目標的反復調取。在互動數據干預業務里,同一個賬號對同一目標的反復互動經常意味著“互動取消”,例如點贊/取消點贊。
3)重視假賬號的真實性維護
不論假賬號來源于平臺內的流失用戶,還是系統自行創建,都需有維護機制,確保這些賬號足夠真實。一個真實性過關的賬號需滿足:
- 符合普通人認知的基本要素。例如完整的頭像、不至于不知所云的用戶名、參差的等級、勛章、VIP頭銜等。
- 正常的對外消費歷史記錄。假設1個bot賬號的等級為滿級,其對外原創內容為0,則很容易被用戶識別為假帳號。設計者可以從2方面來入手:一方面通過優化賬號調用能力,確保每次調用時,優先選取未有消費歷史的賬號,為其創造消費歷史;另一方面,設計賬號歷史對外隱藏功能,第三方用戶無法查看目標賬號的歷史消費記錄。
那么,如果平臺內未有Bot賬號系統能力,是否就不能進行數據干預設計呢?并不是。
Bot假賬號系統是進行數據干預的充分非必要條件。
特別是對于互動數據干預而言,若內容平臺內被干預的互動數據項本身不存在“對外信息公開”機制,那么在進行數據干預時可以不利用假賬號進行承載,僅進行簡單的數值增減。
舉例來說:若內容平臺內,普通用戶無法查看其他用戶的收藏夾內容,創作者側也沒有內容被收藏的消息推送、清單統計,那么進行收藏量干預時,完全可以直接在目標內容上進行數值變更。
2. 數據干預策略設計
數據干預系統的核心是策略系統,即 運營如何依據業務特征設立干預目標。
基于筆者自己的經驗,干預策略的設計根據不同的維度有以下類型:
(1)根據策略的生效范圍,可分為單目標干預、范圍干預
- 單目標干預:本策略的生效范圍僅限于特定的某個內容對象,例如某篇文章、某個視頻、某個帖子
- 范圍干預:本策略的生效范圍為某個創作者、某個品類、某個標簽、某個白名單下的所有內容對象
(2)根據策略的生效方式,可分為 自動水下策略、半自動策略、人工水上策略
- 自動水下策略:系統寫死干預規則,程序自動生效,無需運營介入。
- 半自動策略:運營需維護策略模板池,若需對某個內容生效,只需從池中撈出對應模板關聯至目標內容,程序即會依據模板規則對目標內容進行數據干預。
- 人工水上策略:每次設定干預任務時,需重新配置干預規則。
(3)據策略的規則類型
可分為:數值投放策略、增長倍率策略、內容投放策略
- 數值投放策略:設定目標增長值和生效時間段,程序在時間段內均勻進行投放。例如:運營希望在24H內為視頻A投放24萬個點贊。那么程序每1H會為該視頻投放1萬個虛假點贊量。
- 增長倍率策略:系統僅會在真實用戶互動數據產生時進行假數據投放,其計算規則為“擴大真實互動數據的倍率”。例如:當有1個真實用戶進行轉發時,外顯轉發量直接+10,其中9個為假轉發量。
- 內容投放策略:批量為目標對象投放互動內容值。當互動數據項為非數值項時,僅能采用該策略,典型的如視頻彈幕量、評論量。
產品經理可依據業務特點,將上述不同類型的干預類型進行混合應用,從而得出不同的干預策略設計。
3. 數據干預策略生效規則
數據干預系統的難點在于策略生效規則,即程序如何進行虛假數據投放。
策略設計時需考慮的實現難點:
第一,虛假數據投放時,需兼顧不同數據項的整體平衡。
以視頻互動數據干預為例,進行數據投放時,必須保證:
- 播放量在所有時間點必須永遠大于點贊量、投幣量、分享量、收藏量
- 播放量、點贊量、投幣量、分享量、收藏量之間的比率需與視頻內容、平臺特性相符。典型的一般視頻的點贊量都大于收藏量,但軟色情擦邊球的舞蹈類視頻往往收藏量大于點贊量
第二,多種干預策略對同一個目標生效時,需考慮如何避免某個數據項因策略并發導致總和異常的情況。
以某視頻為例,若有5個干預策略同時對該視頻生效,那么存在一定可能性,在某個特殊時間點,由于收藏量的投放速率更高,導致5個策略疊加的總收藏量大于疊加的點贊量。此時若有用戶觀察到該現象,即會察覺到數據異常。
第三,進行數據投放時,需符合平臺內用戶活躍時間段規律。
舉例來說,一般用戶在傍晚時段活躍程度高于凌晨0-8點,周五-周日活躍程度高于周一-周四。那么干預策略生效時,必須遵循高峰時段產生的虛擬量多、低活躍時段時產生的虛擬量少的規律。
第四,依據程序計算的應投虛假量為固定值,實際生效時應有一定浮動值。
否則,程序每次產生的虛擬量完全相同,極易引起察覺。
第五,在進行增長倍率策略生效時,需考慮到同一個干預對象的互動率隨著投稿時間延續呈現先增長后降低的規律,隨著播放量的增長也呈現一定的波動規律。因此干預策略生效時,也需遵循此規律。
第六,在進行干預策略設計時,產品經理需明確告知研發團隊,“策略何時生效,每一次策略生效時應當產生多少虛假數量”,而不是“某段時間后,應該達到多少總虛假數量”。
因為前者是增量描述,更符合開發思維,能夠幫助開發聯系到如何實現;后者是存量描述,只是設定具體的目標,沒有規定程序到底該怎么實現。舉例來說,如果告訴開發“總投放目標量為1萬,投放時間1天”,那么有可能他會實現成“前23H投放值為0,最后1H投放值為1萬”。
第七,需妥善處理干預策略與風控系統的關系。對于內容平臺來說,為了防止用戶側黑產數據,往往會有完善的風控系統對用戶側互動行為進行識別過濾。
那么,在進行干預策略生效時,既需要保證系統側投放的虛擬數據可以繞過風控系統的即時攔截,又能在后續風控系統對真實用戶數據進行回刷時,對該真實用戶數據帶來的虛假數據進行聯動回刷。
那么以上這些難點,有沒有什么系統的解決方法呢?有的。囿于工作保密性要求,本文不會對具體如何做進行描述,僅列出思考方向:
- 引入時間因素
- 圍繞錨數據項,各數據項聯動干預
- 向運營講數值,向開發講概率
- 任務流水&投放流水掛鉤
4.干預數據的應用和人工回調
為了服務于后續數據統計分析業務,在進行干預策略設計時,需注意向開發傳遞以下信息:
- 當多干預策略同時對同一個目標生效時,最終外顯數據如何展示
- 當多干預策略同時對同一個目標生效時,需分別記錄每個策略產生的流水明細、統計值,方便下游業務依據需求自行取值做統計分析
由于:
- 程序存在不可靠情況(多計算/少計算/多生效/少生效)
- 運營配置失誤情況
當數據干預系統內存在多干預策略時,可能存在被干預對象的各互動數據項最終顯示異常的風險。此時需要有對應的處理機制:
- 運營可直接刪除/下架/隱藏干預對象,此為最簡單的處理方式
- 設計看板系統,運營側可據此查詢目標對象的異常數據來源于何種干預策略,快速定位失控原因,并下架對應策略
- 設計回調工具,可回調異常數值。
三、結語
數據干預本身是純運營導向的需求,極易成為雙刃劍,若使用不當,非常傷害用戶體驗(沒錯說的就是微博);但作為產品經理,需要能克服抗拒情緒,客觀看待數據干預系統對產品和平臺方的存在必要性,并在用戶體驗和運營價值之間找到平衡,設計出高效、安全的干預策略。
目前筆者混跡的幾個產品經理社區難以找到這方面的設計沉淀資料,本文所述內容基本沒有借鑒前人經驗,全靠拍腦袋和實戰得出,因此肯定存在失當之處,歡迎各位產品經理大神留言指正。
本文由 @十萬號子手 原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議。
看完了,提到的很多點非常實在~獲益匪淺
歡迎探討
很不錯哦。數據干預
你是機器人嗎?是pm平臺的干預嗎?
學以致用,666
膜拜真正的大佬