虛假流量的認知與識別(上篇)
接下來兩篇文章都是針對虛假流量的識別,上篇圍繞虛假流量的發(fā)生機制、發(fā)生原因(背后的利益捆綁)、識別虛假流量的常見維度等;下篇從一個案例完整介紹如何識別虛假流量。
電商、支付平臺、O2O、自媒體、廣告等行業(yè)無一例外地充斥著虛假流量,不同行業(yè)的流量作弊形式不同。對廣告主來說, 了解廣告投放過程中虛假流量的作弊形式和獲益形式,是識別虛假流量的基礎(chǔ)與前提。
圖?1 各行業(yè)虛假流量的形式
一、看似正常的廣告投放的環(huán)節(jié)
一般而言,廣告投放過程包含這樣幾個環(huán)節(jié):
- 第一步,廣告主選擇投放哪種廣告,常見的形式包括 SEM、DSP、信息流、開屏廣告等;
- 第二步,確認廣告的付費形式,常見的廣告付費形式有 CPM、CPC、CPA、CPS 為主要的結(jié)算方式,分別按照展示量、點擊量、 轉(zhuǎn)化量、銷售額結(jié)算;
- 第三步,跟蹤廣告的投放數(shù)據(jù),常見的投放數(shù)據(jù)有展現(xiàn)量、點擊率、點擊量、消費、成功注冊量、下載量等。
由于廣告投放過程中渠道服務(wù)商存在各級代理,存在流量獲取的透明度不高的問題,讓可供作弊的灰色區(qū)域越來越多。
圖 2??廣告投放流程
二、虛假流量的發(fā)生機制及獲益形式
看似正常的廣告投放流程,其實隱藏著虛假流量的危機。站在廣告主的角度,我們從兩個方向去解讀虛假流量:
- 第一種是 虛假流量的“發(fā)生機制”;
- 第二種是虛假流量的“獲益形式”。
1. 虛假流量的發(fā)生機制:機器作弊 + 人為作弊
圖?3 機器作弊 & 人為作弊
“機器作弊”常見的手段有,通過機器發(fā)送虛假流量、肉機訪問網(wǎng)頁、修改 DNS/IP 訪問網(wǎng)頁、爬蟲技術(shù)訪問網(wǎng)頁等手段來 制造虛假流量,目的是模擬瀏覽行為產(chǎn)生大量瀏覽痕跡或點擊和實現(xiàn)流量增加,機器作弊的成本相對較低,但都離不開代碼程序。
目前較好的預(yù)防措施,是通過基礎(chǔ)的用戶行為分析來識別此類虛假流量,再通過補量、屏蔽的方法來減少此類虛假流量。 例如:頻繁更換用戶身份,在一個 cookie 身上猛薅羊毛,一個用戶有成千上萬次展示;
再如:iframe 造假展示也是常用方式,iframe 是一個 HTML 標簽,常常被用來作為承載展示廣告的載體,作弊可以通過將 iframe 的尺寸改為肉眼無法識別的圖片。但這畢竟算一次曝光,廣告主會要向此付費,實際上用戶并未看到。
“人為作弊”場景的手段有,通過雇傭、激勵的方式雇傭大批人員去點擊廣告、下載 APP、訪問網(wǎng)頁,因為屬于人為操作。
這類虛假流量較難屏蔽,但成本相對較高??赏ㄟ^深度用戶行為分析,如轉(zhuǎn)化情況來識別此類虛假流量,并提高“人為作弊” 的運營成本來減少此類虛假流量。
2.?虛假流量的獲益形式
圖?4 虛假流量的獲益形式
提到虛假流量的獲益形式,就離不開上文提到的廣告付費形式。每種廣告都會有對應(yīng)的結(jié)算和考核指標,這就成為虛假流量作假的痛點之一。
- CPM、CPC 付費形式的作弊場景主要為刷廣告指標,如:曝光、點擊等。
- CPA 付費形式的作弊場景是刷下載、激活及留存等。
- CPS 付費形式的作弊場景是刷訂單。
每種廣告都有對應(yīng)的付費形式,每種付費形式都有虛假流量獲益的訴求點,這些組成了虛假流量獲益的形式。這些虛假流量的出現(xiàn),通常帶有明顯特點,比如:點擊變得很頻繁但無有效交互、一段時間內(nèi)同一個人頻繁訪問投放的廣告等。
三、虛假流量的“生態(tài)圈”下的利益捆綁
虛假流量之所以能成為“生態(tài)圈”,是因為供需雙方有著共同的利益。在這個“生態(tài)圈”中,虛假流量的提供者、虛假流量 的獲取者是兩個重要角色。
1. 虛假流量的提供者:媒體與廣告平臺的利益捆綁
廣告平臺和媒體是虛假流量的提供者,兩者掌握著大量的流量資源。
- 媒體廣告平臺媒體廣告平臺是廣告流量的源頭,也是廣告投放鏈條中收益最大的一方,每年中國在營銷廣告的投放已經(jīng)有數(shù)百億元。日益增加的廣告投放需求與流量需求,不停推動著廣告平臺自身對流量擴增的需求,這樣虛假流量也就隨之出現(xiàn)了。
- 廣告服務(wù)商:廣告服務(wù)商,作為廣告主與廣告平臺的橋梁,是廣告投放鏈路中重要的環(huán)節(jié),廣告服務(wù)商與廣告主達成協(xié)議去完成其要求 的 KPI 業(yè)績,若無法完成 KPI,虛假流量也會成為實現(xiàn) KPI 業(yè)績的一種手段,例如:想盡辦法創(chuàng)造下載量、訪問量、閱讀量等。
2. 虛假流量的獲取者:“KPI”壓力下的無奈與默許
在一定程度上,廣告主很容易成為虛假流量的“推動者”,例如在以下場景中:
- 面對考核指標的壓力:當(dāng)企業(yè)(廣告主)過分追求 KPI 以及某些效果指標的時候,基于考核指標的壓力會越來越大,當(dāng)曝光、 點擊等指標無法完成時,不自覺地會忽視廣告刷量的影響。
- 投放價格低:歸因分析能夠幫助企業(yè)判別最終轉(zhuǎn)化源自哪個渠道(或哪些渠道對轉(zhuǎn)化有積極影響),而企業(yè)經(jīng)常會忽略這一功能。常見的原因是當(dāng)投放預(yù)算充足、獲客情況滿足 KPI 的情況下,企業(yè)的營銷運營會忽略不同渠道存在的虛假流量。而有些渠道的流量真假參半,若不去追溯每個渠道流量質(zhì)量,就會縱容虛假流量對營銷效果的長期影響。這對于以效果為目標的營銷最為重要,尤其在年度復(fù)盤的時候,才發(fā)現(xiàn)損失也不是一個小數(shù)目。
- 企業(yè)融資需求:一些創(chuàng)業(yè)公司為了把下載量等數(shù)據(jù)做得好看,吸引更多的投資,也會主動用虛假流量的方式刷單。
3.?高利潤、低風(fēng)險助長雙方流量作弊
虛假流量并無高深的技術(shù)含量,且流量造假成本極低。相關(guān)數(shù)據(jù)顯示:刷流量的成本不及正常流量成本的十分之一。
廣告主對流量質(zhì)量的評估,除了發(fā)布方提供的報告外,無直接證據(jù)證明對方造假,因此追究虛假流量難度大,維權(quán)較為困難。
四、識別虛假流量的難點
為識別虛假流量,廣告主會因以下兩個問題而犯難:
1.?廣告投放數(shù)據(jù)與網(wǎng)頁轉(zhuǎn)化數(shù)據(jù)斷層,無法判斷后續(xù)轉(zhuǎn)化情況
廣告投放數(shù)據(jù)與網(wǎng)頁轉(zhuǎn)化數(shù)據(jù)斷層是信息不透明的重要原因。
什么是廣告媒體數(shù)據(jù)?
前文提到,虛假流量會針對曝光和點擊數(shù)據(jù)做假,這兩個數(shù)據(jù)就屬于廣告媒體數(shù)據(jù)。
什么是轉(zhuǎn)化數(shù)據(jù)?
當(dāng)流量來到網(wǎng)站后就成為了訪客,訪客在網(wǎng)站完成交互(如:L注冊、有效呼起、下載等)可以認定為線索, 這就是轉(zhuǎn)化數(shù)據(jù)。 廣告媒體數(shù)據(jù)與轉(zhuǎn)化數(shù)據(jù)斷層,也就是通常說的前后端流量數(shù)據(jù)割裂。
這種情況下,一旦轉(zhuǎn)化率下降,廣告主將無法判斷 是投放策略問題還是虛假流量作怪。 廣告主只能統(tǒng)計到前端的點擊轉(zhuǎn)化,不知道后續(xù)業(yè)務(wù)轉(zhuǎn)化如何,廣告主不能獲得用戶的詳細信息,就很容易被廣告平臺所 蒙蔽,盡管對廣告平臺的流量有所懷疑,也沒有明確的作弊證據(jù)。
2. 無法判斷虛假流量渠道,并進行規(guī)避
無論是哪種轉(zhuǎn)化行為(注冊、呼起、下載、激活等)都離不開流量渠道,更多時候轉(zhuǎn)化行為是由多個流量渠道共同承擔(dān)的。
當(dāng)全部流量混在一起的時候,即使你知道有虛假流量存在,也無法準確定位是哪一個渠道帶來的虛假流量。
五、全流程數(shù)據(jù)流量監(jiān)控是識別的基礎(chǔ)
無論從哪個維度入手,識別虛假流量,需要將流量數(shù)據(jù)、行為數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)通過一定的數(shù)據(jù)采集手段,來獲取完整、全 面和準確的數(shù)據(jù),目的是實現(xiàn)全流程數(shù)據(jù)流量的跟蹤與分析。只有獲取了完整全面的數(shù)據(jù),我們才能找到虛假流量的蹤跡,只分析一個虛假流量環(huán)節(jié),不足以支撐虛假流量的證據(jù)。
下圖是流量轉(zhuǎn)化的完整過程:為方便大家理解什么是“全流程數(shù)據(jù)流量”,可見下圖:
圖?5?全流程數(shù)據(jù)流量
六、識別虛假流量的常見維度
一般來說,真實流量一般自然 (真實的流量在各個維度中表現(xiàn)一定是自然的)與多樣(網(wǎng)民的喜好各不相同,行為一定也是 多樣的)。而對于虛假流量,常表現(xiàn)出一定的目的性(虛假流量的產(chǎn)生一定和某個特定的目的有關(guān))和規(guī)律性(特定的目的導(dǎo)致虛假流量一定有特殊的規(guī)律)。
由于虛假流量與真實流量在具體訪問行為有較大差異,圍繞用戶行為可從以下幾方面識別出虛假流量。
圖?6?識別虛假流量的常見維度
1.?基本屬性
具體包括:時間 & 地域維度、終端類型、操作系統(tǒng)、聯(lián)網(wǎng)方式、運營商、IP 集中等。
- 時間維度 & 地域維度:正常的流量訪問分布在一天中的各個時段、地理分布較為均勻(區(qū)域性投放或者活動除外)、訪問趨勢較為平緩。而不同流量出現(xiàn)時間段特殊、來源區(qū)域集中、趨勢突增的情況。因此,通過流量產(chǎn)生的時間、地理位置、訪問趨勢變化都可以成為判斷虛假流量的參考方式。
- 終端類型:不同的渠道覆蓋不同的用戶群,用戶終端會有一定的區(qū)別。比如:小米應(yīng)用商店渠道的用戶,十之八九手機是小米手機,如果對方是中國移動的客戶,他們則來自于移動運營商。排除這些特殊渠道的應(yīng)用商店,大部分渠道的用戶終端跟整個互聯(lián) 網(wǎng)終端分布是類似的。因此在正常情況下,用戶訪問設(shè)備應(yīng)該多元化。同理,用戶的設(shè)備操作系統(tǒng)、聯(lián)網(wǎng)方式、運營商等設(shè)備屬性,同樣可以成為判斷虛假流量的參考標準。
2. 產(chǎn)品參與度
具體包括跳出率、平均訪問深度、平均訪問時長、用戶行為路徑、頁面點擊情況、流量留存情況、單頁面人均訪問次數(shù)等。
(1)跳出率
我們通常通過跳出率來衡量網(wǎng)站性能與質(zhì)量等,跳出率也可以作為辨別虛假流量的參考指標。如果跳出率過高,我們除了要判斷投放渠道的質(zhì)量和定位客戶群體是否精準外,還應(yīng)該警惕虛假流量。
(2)平均訪問深度
訪問深度是用戶一次瀏覽網(wǎng)站、APP 的深度,它是衡量網(wǎng)站服務(wù)效率的重要指標之一。以刷量為目的的虛假流量,用戶訪 問深度通常非常低。當(dāng)然,造成用戶訪問深度不夠的原因有多種,如:新投放的落地頁的失敗引導(dǎo)等。
因此我們在觀察此指標時, 應(yīng)率先排除產(chǎn)品較大改動造成的訪問深度不足等特殊情況,或者與其他渠道的流量數(shù)據(jù)綜合比較,進行科學(xué)評估。
(3)平均訪問時長
平均訪問時長指標,主要用來衡量用戶與網(wǎng)站、APP 交互的深度。交互越深,相應(yīng)停留的時長也越長。顯然虛假流量追求 的是“量”,而非“時長”,因此平均訪問時長也可以配合幾個網(wǎng)站參與度指標一起分析。
(4)用戶行為路徑
用戶在 APP 或網(wǎng)站中的訪問行為路徑,用戶路徑的分析模型可以將用戶行為進行可視化展示。因此通常用戶通過渠道來到 網(wǎng)站后會有不同的行為,他們一般會從落地頁開始進行分流,會訪問不同的頁面,并在不同的頁面結(jié)束對網(wǎng)站的訪問。
顯然, 用戶行為序列分布是沒規(guī)律的,而對于虛假流量,雖然通過某些方式完成 2-3 次點擊,但也是預(yù)先設(shè)定,有跡可循的。
(5)頁面點擊情況
虛假流量用戶的頁面點擊通常是不點擊,或者雜亂點擊的,借助熱力圖工具可以較為容易地發(fā)現(xiàn)問題。
(6)留存情況
留存可以判斷用戶忠誠度,真實的流量總會有一部分訪問者會再次訪問,而虛假流量在合作結(jié)束后是不會進行這些收尾工作的。
(7)流量的單頁面人均訪問次數(shù)
如果某個落地頁面的人均訪問次數(shù)很高,比如:4 次以上的話,就很可疑了,因為在一次訪問中用戶一般是不會多次瀏覽同一 個落地頁的。結(jié)合該頁面在網(wǎng)站整體的人均訪問次數(shù)進行對比,結(jié)果會更加準確。
3.?轉(zhuǎn)化情況
很多作弊流量可以模仿人類行為,成功繞過跳出率、平均訪問深度和停留時長這些宏觀指標,但是要模仿一個業(yè)務(wù)轉(zhuǎn)化就 比較難了,如果宏觀指標表現(xiàn)很好,業(yè)務(wù)轉(zhuǎn)化很少的話,就需要提高警覺。
下篇將從用戶行為數(shù)據(jù)講述如何多維度診斷虛假流量。
作者:張喬,神策數(shù)據(jù)內(nèi)容營銷負責(zé)人。公眾號:神策數(shù)據(jù)
本文由 @張喬 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
- 目前還沒評論,等你發(fā)揮!