互聯網潛規則:作弊與反作弊
本文將闡述什么是互聯網作弊,并以百度和淘寶看如何反作弊的行為。
互聯網作弊是什么?
互聯網作弊是一種很普遍的行為,就拿我們最熟悉的來說,有電商和O2O的刷單刷信譽行為、廣告作弊等,具體分類如下圖:
廣告作弊與反作弊
1.背景:互聯網廣告成為主流
(1)數字營銷(互聯網廣告)分兩類:
- 品牌廣告:以品牌宣傳為主,多以千次曝光的形式計費,廣告主追求的是長期的品牌溢價;
- 效果廣告:多以單次點擊或單次行為的形式計費,更關注短期轉化和收益。
(2)投放方式:CPA、CPC、CPM每千人成本、CPP每購買成本等
2.現象:數據作弊
2016年上半年, AdMaster推出的《廣告反欺詐白皮書》顯示:2016上半年,AdMaster的廣告反欺詐監測系統平均每天識別出高達 28% 的虛假流量。的確,中國的數字營銷生態環境也正遭受著虛假流量的侵蝕。
3.作弊類型
- 曝光作弊:可能把廣告展現在一些完全沒有商業價值的垃圾流量上。
- 點擊作弊:利用機器、人工或誘導用戶點擊,例如把廣告換成一個美女圖片,吸引完全不符合廣告意圖的點擊。另外,競爭對手還可能進行惡意點擊。
- 轉化作弊:在注冊、激活、下單等不同場景下通過自動化程序的模擬真人行為。
4.如何鑒別廣告作弊
(1)初級作弊辨別:發現數據異常點。例如:
- 異常峰值
- 出現峰值時轉化數據并沒有增長
- 出現峰值時到站跳出率增長
- 投放的媒體屬性和點擊的地域屬性不符
(2)中級作弊辨別:真人點擊和機器模擬點擊。例如:
- 點擊請求的Headers異常
- 點擊行為分析:機器點擊具有一定的連續性,可以通過判斷同IP同設備的連續點擊、同IP段的大量點擊、同IP連續點擊間隔時間等進行判斷。
——作者:豈安科技;出處:艾媒網(3)轉化作弊辨別。例如:
- 行為頻率、次數異常;
- 注冊者的URL訪問軌跡:機器只訪問注冊URL頻繁注冊;
- 注冊者是否查看了頁面上的靜態資源:機器注冊在訪問時只關心網頁上的文字;
- 不同賬號同密碼注冊;
- 注冊者從到站到注冊間的時間間隔:真人在注冊前會有較長時間的瀏覽過程,而機器行為則直奔主題。
以上整理自:http://www.gupowang.com/app/187.html,作者:姑婆;
5.如何反作弊?
- 目的:無限壓縮作弊行為在正常商業行為中的比例,而非絕對根除。
- 最好的實現方法在于讓作弊成本劇增。
- 思路:砌墻(不斷的加限制條件);拆臺(使作弊行為的獲利大幅度減少)
(1)排重:添加監測鏈接,通過Cookie、設備號或IP排重,如大量出現218.175.11.x這種相同C段的IP號。
(2)頻度控制、SDK加密防護、人工介入監控
(3)點擊有效期:限制點擊的有效期,在有效期內,后續轉化歸屬相應平臺,如超時則不予計算。
(4)異常數據黑名單:對點擊記錄超過一定范圍標記為黑名單,長期過濾。
(5)歸因時間差監控:歸因時間差即指從點擊到下載激活的時間。一般作弊時,偽造點擊與激活是并存的,所以往往在時間邏輯上是錯誤的。
(6)增加行為操作的復雜度,但可能傷害用戶。
SEO反作弊——以百度為例
1.搜索引擎優化——SEO
具體來說,就是通過站內優化比如網站結構調整、內容建設、代碼優化等,以及站外優化比如網站站外推廣、品牌建設等,使網站滿足搜索引擎收錄排名需求,在搜索引擎中提高關鍵詞排名,從而吸引精準用戶進入網站,獲得免費流量,產生直接銷售或品牌推廣。
2.百度怎么反作弊?
(1)綠蘿算法:2013年2月上線的搜索引擎反作弊算法,主要打擊超鏈中介、出賣鏈接、購買鏈接等超鏈作弊行為。通過綜合外鏈內容的相關性、A及B網站頁面內容品質、更新頻率、違規歷史記錄、總權重值,從而判斷外鏈的權重傳遞是否有效。
(2)石榴算法:針對低質量網站的進一步打擊的升級版,將重點整頓含有大量妨礙用戶正常瀏覽的惡劣廣告的頁面,尤其以彈出大量低質彈窗廣告、混淆頁面主體內容的垃圾廣告頁面為代表。
電商反作弊——以淘寶為例
淘寶搜索反作弊系統不僅監控賣家行為,同時也監控買家行為,并且通過對買家ID的行為監控可倒推反證賣家作弊。而且,該算法還可以作為推薦算法使用。反作弊手段大致劃分為以下3種:信任傳播模型、不信任傳播模型和異常發現模型。
(以下來源于淘寶搜索技術內參,由薄言整理http://www.tao-sou.com/809.html)
1.信任傳播模型
在海量的寶貝網頁數據中,通過一定手段,篩選出絕不會作弊的店鋪、寶貝和ID(即白名單)。算法以這些白名單內的頁面作為出發點,賦予白名單內的頁面節點較高的信任度分值,其他寶貝、買家、賣家是否作弊,要根據其和白名單內節點店鋪或寶貝的成交關系來確定。白名單內節點通過成交關系將信任度分值向外擴散傳播,如果某個節點最后得到的信任度分值低于這一閥值,那么該寶貝網頁、買家或賣家則會被認為是有作弊嫌疑。
2.不信任傳播模型
從大的技術框架上來講,其和信任傳播模型是相似的,最大的區別在于初始的頁面子集合不是值得信任的店鋪或寶貝頁面節點,而是確認存在作弊行為的頁面或ID集合(即黑名單)。賦予黑名單內頁面節點不信任分值,通過成交關系將這種不信任關系傳播出去,如果最后頁面節點的不信任分值大于設定的閥值,則會被認為是作弊網頁或有作弊嫌疑。
3.異常發現模型
先找到一些作弊或非作弊的集合,分析出其絕對特征有哪些,然后利用這些特征來識別作弊行為。具體來說,一種是直接從作弊行為包含的獨特特征來構建算法;另一種是通過統計等手段分析正常的店鋪、寶貝和ID應該具備哪些特征,如果不具備則被認為是作弊。這幾種都是通過分析行為之間、物品之間的相似度或區別度,故也可以用來用于用戶的個性化推薦,比如我們常見的“猜你喜歡”、“向你推薦”等。這是我了解的最有趣的一點。
作者:小喬,微信公眾號:蕎麥長長(qiaomaihexiaoqiao)
本文由 @小喬 原創發布于人人都是產品經理。未經許可,禁止轉載。
說的太籠統了。看了跟沒看一樣
閾值 不是閥值
感謝每一個打賞的人,感謝收藏和點贊,這些無形中的鼓勵讓我更有動力~~拖延癥治療良藥。 ??