用戶畫像在風控實戰中的應用

1 評論 9691 瀏覽 45 收藏 12 分鐘

編輯導語:說到用戶畫像,大家應該不陌生,本篇文章會通過幾個維度介紹用戶畫像的內容,從三個方向驗證其解決了什么問題,并提出構建畫像的難點。推薦對用戶畫像感興趣的朋友閱讀,希望對你有所幫助,一起來看看吧。

在日常的風控實戰中,經常會有業務部門的同學提問:

  • 業務中的黑產用戶 / 羊毛用戶是誰?他們長什么樣子?
  • 他們是怎么進來的?進來之后又去了哪里?
  • 風控會不會誤攔?誤攔之后的客訴怎么去處理?
  • ……

圍繞這些實戰問題,我們需要借助【用戶畫像】這個產品,來做詳細的解釋。

一、畫像包括哪些內容

網上其實對這個問題做了很多的介紹,只不過大家使用的場景不同,所以對于畫像的定義和使用方法也不盡相同。

簡單來說:畫像就是一個人的wiki百科,在這個百科中,介紹了用戶的來歷、身份介紹、做了什么事情、在某些業務場景下的成就或者比較“有名”的事情。

只不過,繁雜的文字,對于平臺或者運營而言,閱讀和理解成本過高,所以又在該百科基礎上,做了標簽的提煉,因此出現了用戶標簽體系。目前市面上看到的用戶畫像,其實大部分是用戶標簽庫。

用戶標簽庫的構建程度,代表著平臺對用戶的認知程度。

風控場景下,平臺往往會通過以下幾個維度來建設:

1. 基礎維度

這個維度比較大,包括用戶的身份子維度、設備子維度、支付子維度、手機號子維度等,在這些子維度下去構建標簽;

  • 身份子維度:年齡、性別、地區、姓名、實名記錄、擴散關聯等;
  • 支付子維度:渠道、支付方式、擴散關聯等;
  • 手機號子維度:是否小號、是否接碼號、是否二次放號、風險等級、擴散關聯等;
  • 設備子維度:虛擬設備、設備root、設備篡改、常用設備等。

擴散關聯,一般是指以該維度為主體,基于關系圖譜,查看該主體的周邊關聯度數,比如關聯設備數、關聯賬號數、關聯支付賬號數、關聯訂單數等。

2. 行為維度

主要基于用戶在APP中的埋點數據和請求數據,來制定用戶的行為軌跡,并基于行為軌跡,提煉用戶的風險標簽。

  • 切換頻次:近N天設備切換頻次、近N天IP切換頻次(geoHash、POI)、近N天時速異常切換等;
  • 數據缺失:完整路徑缺失率、請求參數缺失率、關聯因子異常(例如UA、IP、設備信息等);
  • APP速度:近N天機器行為(頻次和時間間隔接近)、近N天用戶CV時間過短等;
  • ……

3. 訂單維度

主要跟交易相關,重點查看交易鏈路上的維度標簽:

  • 占庫存:下單率、完單率、SKU商品等;
  • 羊毛下單:打折(低價)商品的占比、平臺貢獻度(帶來的收入 – 支出)等;
  • 聯合刷單:同一商家的占比、低價商品的占比等;
  • 虛假交易:收貨地址的真實性、地址中帶有特殊編號的占比、無完整或實際軌跡的占比、接單完單時效過快的占比等。

4. 資金維度

主要在提現環節,大部分的平臺基本在提現環節做了同人認證,即資金只能進入賬號本人賬戶。因此這里主要做監控為主,監控短期內資金規模、大額資金的占比、提現賬號的數量等。

二、畫像解決了什么問題

畫像的構建是否成功,是否滿足業務場景的訴求,需要在實際應用中提現出來。這里從三個方向來驗證畫像:

1. 策略規則的生命管理

風險運營同學對風險的感知和作案方式的還原,風險策略同學對風險用戶群體的定位和特征的提煉,線上部署了相應的攻防策略規則。

但所謂“道高一尺魔高一丈”,黑產的攻擊手法不斷的變換,原有的策略規則會進入相應的“失效期”。而感知到這一變化,可借助畫像的標簽內容進行水位的統計展示,以此來快速感知到。

例如:惡意占庫存場景,可以查看下單率超過一定閾值用戶的占比,與之前的正常占比進行比較,來感知到規則是否正在失效。

2. 單用戶的風險下探

集中在客訴場景,C端用戶被攔截后發起客訴,運營同學需要對風控攔截做出相應的解釋,即對攔截的規則進行解釋。

注意,上面講到風控畫像主要是標簽庫,規則依賴標簽庫,如果仍然是以標簽庫進行解釋,那么意味著規則必須100%準確,太難了。

所以,在畫像中,仍然需要構建風險的下探鏈路。構建的思路是基于用戶實際發生的業務數據、行為數據、訂單數據,進行反向的驗證。

例如:切換設備頻次過高和時速異常被攔截,那么在畫像中則以詳細列表的方式展示用戶近N天的登錄記錄(因為切設備就要重新登錄),在登錄記錄中列出設備的IMEI、設備指紋、經緯度、和登錄時間,以這些數據來幫助運營進行定性。

因此,畫像要支持用戶風險標簽的提煉,同時還要支持對于這些標簽的解釋。

3. 用戶群組的挖掘

風險的攻防,不是單一用戶的攻防,而是群體的攻防和管控,而群體中的用戶表現,往往是具有相似度的。

畫像是單一用戶的標簽集,此時可通過標簽集的相似度對相似用戶進行挖掘。

當然,必須承認,準確率不高,比如:下單率低,很多小姐姐只看不買,太正常了。因此往往是多個維度相加來做相似度挖掘。同時再借助關系圖譜,將用戶之間的強關聯屬性提煉出來,一個簡單的群組就產生了。

而此時用戶的標簽,則會上升到群組,形成群組的標簽,群組畫像。

三、構建畫像中的難點

1. 標簽的實時性

畫像中的標簽,多則幾千個,少則也有幾百個,如果全部要求實時或者離線,前者造成計算資源的浪費,后者造成線上風險的漏過。

在這里,則采取一個原則來進行分類:標簽的增益,即該標簽在風險中的影響力 + 標簽本身的動態性。

標簽本身的動態性:一般是指標簽的更新頻率,例如身份信息,基本是不會變的;用戶近30分鐘的切換設備數量,這種是30分鐘要重新統計的。

標簽在風險中的影響力:舉個例子,30分鐘內用戶切換設備超過3個,這個不能定義為用戶有風險;30分鐘內用戶切換了虛擬設備超過3個,這個可以認定為用戶有風險。因此前者的實時性要求不高,但后者就要求實時。

因此,在實戰中,跟風控規則強關聯的,往往是實時性要求高的。

2. 標簽的完整度

是否所有的用戶,標簽體系都要建設成一樣的,比如活躍用戶和剛注冊的新戶是否一樣?

這里,需要借助一個分類思想:業務場景 – 用戶角色 – 用戶價值 – 用戶風險度,將此定義為一個空間,每往下走一級,則建設的標簽內容就不一樣。這個方式,有助于后續不斷枚舉并迭代補充遺漏的信息維度。

3. 標簽的區分度

實際上,不是每個標簽都會被用到,也不是每個標簽都能代表用戶,也就是無效標簽。往往建設一個標簽,用該標簽對用戶進行分層,無論是閾值多少,發現動不動就是80%+的用戶被圈在一起,這就代表該標簽是無效的。

這里有一個小的檢驗方式,即通過該標簽 + 風險閾值,將用戶進行白戶、黑戶、灰戶的分層,如果其實現的比例接近1:8:1,則代表該標簽具有一定的區分度。

當然,像年齡、城市、性別這些基礎中的基礎標簽,是不能使用這種方式的。

四、總結

其實,用戶畫像實際上不只有一種,上面的觀點論述,更多還是在賬號維度出發,給到大家的更多是一個方法論的介紹。在實戰中,還有設備畫像、IP畫像、手機號畫像、訂單畫像等多種風險畫像。

畫像這個產品,從早期的滿足業務需求下進行創建標簽,到龐大標簽庫下的創建變量,未來的方向希望是能夠自出創造標簽給到業務方使用。

而在創造標簽這個方向上,對于風控團隊而言,除了需要加強自身的風險挖掘能力之外,還需要工程側提供一套標準的、快捷的驗證標簽的產品流程,后續將會為大家介紹下這套流程的構建方式。

 

本文由 @話多的熊仔 原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議

本文由 @話多的熊仔 原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 標簽,黑白灰分層

    回復