模型在風控策略中用到什么細節?

0 評論 10148 瀏覽 41 收藏 10 分鐘

編輯導語:風控一般包含很多類型的規則,每個規則都是結合產品、業務基于經驗和數據分析產生出來的,模型在風控中也有很大的作用;本文作者分析了模型在風控策略里有什么使用細節,我們一起來看一下。

模型:通過歷史樣本數據,運用數學算法,預測未來;我們通用的信用模型a卡就是根據客戶的申請數據字段,然后在權重上通過算法計算出來的系數的組合,得到相應的預測概率(0-1之間),這就是最初的模型——它代表的是預測客戶發生逾期的概率,模型評分卡只是方便管理而轉化來的。

策略:即為了目標的實現,通過一系列的規則組合,而成為策略。

所以風控會出現有很多的名詞:因子、規則、規則集、策略、策略集、事件等等。

風控最基本的因素是因子,因子構成規則,多個功能相似的屬性規則組成規則集,多個規則集再成為策略;例如反欺詐策略,準入策略、額度策略、模型策略,這些組合成策略集,而整個策略集構成了風控的一個貸前審核事件。

大概介紹了風控相關的一些概念,那模型在風控屬于什么位置呢?

其實可以理解模型就是一個因子,他可以單作為一條規則,成為只有一個規則的規則集,一個策略集,一個事件;有伙伴們問規則、模型、策略,都是具體怎么使用的,怎么組合的,規則和模型的區別等等,熟悉上面的邏輯就大概清晰了。

另一個模型之所以在風控中的有著重要地位,是由于模型通過多個規則因子(也就是蘊含了更多的規則)組合而來,它代表一系列規則因子的風險預測能力;所以它比任何一條規則都具有很好的區分度,所以模型這個單一的因子,生成單一的規則,比起其他簡單規則在風控中的地位高了很多。

話說回來,模型概率或分數在風控里回歸到一個因子,如何具體應用呢?

一、選擇cutoff,即決策點

(模型決策表)

這個圖是根據模型衍生出的風控策略決策表,當我們的模型做出來了,我們是怎么選擇cutoff呢?

假如這個模型是做了拒絕演繹的模型,代表全部樣本的分布評分;我們先看bin_pdrate 從逾期78.57%單調下降到1.85%,模型的單調性很完美,ks為23,bin_rate是箱占比,整體上還是很正態分布的。

重要的我們看后兩列,這兩列是通過前幾列計算的在每個閾值點下的通過率和對應的壞賬率,隨著通過率的降低,壞賬也隨著降低。

風控往往有幾個KPI考核指標,如壞賬率;如果KPI不能大于7,我們選擇了大于680分,30.16%的通過率,這是一個簡單的選擇。

有的公司會復雜的計算每一行的盈利情況,然后根據盈利來決定cutoff選擇哪一個。

方法多種,有的可能30%的通過率達不到KPI,會選擇630-680之間的一部分客戶進行人工審核、信審,或者再利用其它的數據模型進行撈回,下面講下撈回的策略是如何使用模型的。

二、模型撈回之提高通過率,精細化風險評估

撈回就是被模型拒絕的一些相對不差的客戶用其它有區分度的模型進行再次評估,達到提高通過率的效果。

(模型矩陣表)

拿我們常用的模型矩陣來說,這個與分群建模的思路是一樣的,上圖(圖中數據非真實模擬)中是通過矩陣壞賬的比例高低然后給與不同的額度。

在申請分660-679之中,我們通過芝麻分可以更好的再區分這個區間的人群風險,做到精細化管理,在申請分660-679中我可以選擇芝麻分在大于680,額度為大于10000的的客戶進行放款;因為這部分客戶的模型風險跟申請分大于680的同顏色的相同,這樣就可以根據模型矩陣來提高通過率。

三、多模型補漏之更合理地選擇客戶

(模型補漏策略)

在實際場景中,我們還會遇到另一種情況,就是我們模型的數據不是完全覆蓋的,有一定的缺失,一定的查得率,這時候往往不是一個模型可以解決問題的;因為你不能因為沒有數據而拒絕,這時候往往需要過多個模型進行互相補漏。

也就是說,如果有5個備用模型,在很大概率是可以決策任何一個用戶的借貸情況,模型的數據源越多,就可以覆蓋越多的客群,更大化的對客戶進行合理的風險評估。

例如第一個模型A沒有數據,則運行模型B,按順序依次調??;一般模型運用策略是最好的,覆蓋最高的放在前面。

四、多模型組合使用之整體風險穩定

(模型組合表)圖表模型名稱敏感用字母替換

這個風控模型不僅可以作為模型A-B Test使用,來測試新模型的效果(此表同時跑了8模型,每個模型分配不同的流量),然后對測試模型進行效果評估。

另外,通過長時間的工作經驗積累,還可以將幾個有區分度的模型分流組合使用,整體效果會更好;原因主要是數據的穩定性、數據的衰減性、市場等,往往多模型組合較單個模型使用,具有更穩定的數據表現和更好的理想效果。

并不是我們認為模型A是最好的,然后就全部流量給A,因為都給A會存在很大的不確定性;例如數據源停供、數據源出現失真、數據源預測質量明顯下降;這些現象,在實際工作中是經常遇到的,事后發現就有些晚了。

反過來,通過幾個較好模型的組合,會發現有更穩定、更理想的數據表現,圖中無淘寶模型用了5個模型進行組合。

五、模型日志的的重要性

(模型日志)

上文是簡要的一個模型使用變動的所有記錄日志,這個一定要重視起來;我們工作中有很多需要回溯的時間,或者風控表現滯后,往往再排查原因不能準確的定位,就比較浪費時間了,最后還可能找不到原因。

假如今天客群表現很差,我提前知道某天前改動了模型的閾值,正好今天有表現,這時候往往會很快的定位。

數據風險的變動無外乎兩種,外部的客群和內部的風控,風控日志的每個變動都會帶來風險的變動。

所以找任何原因從日志上下手是最方便的,他就像我們寫代碼的log日志,很好很方便,也很需要,直接告訴你病點在哪。

以上是模型具體使用的一些細節,在如何選擇決策點、模型撈回、模型補漏、模型組合、模型日志上進行具體的風控實施。

希望可以給讀者在思路的一些幫助與完善,謝謝!

 

本文由 @FAL金科應用研院 原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自 unsplash,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!