“高大上”的風控,究竟是什么? (一)
最近工作有點心情抑郁的我,來擼幾個文吧。如果有不對的地方請各位勿噴,只是經驗之談。本期只針對風控做個概述,初步的認識,后續會進行從產品到策略上的深度解析。
風控對于很多人來說覺得很高大上,其實是挺高大上的,但也不是那么難的。很多人問我,是不是我得會建模?邏輯回歸、決策樹、機器學習、NPL等等,聽起來是聽厲害的,我看也是又會這又會那是挺厲害的,其實,很多事情并不難,且聽我一一道來。
其實風控分幾種,分別是風控產品、風控策略、風控建模。沒錯,不是每個風控人員都會建模,其實大部分人只是會SQL語句,找到維度共性,在讓專業做模型的同學去完成后面的操作,不過是用Logistic還是用什么,不過風控現在比較常用的是Logistic和Decision Tree以及分類算法。
那么,機器學習是什么?作用是什么?其實主要是喂養數據,調整模型的,風控看的比較多的是KS值,和AUC以及其他的一些值。
大體簡單介紹下這兩個值,KS值主要是為了區分數據樣本在模型的正負關系(也就是好壞程度),主要是這個圖是個曲線,對于風控來說,如果數據樣本呈正態分布是一個好現象。所以,KS其實也是區分這個曲線的正太分布情況的,取值是在0~1區間,數值越大,就可以說樣本分的過開,可能樣本不是很好(或者模型不好)。當然,KS只是代表模型的分隔能力,并不代表正確。
(來自網絡圖片)
那么,AUC是什么呢?其實也是跟ks差不多的一個分值器,用以區分好壞樣本,是ROC曲線的概率區域。AUC值越大,證明該算法在正負樣本內有更好的分類。
(來自網絡圖片)
好了,這個其實不懂也沒關系,作為風控產品,模型還是交給專業的人士去做吧~
那么言歸正傳,風控產品需要懂什么呢?首先,我們要明白這個風控是給什么公司做的,傳統的金融機構比如銀行、證券公司我就不說了,因為他們的風控早些年還是通過評分卡進行打分,并且都是通過專業的風控、信審人員去線下核對的,此外再加上央行報告,所以逾期率比較低。這里介紹的風控主要是針對大數據風控的。
大數據風控(主要針對金融行業,如果是其他行業的我以后會說),顧名思義得有大數據,很多公司沒有咋辦?當然是采購,市面上很多數據公司,數據公司的選擇自己評估吧。我只是大概說下一般需要什么類型的數據:
- 身份認證類(比如三要素、四要素等)
- 反欺詐類(如運營商信息等)
- 名單核驗類(黑白灰名單、司法等)
- 第三方評分類(可有可無,主要針對自己模型沒有建立的)
基本用戶進件后風控流程如下所示:
當然根據公司場景還會增加,反欺詐除了運營商的數據類型以外,其實更多的是通過手機設備指紋收集的用戶的一些操作行為數據,進行反欺詐規則的設置分析。
這又不得不說到風控的本質了,風控的本質其實就是區分用戶是好人還是壞人、是人還是機器人。在風控策略設置上只要緊扣這2點就行。
那么針對一個系統,整體流程是怎么樣的呢?如下圖所示(只是個大概)
主要風控,是一個選件的過程,通過內置一些風控規則和數據支持,通過計算機更好的區分這個用戶是否是好人、是否是人,是否能還款、有沒有還款能力這幾件事,來幫助金融類公司進行更好的借貸、分期等消費分期行為。
具體的風控策略設置、風控系統搭建會在以后介紹,本期內容就到此為止,如有問題歡迎指正。
作者:呆懶龍,呆懶龍(公眾號lazy_word懶癌患者拯救世界),3年經驗帝都產品狗,歡迎來撩
本文由 @呆懶龍 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議
寫得非常不錯。
棒棒噠
不錯滴