“高大上”的風控,究竟是什么? (二)
本章分為兩個階段,介紹一套可對外輸出風控的系統,當然內部也是可以用的,相對復雜業務系統來說,本文介紹的會簡單一點,根據公司業務場景不同,請進行相應的擴展。
上章,大概對風控所涉及的幾個內容做了大體的介紹(我思路可能有點亂),從本篇開始開始介紹干貨吧。
首先,針對一套對外輸出的風控系統來說,最重要的是如何在多個領域、不同的場景通過一套標準性設置進行配置后輸出。輸出的形式不建議用太復雜的,風控目前最多的使用模型是通過各種規則進行各項目打分,也就是俗稱的評分卡。
評分卡,通過對各個維度預置評分,通過用戶數據進入后對應不同的閾值所對應的份數,最終為用戶生成一個總分。
這里舉幾個例子:
如果按照上面的3組維度來說,做一個評分分級的話,應該是如下所示:
這里舉了3組例子,第一組是比較普遍的通過數據接口進行驗證的數據,第二組是通過數值來進行區分的數據,第三組是通過用戶自身信息進行分類的數據。
如果,此時進來一個A用戶,他實名認證返回結果,是通過。但是命中了5個多頭,性別為女。那A用戶的總分=5+(-10)+0.6=-4.4分。
如果按照上面例子的評級來說,A用戶得分-4.4分,級別為一般,審核狀況需要人工核實。
通過這么一套評分卡,對于每個用戶進件之后就能有個綜合用戶概況。那么,初始評分是怎么得來的呢?初始評分主要是通過專家模型,說白了其實是拍腦袋想出來的分,就是風控人員主觀意識覺得這個用戶該得多少分。就跟上述舉例是的,性別維度,可能根據場景不同,男性和女性的評分比值都會有所不同的。當然后期,會根據用戶數據越來越多,不停的校驗模型,對評分卡的閾值進行調整的。
說了這么半天評分卡,那么如何跟系統掛鉤呢?這就是本章要解決的問題,下圖是一個系統框架,數據都是采用第三方數據源,和訂單數據以及用戶上傳數據。
看起來比較簡單,這些涵蓋了本系統的基本功能服務構成、基礎框架、業務庫和數據庫內容。
言歸正傳,輔助功能比如一些權限管理、運營相關、數據報表、財務充值等這里就不介紹了,主要為大家介紹下風控系統核心的——風控決策引擎。
聽著叫風控決策引擎感覺好高大上,其實說白了就是配置類的一個東西。使用邏輯,如下圖所示
其實,主要是前期對風控字段的數據清洗過程,通過對外部數據接口和手機設備指紋以及用戶數據,進行統一化字段清洗,清洗后,通過硬編碼形式進行平臺的數據字段、數據字典的添加后,方便風控人員在前臺進行任性的組合使用。
通過數據清洗后,系統用戶就可以在前端進行配置了。比如,
做了三種條件,支持單獨條件、條件組合、交叉驗證形式,對風控策略進行添加,并對相應的策略進行打分。
單獨條件、條件組其實就是滿足驗證類的需求,我這里就不細說了。主要細說一下,交叉類規則。
交叉類規則,大部分應用點是在反欺詐模型上,通過多維度數據交叉形成的規則,尤其是最主要的時間段屬性,做風控的大家應該要明確一點,時間段屬性是能判斷這個人是不是存在是機器的可能性的重要一點,尤其應用在部分平臺的內容反作弊、活動反作弊等上面,反作弊主要是為了減少那些羊毛黨他們下手的可能性,當然,并不是上了風控就能100%杜絕了,風控的只是通過各種手段,增加那些想作弊的人的作弊費用,從而降低他們作弊的可能性而已。
話說回來,交叉驗證這里,上面做的比較簡單,主要是通過主屬性、從屬性的概念去實現,但是對于復雜業務場景來說,主屬性和從屬性可能屬性的字段本來就是已經組合的字段了,會更加復雜,這里只舉例最簡單的。
我舉幾個規則例子:
通過上述這種形式,對于命中的交叉驗證類規則進行打分,其他步驟與上述評分卡一致。
這個實現形式,我大概說一下,對于系統來說主、從屬性是兩個變量,判斷類型是預先寫好的算法,所以對于主從屬性是否能應用該算法的數據類型要前期進行設置的。
把這些配置好后,就可以進入策略流程階段了,什么叫策略流程?其實就是工作流,通過前期以接口形式把輸入參數對接后,通過一定流轉規則對用戶數據進行流轉,最后輸出結果就行了。
那為什么策略要做成工作流的形式?策略流程怎么做?這個下篇文章會說到。
相關閱讀
作者:呆懶龍(公眾號lazy_word懶癌患者拯救世界),3年經驗帝都產品狗,歡迎來撩
本文由 @呆懶龍 原創發布于人人都是產品經理。未經許可,禁止轉載。
你好,懶龍,很想參考一下你引擎這里的設置,其他隱私數據不要,望勿推辭,感謝(我對互金風控也不感興趣)
還有那個區間0是怎么出來的
樓主,一般為什么是-4.6-0,而不是-4.4-0呢?
樓主能把原型共享一下嗎?隱去公司關鍵信息,把共性的東西發一下?這樣學習比較碎片化,如果能給個原型可能立起來
原型可能不行哦~主要是我要刪的東西太多了。。。
哦,好的,那繼續等你的風控四了