大數據風控的新思路
在大數據時代,風控領域正經歷著前所未有的變革。從風險標簽的重新定義到建模過程的革新,再到征信數據的局限性,文章為我們揭示了在快速變化的金融環境中,如何以新的思維方式應對風控挑戰。
我發現很多人喜歡用很老的理論來指導實踐,說要怎么做怎么做,但其實這個怎么做是過時的。那些做法不是定理,也談不上原則,只是慣例,慣例不符了就不能盲目遵守。沒錯,我是在說風控。
別人告訴你要做什么不重要,重要的是你想要做什么。你看,做人和做風控是一樣的。
本文接下來說的具體而細節的東西,遠遠沒有上面兩段話重要,如果你能真正理解的話。???
我要說的新思路并不是什么大不了的東西,只是相對所謂的傳統所謂的慣例那些老古董而言,它有一點點不一樣。我并不能給當下的大數據風控指出一條嶄新的道路。如果沒有外來文明入侵的話,基于我的認識,沒有這樣的路。
1、風險標簽不要光看滾動率、vintage,看你要干什么,產品特性、業務目標、數據可用性等,需要短期就短期,需要長期就長期。
2、建模過程不要老想著邏輯回歸評分卡那套篩選,邏輯回歸是那樣做,但是機器學習模型不需要那樣做,保證結果的穩定性就可以了,復雜系統會以你無法理解的方式解決你擔心的問題。
3、征信數據會越來越沒用,因為人人都是多頭,下沉用戶得用互聯網平臺數據。?在社會范圍內找聰明的學生,按學校去找就可以了,在一個學校里去找,得看別的。??????????????
4、iv<0.02怎么了,iv>0.5又怎么了,誰告訴你不能用?貸中行為變量iv值大的多了去了,下沉客群iv值大的都沒有,模型不做了嗎?
5、額度策略看收入負債,這當然很嚴謹,但收入取不到、負債算不準,沒有就不用了唄。消費現金貸誰的收入負債你算得準,誰的收入負債不會變。??????????????引入不準的東西來解決精細化的東西,大多數都不可行。??????
6、上一條,你可以說我在點拒絕推斷。推斷拒絕樣本表現永遠是推斷,不是準確的,用來建模試圖提升效果就是to be or not to be的問題。其實你怎么建模都可以,沒有人真正關心模型是怎么建的,效果穩定地好就行。但是你不能用虛構的樣本去評估,那樣,你改變了問題。
7、第二條,可以接著說說分群建模。針對性分客群建模,當然有用,但是復雜模型可以一定程度上解決這個問題。再加上,如果你認可遷移學習的話,遷移學習的作用在整體建模之內。
……
我才寫了這么幾點就開始既不想想,也不想寫了。我發現本質上我寫風控并不是為了寫風控,它只是一種載體,我寫的是我的某種幽默和孤高的情緒。這句話是應該寫在日記里的,但也可以say it out loud,畢竟卡夫卡日記都被發表。
我想到了馬斯克。最有錢,最有創造力,最有影響力。要是活成馬斯克,四十歲就死也可以?。?/p>
又順便想到了第一性原理。不是每個步驟都得自己從第一性原理重新推導和測試,但是有必要的時候,對這個部分產生質疑。
在風控領域,策略也好,模型也好,行得通不麻煩不緊要的慣例遵守就遵守,行不通或者很麻煩或者不該做的做法,先質疑它。??????????????????
自然而然,我們可以聊一聊風控的本質。
最近,銀行放貸的同志們紛紛表示:但凡急著找我借款的我都不敢貸給他,但凡我覺得優質的客戶都不想借錢;以前拼命拉存款,現在大額存單要限額;反正你想要的東西我永遠沒有,我想給你的你永遠不想要。
風控的作用是,match那些本不match的東西,還是,match那些本就match的東西???????
加繆寫過:在火車上,我看見一對年輕的情侶。兩個人都長得不好看。女孩拉著男孩,笑吟吟的,撒嬌,撩撥他。而男孩,兩眼無神,因為在大庭廣眾之下被一個他并不引以為傲的女人愛著而感到窘迫。??
這話可以回答上面的問題。
本文由人人都是產品經理作者【雷帥】,微信公眾號:【雷帥快與慢】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
哇,大數據風控聽起來好高大上,感覺能幫我們提前避開好多坑呢!????