征信黑名單越來越多,該清退了
編輯導語:大數據發展這些年,出現了太多的三方數據平臺,而幾乎每家都會出現黑名單。隨著征信黑名單越來越多,也是時候該開始清退了。本文從何為清退、為何清退、如何清退以及背后的第一性原理四個方面進行分析,一起來看看。
中國目前有多少負債者,有多少逾期和失信人員,它們是什么樣的組成結構,一直以來都沒有詳細的權威統計。
包括央行及各種官方版本給出的數據都偏保守,并且有一定的滯后性。而且,有些數據是有爭議的。
比如說,失信被執行人員是690w,但實際上老賴的數量肯定比這要多的多。因為很多人沒有上法院,沒有被上報。
我根據不同官方平臺以及媒體報道的數據統計,進行反復比對,加上個人經驗,來作一些推斷,總結了幾個數據。
有多少的負債者?央行的數據統計是不足的,根據征信和互金的比例推斷,目前的話有7億人次,也就是說有征信記錄者的數量,包括擁有信用卡、房貸、車貸以及消費貸、現金貸等的人士。
這里面,有75%左右的人,也就是5億人員是有過逾期記錄的,包括可能還款晚了幾天啊,這種也算。
有7%左右的人,也就是5kw人士是有比較嚴重的逾期記錄的,傳統貸款行業的說法就是“連3累6”。連3累6是說最近兩年有連續3個月逾期,累計超過6次逾期這樣子。這個連3累6往往會影響一個人短期內辦理房貸、車貸的按揭。
這里面嚴重逾期的,也就是逾期達6個月及以上者,是有3kw以上的人次。
這些逾期當中,一部分會上報給法院成為失信被執行人,按上面官方統計是690w。
這些人不僅會被用來做拒貸的黑名單,還會被限飛限乘限住,等等。
不夸張地說,各行各業涉及到的黑名單上億規模是有的。
光聊現象,不談問題和解決方法,那是耍流氓。在信貸業務中,用到的黑名單也容易越積越多,這容易導致其失效。
我們需要對其中低風險的人清退,就像失信被執行人履約完畢后也會被退出一樣。
記得差不多兩年前,部門開會的時候說到黑名單清退的問題,然后老板問大家,為什么要清退,而不是攔截。說的是,黑名單規模越來越大了,是從里面把好人放出來,還是把壞人排掉后其他人都放出來?
我腦袋瓜子一想就有說辭了,畢竟我太能扯了。然后等著被cue,可惜cue了好幾個人也沒cue我,我懶得說話。
今天突然想起來,就又來扯一下?;径际钱敃r的想法,我總是很困擾,我怎么總沒有新想法。
一、何為清退
我們都知道,風控是把風險高的人或者行為給攔下來,讓風險低的人或者行為通過去。
那怎么去判斷風險高的人和行為呢?用數據。
我們這里要聊的就是其中一類數據,黑名單。
做過風控的都知道,我們實際工作中,都會用到一個黑名單。這個黑名單庫可以是外部數據,也可以是內部業務積累的數據,實際上就是各種風險名單的合集。
這個名單很有用,因為已知是一個壞用戶,直接拒絕好了,不用費七八咧做這做那了。
但這個名單有一個問題,它很多時候都被做成只進不出的了。因為入黑容易出黑難,你看別人不爽把人拉黑了,什么時候想過放出來看看呢。
這會導致名單人數會越來越多。這顯然不合理。
一方面涉黑具有時效性,例如一個人當前逾期不一定永遠逾期;另一方面加入黑名單是有誤殺的,這些人會被用來查殺用戶,然后進一步入黑了更多的用戶。
所以,黑名單應該是一個有進有出的體系,要么自動出去,要么手動出去。
二、為何清退
入黑的邏輯決定了其時效長短。
就像被拒的用戶可以放進黑名單里,但這是為了防止用戶再次申請時重復查詢數據,產生數據費用。這個有效期可能一個月是比較合適的,更長就不合理了。因為用戶狀態發生變化了,重新評估可能會得到不一樣的結果。
內部用戶的風險都容易被評估,因而入黑很容易。這些人信息也可以及時地被跟蹤。
這類入黑規則就適合自動設置一個出黑邏輯。
而那些外部黑名單數據呢,不是給你你就接來用的,收不收費不重要,最重要的是你要保證它準。
大數據發展這些年,出現了太多的三方數據平臺,幾乎每家都有黑名單的輸出,短信的、支付的、法院公安的、設備的、互金的等等,什么類型的都有,非常豐富。
這也導致,名單來源千奇百怪,風險不一,你也不知道這個output的input是什么。所以,在接入的時候我們要評估它的覆蓋率和準確率。
準確率就是命中的人風險是多少,顯然是越高越好,實際上可能達到大盤風險的3倍、5倍就是合理的了。那覆蓋率呢,就不能太高,3%、5%可能比較合適,如果達到10%以上,同時在這個水平上還能達到很高的準確率,就太夸張了,那這個數據的可靠性值得去懷疑下。
所以啊,不怕你沒得攔,就怕你攔的太多。
不可避免,即使有合理的自動出黑機制,黑名單也容易越攔越多。
那怎么辦?可能還得想點辦法手動出黑。
也就是對其中一些低風險用戶進行清退。但是這些用戶又都是直拒的,沒有風險表現。
手動清退還蠻困難的。
三、如何清退
有困難也得做啊。怎么做呢?
這就是最開始提到的問題,是從里面把好人放出來,還是把壞人排掉后其他人都放出來?
這本質是風險偏好的問題。
如果我們認為樣本總體,也就是待處理的黑名單全體,比正常用戶要差,從里面撈好人就是更穩妥的辦法;反之,如果我們認為樣本總體和正常用戶差不多,那應該采用排壞人的形式,要相信我們的模型,因為模型就是這樣做的。
風險評估是伴隨著置信度同步存在的,我們用模型做一個風險評分,評分好的用戶里面有一批置信度高的好人,評分差的用戶里面有一批置信度高的壞人。剩下大多數是中間態。
因為黑名單較差,清退中間態的用戶太過冒險。穩妥起見,我們應該撈好人。
這相當于默認這些人有問題,撈回那些你能證明是好人的人。
這是有罪假說啊。
陪審團審判,首先假定一個人無罪,然后收集證據證明他有罪,如果有足夠證據證明他有罪,就拒絕他無罪的假設。
我們做風控黑名單清退,竟然是在采用有罪假說。
具體怎么做呢?
我們需要一個模型去篩選置信度高的好人,其實無監督是不太合適的,因為那是找極端的壞人。我們需要定義合適的標簽,一是,這些黑名單用戶中應該還是有低比例用戶有風險表現的,貸中的入黑就會產生這種結果;二是,圖網絡技術在這是合適的,因為信用風險是可以傳播的,想法設法給一部分黑名單用戶打出這個標簽。
顯然,這樣的清退只能清退較少比例的用戶,如果你期望黑名單規模減半,那還是從入黑的有效性入手吧。
正因為清退困難,作為用戶來說,盡量別觸黑了。
你也許會說,這個自助餐店不讓你進了,你去其他家不就得了。
如果說,這些自助餐店共用一套黑名單呢?
四、背后的第一性原理
黑名單容易傳導,同時又很難被清退,入黑容易出黑難。這件事情背后是,一個壞用戶帶來的不良影響是需要很多很多好用戶來彌補的,甚至是毀滅性的。
連我這樣的號寫點這樣的文章,都難免有要回避的人。
我要強調一下這個做法的合理性。不然你可能覺得很多事情很難理解。
- 為什么很多平臺會設置高危地區的規則?
- 為什么找工作要非常認真地考察自己的直系領導?
- 為什么讀研究生要選一個家庭和諧的導師?
- ……
其實都是風險控制。
大家都知道再高危的地區也只是曾經出現過并且少數人出現過聚集性風險,絕大多數的直系領導都是正常人,有辱師德的是極少數,但因為這些影響足夠大,“寧可錯殺一個,不可放過一千”就是合理的。
當你有的選,排除法就要做的嚴一些。不要想著把他們從黑名單里放出來,以期后續的風控能夠解決。
《孫子兵法》最重求全的思想,從來不以擊敗敵人為目標,而是以保全自己,強大自已為目標。
風險控制的重要性,如何強調都不過分,因為仗沒打贏可以再打,命沒了,就什么都沒了。
不要輕視敵人。
黑名單清退的邏輯說來說去也就是這六個字的思想。
本文由@雷帥 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
一個壞用戶帶來的不良影響是需要很多很多好用戶來彌補的,甚至是毀滅性的。
文章寫的太棒了,花唄這些超前消費真的太害人了,我早早就關閉了,贊!
感謝?,F在越來越花錢感受不到花錢,掙錢感受不到掙錢,然后發現自己始終沒什么存款。很可怕
文章寫得很有條理性,解釋的很清晰,給作者點贊!
哈哈,會欣賞。其他文章也不錯的,只是需要點耐心
當你有的選,排除法就要做的嚴一些。不要想著把他們從黑名單里放出來,以期后續的風控能夠解決。