個人金融借貸場景下,大數據風控的行業分析及應用分析

4 評論 13657 瀏覽 77 收藏 26 分鐘

大數據風控是現在金融科技公司白熱化競爭的業務場景,那大數據風控到底是什么?這個行業前景如何?有哪些機構在布局競爭?有哪些產品形態?本文將圍繞個人借貸場景,為你一一揭曉。

一、大數據風控是什么?

大數據風控按照通俗的概念解析:通過運用大數據構建模型的方法對借款人進行風險控制和風險提示。

這句話涵蓋大數據風控必要的4個要素:

1. 原材料:大數據

2. 實現方式:技術模型

3. 目標人群:場景中的群體。

由于本文主要指個人借貸場景,則目標人群是借款人。還有其他場景,例如信用卡場景對于信用卡申請人、購物場景針對分期用戶、租房場景針對租金分期用戶、投保場景針對投保人、投資理財針對投資人等。

4. 目的:風險控制和風險提示。一般機構主要有2個目的:

  • 目的1:針對降低損失,需要對好壞用戶進行識別
  • 目的2:針對獲取最大化利潤,需要對用戶資質分層。

潛在的特點是可以大批量實時實現風險控制和風險提示。

二、傳統風控與大數據風控的區別

大數據風控的叫法其實就是為了與傳統風控做區分。

傳統風控在2016年之前相對比較普遍,其特點是線下風控場景為主,需要用戶填寫一大堆個人信息及提供工作證明、流水證明、住址證明等,審核時間一般為1-3天,銀行體系會更長3-7天左右。

正常情況,一份用戶資料表需要填寫包括以下這些信息:姓名、性別、年齡、身份證號、家庭地址、學歷、家庭人數、婚姻狀態、單位名稱、單位電話、工作職務、單位性質、收入來源、收入水平、配偶詳情、經營企業詳情、其他資質等信息。

除了這些信息,還需要提供紙質的身份證復印件、工作收入證明(蓋章)、半年銀行流水、水電費或房屋租賃合同等。

另外,銀行等持牌機構還會查詢用戶在央行的征信報告,用于輔助風控。

這些數據潛在的意義可以這樣解讀:除了年齡代表準入門檻,一般的借貸產品要求借款人需要有22歲以上才可以申請,現金貸產品會把年齡門檻放到18-20歲及以上。部分產品要求學歷是高中及以上,或者要求非在校生。其他的分組后分別代表借款用戶的還款能力,負債情況及信用情況(這里不細分還款意愿)。

直接體現或者間接體現還款能力的:

  1. 家庭人數。家里人多,你還不起,催收后有人可以幫你還;
  2. 2.婚姻狀態,大部分家庭,結婚的比未婚的家庭收入或經濟穩定更好;
  3. 3.單位名稱、單位電話、工作職務、單位性質、收入來源、收入水平,直接體現收入水平及收入穩定性情況;
  4. 4.經營企業詳情、其他資質等信息。

體現負債情況和信用情況的:央行征信報告

拿到這些信息及材料后,由風控專員憑借經驗及按照標準化流程審核材料真實性。例如工作收入證明通過撥打公司電話核查有無本人及職位情況、其他資質材料看印章判斷真實性,流水會打銀行電話抽查真實性等。

傳統風控的模式及節奏是不符合互聯網金融高速發展的節奏的,互聯網金融時代都是按秒級幾百上千用戶群同時發起貸款申請,如果按照人工審核,從進件到批核整個流程可能要1個月時間都沒法完成。

傳統風控向大數據風控的升級,即是行業發展的需要,也受益于各類用戶數據被標準化對外,也就是API的形式對外輸出,金融機構可以直接接入各種必須的數據接口,用于獲取用戶的數據。

整個流程從用戶填寫將近所有的信息,變成只要提供姓名、身份證、銀行卡號、手機號這個4個要素就可以獲得全部或大部分風控必需的用戶信息。

大數據風控的快捷得益于各種標準化的數據接口,但由于代表用戶的各種數據是分別存在與不同的機構中,這些數據原則上需要用戶授權才能對外,而且數據輸出需要進行合規脫敏的處理。

所以,大數據風控需要獲取到與傳統風控要求用戶填寫的所有信息、或者直接或間接證明用戶還款能力、還款意愿、負債情況及信用情況必須的數據,每個類型需要接入幾個數據來源,缺失的類型還需要找到能夠替代的數據接口。

大數據風控需要的數據類型,在后面章節再詳解。

三、哪些行業及場景需要大數據風控

除了借貸場景,還有哪些場景需要用到大數據風控?

這里,獵人簡單舉幾個例子:

金融行業最常見就是投融資板塊,投資板塊,需要對非法集資、洗錢、資金盜刷等風險進行防控。

借貸板塊,需要進行貸前進行反欺詐及用戶風險識別、授信風險評估、貸中風險評估及貸后風險預警。

電商行業需要在用戶注冊環節進行防薅羊毛、對已注冊充值用戶需要防止其資金被盜刷、賬戶被盜及發生交易后對經常拒付的情況需要識別。

保險行業特別是壽險產品,需要對投保人身份進行核實,防止有不良行為投保用戶過審發生騙保。

除了這些常見的行業場景,其實各行各業只要涉及到個人信息及資金交易的,都會用到大數據風控,唯一的區別就是針對不同場景的需要的數據及策略是不一樣的。

四、大數據風控行業有哪些機構參與

傳統風控基本都是由金融機構內部的風險部門及門店經理組成,大數據風控更多是由第三方機構提供。

大數據風控行業主要有以下7大類型機構參與:

  1. 監管部門旗下或牽頭的機構:百行征信、互金協會及小貸協會等;
  2. 非銀放貸機構旗下金融科技公司:持牌小貸公司、P2P機構等,例如玖富及宜信;
  3. 電商旗下金融科技公司:京東金融、螞蟻金服等;
  4. 互聯網巨頭旗下金融科技公司:度小滿金融、騰訊云等;
  5. 銀行系金融科技公司:銀聯智策、建行金科等;
  6. 企業服務類:系統服務商、技術提供商、數據中介商等,例如同盾及百融;
  7. 支付機構旗下金融科技公司:天翼征信:新顏征信等。

這些機構擁有場景、資金、放貸業務三者全部或者其中一塊要素,這些要素決定了其在大數據風控的競爭壁壘。

場景代表有源源不斷的數據,及精準的客群畫像,可以無成本或低成本用于風控業務;

資金代表了可以隨意切進任一借貸場景,獲取數據及影響產品形態;

放貸業務表示在特定場景有一定的用戶借貸表現的數據及基礎的風控能力,部分機構的成熟風控能力還可以直接對外輸出變現,切入到體系外的場景獲取更多的數據。

因此,數據量級、數據成本、風控經驗、資金風險承受能力綜合決定了一家機構在大數據風控是否有足夠的競爭力。

五、大數據風控機構存在的意義

個人借貸金融板塊的大數據風控行業的前景,主要可以看2方面:

一個是不含房貸的國內消費金融市場規模及滲透情況。只要消費金融市場的存量客戶,有復貸需求,且增量客群還有轉化空間,代表著借貸業務是持續發生的,則這里對風控的需求是持續不斷的。

我國個人消費金融的市場規模從2013年的12億到2018年的將近38億,翻了3倍有多;而不含房貸的規模到2018年則到了8億,滲透率為22.36%。如果到2020年滲透率可以提升2.5%,則市場規模有個3.5萬億的提升。這個空間足夠眾多公司在此競爭。

大數據風控機構其中的一個收入來源就是數據接口的調用次數計費,這個調用次數息息相關的是借貸用戶數量。

而央行內收錄的大部分信貸記錄用戶都是屬于銀行等相對高質量用戶群體,這些群體都有可能下沉到非銀系的互聯網金融中發生貸款行為,同時不在央行體系的信貸用戶,都是互聯網消費金融機構的潛在客戶。

通過央行查詢量,可以側面知道在銀行體系信貸需求的用戶數量,這部分用戶80%以上是無法獲取銀行體系的貸款的,因此理論上是可以成為消費金融機構的潛在客群。

2015年的6.3億次查詢到2018的17.6億次查詢,說明需要信貸的用戶非常多,但這么大的查詢量,有信貸記錄人數才增加了1億,說明大部分用戶都無法獲得貸款或者非常需要貸款,會同時在多個機構申請貸款,才會每人產生近10次的查詢次數。

六、處于消費金融產業鏈什么位置

已知大數據風控機構在消費金融場景中是非常有前景的,我們了解下其在消費金融產業鏈中的角色及功能,消費金融產業鏈的角色包括:

  1. 監管機構:銀保監會、中國人民銀行等;
  2. 消費金融服務提供商:商業銀行、電商平臺、持牌公司、分期平臺、非持牌機構;
  3. 資金提供方:自有資金、信托、ABS、銀行借貸、同業拆及P2P;
  4. 第三方支付機構:負責提供支付通道,給予消金機構放款或者代扣還款;
  5. 催收或不良資產機構:負責貸后逾期不還及失聯客戶;
  6. 消費者:不同場景的消費需要的資金需求是不一樣的;
  7. 風控及征信機構:負責提供大數據風控服務,包括數據、技術服務、模型策略等。

除了消費者外,產業鏈中的各個角色都有附加風控及征信機構角色的可能,對外輸出大數據風控能力。

七、個貸風控場景及解決方案

獵人將消費金融大數據風控場景分為5個環節6個應用場景:5個環節包括反欺詐、身份核驗、貸前審核、貸中監控及貸后催收;6個應用場景分別對應不同的環節。

反欺詐環節:

對申請借貸的用戶群體進行反欺詐識別,識別能力主要依賴于風險名單,高危名單(在逃、黃賭毒、涉案)、法院失信被執行人等名單,另外還有虛擬手機號、風險IP、風險地區等名單,通過名單進行反欺詐識別。

再深入點,可以在用戶使用的設備端進行反欺詐識別,查看是否是風險設備;還可以通過群體關聯,找出是否團伙欺詐行為。例如申請集中在一個IP地址,一個戶籍地,通訊錄都有同一個人聯系方式等。

身份核驗環節:

進行借貸同行業身份核驗。在反欺詐識別過程中,無風險用戶來到身份核驗環節,這里可以通過身份證2要素接口,核驗用戶的姓名身份證號是否正真實;通過活體識別判斷是否用戶本人在操作;通過運營商核驗接口,核驗用戶的姓名身份證手機號是否一致,手機號是否本人實名使用;通過銀行卡核驗,核驗用戶的提供的銀行卡是否本人,防止貸款成功后,貸款資金到他人賬戶被冒用。

貸前審核環節:

授權信息獲取,針對身份核驗通過的用戶,進行有感知或無感知的必要信息獲取,為后續模型評分準備好數據。無感知獲取的包括多頭借貸數據、消費金融畫像數據、手機號狀態和時長數據等;有感知(需要用戶提供相關賬戶密碼)獲取的數據有:運營商報告、社保公積金、職業信息、學歷信息、央行征信等。

借貸用戶的分層及授信,針對以獲取的用戶相關數據,根據不同的算法模型輸出針對用戶申請環節的評分卡、借貸過程的行為評分卡、授信額度模型、資質分層等模型。不同機構對于不同環節的模型評分叫法不一樣,目的都是圍繞風險識別及用戶資質評估。

貸中監控:

之前環節獲取的數據大部分還可以用于貸后監控,監控各項正常指標是否往不良轉變,例如本來無多頭借貸情況的,申請成功貸款后發現該用戶在別的地方有多筆借貸情況,這時可以將該用戶列為重點關注對象,防止逾期。

貸后催收:

此時需要催收的主要針對失聯部分客戶,這部分客戶在貸款時填寫的號碼已經不可用,需要通過大數據風控公司通過某些手段獲得該客戶實名或非實名在用的其他號碼,提高催收人員的觸達幾率。

八、大數據風控常用的數據類型

大數據風控離不開數據,這些數據獵人將主要的7大類型,這7大類型的存在主要有2大原因:

一是這些數據維度基本可以直接或間接體現用戶的還款能力、負債情況、信用情況及其他潛在風險,大部分數據維度都已在金融信貸風控環節得到有效的驗證,除了個別場景對于少部分類型數據不太合適外。

二是這些數據都經過標準化的處理,且在其體系內與合作的借貸機構客群最低的交叉比例超過40%以上,也就是借貸機構的100個用戶中可以在這個數據接口中查到其中40人及以上的數據。

還有一些原因是這些數據來源的更新頻率足夠滿足風控公司的要求,特別是高風險名單這些要求是實時的,而身份證要素這些則無需更新實時問題也不大。

數據類型主要有:

  • 身份信息:身份證、銀行卡、手機卡、學歷、職業、社保、公積金;
  • 借貸信息:注冊信息、申請信息、共債信息、逾期信息;
  • 消費信息:POS消費、保險消費、淘寶消費、京東消費;
  • 興趣信息:APP偏好、瀏覽偏好、消費類型偏好;
  • 出行信息:常出沒區域、航旅出行、鐵路出行;
  • 公檢法畫像:失信被執行、涉訴、在逃、黃賭毒;
  • 其他風險畫像:航空鐵路黑名單、支付欺詐、惡意騙貸。

九、大數據風控的數據源頭

大數據風控需要的數據類型這么多,那來源是哪里,或者說這些數據掌握在哪些機構中?

  • 身份證數據源頭:公安一所、公安三所、身份證信息查詢中心;
  • 銀行卡數據源頭:各類銀行、各地銀聯;
  • 手機號數據源頭:移動、聯通、電信;
  • 學歷數據源頭:學信網;
  • 社保公積金數據源頭:社保局、公積金管理中心;
  • 借貸數據數據源頭:央行征信中心、有信貸業務的銀行、消費金融機構、小貸公司、P2P及有放貸業務的金融機構(保理機構);
  • 出行數據數據源頭:中航信、鐵路總局、出行APP、運營商、有定位的APP;
  • 消費數據:銀行、電商平臺、第三方支付、場景平臺;
  • 興趣愛好數據源頭:運營商、各類PC平臺網站、各類APP、搜索引擎、手機系統商。

其實以上源頭直接從事數據輸出業務的只是一小部分,原因是大部分源頭公司對數據合規輸出及場景管理無專門部分負責,而且數據業務盈利不是其主要的業務。

因此活躍在大數據風控行業,提供數據業務的是一些通過相關關系獲得代理權的數據代理商,及為這些源頭公司提供系統服務的系統商。

十、人工規則及機器模型

大數據風控的實現方式是傳統風控的專家經驗模型、及現今依賴算法模型兩種方式結合較多。原因是算法模型在大多數常規情況是可以準確識別風險情況,但少部分特殊情況需要人工參與干涉修正及調優的。

專家經驗模型的流程是將遇到的新問題(新申請用戶的資料)作為入參,風控專家根據歷史出現的情況(不同客群的好壞表現)歸納起來,從中找出相關規律(A客群對應好的,B客群對應壞的,C客群沒遇到過,但可能是好的等),從而判斷新問題可能發展的路徑情況(新客戶貸后是好的或者壞的)。

算法模型,主要依賴統計學公式,流程是將新數據(新申請用戶的資料)作為入參,算法模型(隨機森林、決策樹、邏輯回歸等)在大量的歷史客戶樣本喂養后,已經可以區分出不同客群的好壞表現,從中而判斷新用戶在模型結果中對應的是好還是壞客戶分類。這其中會引入第三方的數據源(KS 、IV、AUC等都是判斷第三方數據有效性的指標),看哪些數據能夠提升算法模型的識別準確率。

其實從流程看出,算法模型無非把人工經驗環節換成了算法模型替代,以此實現批量找出能夠判斷好壞客戶的規律,并將其標準化。但遇到一些不在歷史數據中的情況時,算法模型就可能無效,需要人工參與調優,為了解決新問題算法模型表現不太好的情況,現在有機構嘗試用新的算法或邏輯去模仿人工調優這個工作。

十一、大數據風控的產品形態

大數據風控行業中最常見的產品形態有4種:

  1. API接口:主要輸出裸字段、脫敏后字段或者評分值;
  2. SDK:爬蟲類產品、設備指紋等;例如學歷爬蟲接口,輸入用戶賬號密碼可以登錄學信網將用戶的學歷學籍信息爬取下來。
  3. H5報告:用戶風險報告、用戶評分報告等;
  4. 機器模型及決策引擎。

API接口及SDK一般是有風控模型團隊機構需求較大,需要詳細字段入參來喂養模型;部分無模型團隊的機構,但有技術部門支持開發的,一般喜歡直接采用API的評分或H5報告;而機器模型及決策引擎主要是有錢但不熟悉風控行業或者現有技術團隊不熟悉大數據風控的,會直接購買模型及決策引擎直接啟動信貸業務。

以上的產品形態主要還是針對B端客戶,有些大數據風控機構開拓C端業務的推出APP內置報告的產品形態。

最后

大數據風控是個很復雜的體系,其在個貸風控領域的應用已相對成熟,這個場景的競爭現處于白熱化階段,已知這個細分市場的風控產品的創新已經到了一個瓶頸,無論機構大小只能圍繞數據覆蓋率及風控識別能力兩個維度進行優化。

同時由于有消費金融需求的個體基本都得到了剛好甚至超出其還款能力的信貸服務,因此開拓新客群的獲客成本明顯高于前兩年,這是大多金融機構合規產品獲利能力無法覆蓋的,規模維穩甚至緊縮的情況導致提供個人風控的大數據風控機構的收入水平其實在下降。

另一個狀況是針對小微企業端的風控服務重新被大數據風控機構重視并逐漸加大研發力度,望在小微企業風控的白熱化到來前,先占據一定的市場規模,形成有力的壁壘活下去。

#專欄作家#

大數據獵人,微信公眾號:大數據獵人,人人都是產品經理專欄作家。多年金融科技行業相關戰略研究、行業分析、商業模式及產品體系研究經驗,擅長政府數據+企業數據+公開數據多源數據融合流通交易及應用

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. ??

    回復
  2. 干貨!

    回復
  3. 讀完理清了思路

    回復
  4. 拜讀

    回復