揭秘:芝麻信用是怎么做的

9 評論 8714 瀏覽 38 收藏 16 分鐘

編輯導語:?在支付產品中,你或許看到過這樣一個產品——芝麻信用,它是衡量我們的信用程度的一大指標。那么,為什么要做這樣一款產品以及它是如何評估我們的信用的。本文對芝麻信用進行了詳細的介紹,一起來看看芝麻信用是怎么做的吧。

上周五在電腦里翻到一個文檔,是芝麻信用的產品介紹。我不知道是從哪來的,也無法輕易搜到同一份文檔。但既然是產品介紹,就權當這是公開文件,作為一個外行,聊聊。

我顯然沒做過芝麻信用分,甚至我都沒有調研過,但我是做過同類產品的。這樣一款信用產品,與那些消金信貸公司的A卡B卡是有很多不同的。這個行業里多了很多懂數據懂算法的人,但沒幾個懂信用懂風控的人。因而,我覺得這份不同,還是值得小書一下。

主要是揭秘下芝麻信用分是怎么做的,說是揭秘,但因為我并不是幕后操盤手,更準確的說法是推測,也可能只是臆斷。

另外,花唄接入央行征信系統,我們這些消費者在使用這類產品時要不要另作考慮,也會說一說。

關于芝麻分,官網有一段介紹如下:

芝麻分是由獨立第三方信用評估機構-芝麻信用管理有限公司,在用戶授權的情況下,依據用戶在互聯網上的各類消費及行為數據,結合互聯網金融借貸信息,運用云計算及機器學習等技術,通過邏輯回歸、決策樹、隨機森林等模型算法,對各維度數據進行綜合處理和評估,在用戶信用歷史、行為偏好、履約能力、身份特質、人脈關系五個維度客觀呈現個人信用狀況的綜合分值。芝麻分的分值范圍為350至950,分值越高代表信用越好,相應違約率相對較低,較高的芝麻分可以幫助用戶獲得更高效、更優質的服務。

01

信用衡量的就是先享后付的能力,那就是要讓該享受服務的人能享受到服務。一個該一個能。該的人不能,不該的人能,是要解決的關鍵問題。

想清楚兩件事情,你就知道怎么做這樣一款產品了。

一是,哪些信息能衡量一個人的信用?

兩個維度,一是能力,二是意愿。能力取決于你的收支情況,以及保持收支平衡的穩定性的水平。所以,你的就業、你的收入、你的消費很重要,不僅在于當前是什么水平,還在于它是不是穩定的。如果你四海為家,如果你黃賭毒,都是穩定性上的負面。

意愿的衡量本質在于違約的成本,這一定程度上和收支相關,但并不相同,因為數字化時代法律約束變弱了,更靠的是道德約束。這時候,意愿的刻畫就很困難,但意愿體現在你的信用歷史中。

一個月入十萬的人找你借一萬塊錢,和一個每次借錢下個月都及時還錢的人找你借錢,你更愿意借給誰呢?

不管你去搜集哪些數據,它們都是刻畫這兩個指標的工具。

二是,做信用產品的根本目的是什么?

顯然,做產品的目的是希望它能被用的盡可能多,但用的盡可能多一定是效果盡可能好嗎?

答案是否定的。

企業做信用評分,討好的是用戶,但付費的是需要查詢評分的商戶。討好的是用戶是說,你要關注幾乎所有用戶的幾乎所有方面的需求,不能僅僅是大部分用戶的大部分需求,否則客訴可能讓你的產品活不下去。企業要考慮面向用戶可解釋,商戶不需要。

付費的是商戶意味著,企業需要的是商戶調用的越來越多,不是當前足夠多,是長期足夠多,而商戶需要的是效果好,效果好就更精準,長期反而不會更多。兩者的利益是不完全對等的。

這意味著,構建這樣的模型時要根據經驗挑選覆蓋各個維度的變量,并使其保持絕對的可解釋性,而不光是選擇區分度高的變量。前者是芝麻信用這種產品的視角,后者是A/B/C/F卡的視角。

你說企業內部也要用啊,不需要效果盡可能好才更好嗎?

企業又不是只用這一個工具。

02

我們來重點聊一聊芝麻信用的數據變量。

這個數據變量服務總共包含 65 個變量,按照芝麻信用評分維度(一級分類)和 DAS 變量類別(二級分類)分類如下:

如前所述,相信你對這五大維度一點也不吃驚。身份特質、履約能力體現了“收”,行為特質體現了“支”,信用歷史體現了意愿,人脈關系也體現了違約的成本項。

圖中變量數量,基本就體現了這些類別的重要程度。信用歷史往往是最重要的,其次是履約能力。

同樣的一萬塊錢,借給一個每次借錢下個月都及時還錢的人,比借給一個月入十萬的人靠譜的多。

這 65 個變量進一步拆分為 8 個核心變量和 57 個基礎變量。

這些變量的分段邏輯,按文檔的說法是,綜合考慮 DAS 變量在全量芝麻用戶上的數值分布對好壞用戶的區分度將其進行分段,最多分十五段。分段序號?01-15 代表變量數值由小到大的排列順序。

我們詳細看一看這8個核心變量,57個基礎變量匯總放在后面。

在身份特質項中,更核心的變量竟然是穩定性指標,而不是行職業信息。一方面是因為,行職業信息一般很難準確獲取;另一方面,所在公司、所做職業是需要分類到大類上的,這類信息在住房按揭這種長期貸款中很重要,對短期借貸沒有直接作用關系。不管是消費信貸,還是信用生活,還款能力的刻畫完全不需要上升到行職業,反而穩定性指標更為重要。

第三方支付的核心在于深度和廣度,支付業務要看廣度,對應的當然要看用戶使用第三方支付的廣度。行為特質中,支付活躍場景數就很好的體現了這個廣度。而支付金額和資產等維度在下面的履約能力中體現。

履約能力選取了一個資產一個支出一個消費層次。資產和支出不必說,消費層次意義在于,只消費生活必須品,和對精神物品有強烈需求的,代表了不同的層級。

信用歷史中更為關注信用還款,而非逾期,我推測原因有二,一是還款類的信息豐富度會高很多,二是正面信息在面向用戶可見的產品上更為友好,它既能一定程度上起到和負面信息類似的效果,在相對關系上負面降分和正面增分區別不大,還能激勵用戶更高頻高額地借還。

剩余 47 個基礎變量,我整理如下。

上述變量除了選取的指標值得學習外,時間窗口也很值得注意。另外,顯而易見,這些變量很多都是相關的,它們都會被用在芝麻分里面嗎?它們怎么綜合得到一個芝麻信用分呢?

當然是通過權重進行組合。

權重如何得到?

“綜合考慮 DAS 變量在全量芝麻用戶上的數值分布對好壞用戶的區分度將其進行分段”,既然變量的分組是參考了好壞用戶的區分度的,專業名詞就是WOE,那變量的組合當然是對好壞用戶進行建模得到。

但是,這些變量,高度相關的變量,是會被評分卡篩選掉的。有效的模型不可能用到了其中所有的變量,即使有,我推測,很多變量也是人為地被賦予了無關痛癢的權重。

請注意,這是 DAS 變量數據服務文檔,并未稱作芝麻信用分產品介紹。我推測芝麻信用分的關鍵在那8個核心變量,我說的是關鍵,并不是說完全不用那57基礎變量。

另外,芝麻分作為面向用戶的產品,還兼有營銷激勵的功能,最終的芝麻分除模型計算外,應該還有其他環節的增減分設置。

03

花唄將全面接入央行征信系統,用戶使用花唄需不需要擔心哪些問題呢?

征信關乎個人信用,花唄是當代人超前消費的好助手,當它倆一拍即合,消費者應怎么考慮?

我不說責任和義務,也覺得有必要說幾句。

現在大概央行收錄的自然人11億,其中有信貸數據的應該不到一半,我們消金業務發起申請查得率稍高一些,60%左右。也就是說,絕大多數人的征信數據信息是比較少的,就是那些簡單的身份信息,沒有金融信用數據。

傳統的信用評估模型是根據一個人的借貸歷史和還款表現,通過邏輯回歸的方式來判斷這個人的信用情況。現在越來越興起大數據模型,它的數據源就十分廣泛,包括電商、社交、搜索瀏覽等行為都產生了大量的數據。

所以,顯然,花唄接入央行征信,對各大平臺來說好處很大,因為用戶的信用更好被評估了,那對用戶來說呢,是不是就不好呢?

不是的,對用戶來說其實影響不大,但要注意養成按時還款的習慣。

花唄對征信的補充,主要就影響了兩點,借貸次數多了,逾期信息多了。

風控策略呢,也就是信用評估,借貸次數多了影響不大,次數再多也只算一個機構,一般不會認為這是壞行為,主要是逾期,逾期這種負面行為容易被風控拒絕,偶然性的逾期其實也不至于太壞。銀行信審有個說法,稱為“連3累6”,即連續出現三個月逾期,兩年內共計六次逾期,這種屬于嚴重的違約行為。但最好別逾期。

所以,可以照常用,養成按時還款的習慣基本就妥了。

我先是消費者,再是消金行業從業人員,我的立場始終是消費者。我說這話的一個依據是,對于《個人信息保護法》的出臺,我第一感覺是這是好的,而不是這很糟糕。

04

還是要聲明,上述說的很多事情,我并沒有取證,甚至懶得找螞蟻的朋友確認,我們有時候關注如何做一件事的原理和本質就夠了,至于一個實例的所有detail,其實并沒有太多價值去研究。就像,一個結構工程師蓋房子,也實在沒必要一定要知道建筑立面要做哪些裝飾,這可能只是某些人的要求而已。

另外,我在http://www.aharts.cn/data-analysis/5118872.html這篇文章中,提到過這幾款信用評分,包括芝麻信用分、微信支付分和小白守約分。下面的說法來自那篇文章。

無論是天貓淘寶京東的消費還是花唄白條支付的海量交易數據,都可以用來評價個人的還款能力和意愿。結合著馬斯洛需求理論,也就是生理、安全、情感、尊重、自我實現依次升級,越能體現高級需求的數據越可以給更高的權重。也就是說重要的不是單次購買行為,而是消費習慣。

而那些店鋪商家,平臺有他們所有的交易、資金、物流信息,都可以用來作為金融服務的依據。

你掌握了一個人的人際關系,就掌握了這個人。社交關系鏈,不僅可以用來評估信用,還能直接作為質押物,因為每個人都在乎它,而且很在乎。

我在知乎搜這個話題時,發現有不少問題在問如何提高芝麻分。也說一句。

如果你想要提升分數,就考慮下那些核心變量吧。另外值得注意的是,這些變量都是時間窗口的,并且是分段的,你的行為會被攤平到一段時間內,并且需要分段后跳檔才能對結果產生影響。這給提升分數帶來了難度,也是防止指標造假的科學手段。

 

本文由@雷帥 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 想知道的是,核心的8個變量是怎么定義出來的?謝謝。

    來自廣東 回復
  2. 第一次看到關于芝麻信用的文章,不過多贅述,對于我個人而言,芝麻信用確實還是蠻不錯的應用

    來自江蘇 回復
  3. 就是因為這樣做 所以現在炸了 接口已經下架了 不允許外部調用了

    回復
  4. 風控玩來玩去,考驗的還是人性,p2p就是活深深的例子。

    來自浙江 回復
  5. 個人認為,對于花唄、白條這類信貸產品,能不用就不用。提前消費不是一個好習慣,而且對征信是否有影響也不太好說。

    來自四川 回復
    1. 其實,對絕大多數人來說它們都只是支付工具,提前消費是不好,但支付是帶來了很大的便利的。

      回復
  6. 雖然一直都在領取芝麻的積分,但從來都沒用過,也不知道能用來干啥的。

    來自廣東 回復
  7. 做產品的目的是希望它能被用的盡可能多,但用得多一定是效果好嗎,其實也不見得,還是按時還款,保持自己的良好信用吧。

    來自湖北 回復
    1. 這種產品是不純粹的,要滿足的要求很多,而不僅僅光追求信用風險評估效果好

      來自北京 回復