阿里巴巴直播防控中的實人認證技術
網(wǎng)絡直播正享受其最好的時光,隨之而來的是主播實人認證。為此,本文將為你講解其中涉及的兩項智能技術。
直播作為近來新興的互動形態(tài),已經(jīng)成為近幾年最風生水起的行業(yè)之一。在2016年仿佛進入了“千團大戰(zhàn)”的繁華。歡聚時代10億砸向虎牙和ME直播,斥資1億簽下主播MISS;騰訊4億投資斗魚,后者估值10億美元;新成立的映客獲得昆侖萬維、復賽等機構(gòu)的8000萬人民幣投資;易直播獲得6000萬人民幣A輪融資;360推出花椒、秒拍推出一直播….網(wǎng)絡直播正享受其最好的時光,直播”風口”成投資方必爭之地。
然而網(wǎng)絡直播也因為走的太快,而失去了出發(fā)的初心,主播行為、直播內(nèi)容變得不可控,低俗、大尺度、無下限成為“勁爆”欄目。針對網(wǎng)絡直播的種種怪相,12月1日,由國家網(wǎng)信辦發(fā)布的,媒體認為“史上最嚴”的《互聯(lián)網(wǎng)直播服務管理規(guī)定》正式開始施行?!兑?guī)定》要求直播平臺按照“后臺實名、前臺自愿”的原則,對用戶進行移動電話號碼等真實身份信息認證。而對于網(wǎng)絡主播們,《規(guī)定》更要求通過審核身份證件等更為嚴格的方式進行認證登記。
而這些網(wǎng)絡直播在進行實人認證時,需要對包括姓名、證件號、生物屬性、手機和位置等要素進行識別,如何在提高用戶體驗的同時準確的判斷賬號背后真實的人,也是目前困擾著各大公司的一大難題。目前阿里聚安全實人認證中使用的技術能夠大大提供自動化認證率和審核效率。
主播實人認證
主播的實人認證,基于自主研發(fā)的證件OCR、人臉識別等實現(xiàn)了88%以上的自動化認證率,并且采用云(3D、翻拍檢測等)+端(交互動作等)相結(jié)合的活體檢測技術來防御虛假認證的風險攻擊,以確認主播的真實身份,降低違法風險。
對主播進行了嚴格的實人認證:做到人證合一,即根據(jù)認證過的賬號身份信息,能準確找到對應的真實的自然人。
實人認證系統(tǒng)示意圖
其中涉及的智能技術很多,介紹其中兩項。
1、身份證OCR(光學字符識別)
身份證OCR是把身份證圖像中的文字識別為計算機能認識的文本,自動與公安網(wǎng)等權(quán)威數(shù)據(jù)庫比對,驗證姓名、號碼等信息的真?zhèn)巍?/p>
基于自由拍攝證件圖像,流程見下圖。為保證識別率和速度,同時融合了傳統(tǒng)算法和深度學習算法。
身份證信息檢測流程圖
OCR算法對“姓名”字段的識別準確率達98%以上,對“身份證號碼”和“有效期”達99.5%。 系統(tǒng)具有很強魯棒性,以下case都可以輕松識別。
OCR可以識別的身份證舉例
2、生物特征識別
只介紹人臉識別和人臉活體檢測。
人臉識別在學術界已超肉眼的識別水平,但能在實際中的大規(guī)模應用還比較少,原因是實際場景復雜和數(shù)據(jù)缺乏。挑戰(zhàn)來自光照、姿態(tài)、翻拍、化妝、衰老以及低照片質(zhì)量。
我們對用戶真人人像、身份證照、權(quán)威數(shù)據(jù)庫的頭像進行兩兩比對,以驗證身份的真實性。算法能在0.1%的認假率下,使得合法用戶自動通過率達93%以上。
人臉識別包括圖像獲取、人臉檢測、活體檢測、關鍵點定位、特征提取、識別引擎等模塊。
人臉識別系統(tǒng)
2.1 人臉檢測
采用Boosting+RCNN框架。
人臉檢測結(jié)果圖
2.2 活體檢測
活體檢測是為了確保待認證的用戶是“活人”,而不是事先拍好或翻拍的人臉照片、視頻,防止虛假認證,降低主播的違法風險。
活體檢測實例圖
活體檢測模塊包括:
(1)人臉檢測
檢測是否出現(xiàn)人臉,且不能是多張臉, 防止不同的人切換或人與照片的切換。
(2)3D檢測
驗證是否為立體人像,防止平面的照片或視頻攻擊。
3D檢測示意圖
(3)活體算法檢測
驗證用戶的操作是否正常,指定用戶做隨機動作(凝視、搖頭、點頭、眨眼、上下移動手機等)。
(4)連續(xù)性檢測
防止中途切換人。
(5)翻拍檢測
利用深度學習技術, 區(qū)分獲取的人像是否為對屏幕、照片的翻拍。
2.3 人臉關鍵點定位
定位出眉毛、眼睛、鼻子、嘴巴等位置。主流方法有:基于參數(shù)模型的方法;基于回歸的方法;基于深度學習的方法。
我們采用基于特征的回歸方式+深度學習的方法,來訓練關鍵點定位模型。
人臉關鍵點檢測示意圖(圖片素材來源網(wǎng)絡)
2.4 特征提取
Maxout結(jié)構(gòu)示意圖
我們同時采用了傳統(tǒng)人臉特征(WLD, HOG,LBP,Gabor等)和基于深度學習(基于VGG、GoogleNet、Maxout三者的融合網(wǎng)絡)的特征進行人臉識別。
2.5 識別引擎
傳統(tǒng)人臉特征,我們采用SVM進行pairwise距離度量;DL人臉特征,對已經(jīng)學習的分類模型進行微調(diào)。
實人認證自動化是基于人臉、OCR的識別結(jié)果,基于大數(shù)據(jù),綜合利用用戶的行為特征,進行多維度信息融合,最后得到綜合決策模型,實現(xiàn)自動決策的過程。而在目前互聯(lián)網(wǎng)發(fā)展的多種業(yè)務中,實人認證技術的應用場景紛繁復雜,對技術指標的要求也不盡相同,阿里聚安全提供的實人認證技術以生物識別、無線安全技術為支撐,保障實人認證有效性。
目前,阿里巴巴人臉識別技術已在實際場景中大規(guī)模應用,實戰(zhàn)中相關性能指標在FPR(False Positive Rate)0.1%情況下,TPR(True Positive Rate)達96%,識別準確率遠遠超過人體肉眼識別。阿里聚安全實人認證技術更以實時大數(shù)據(jù)風險管理為核心,可實時判斷每一個用戶的認證動機,對不同風險等級的用戶采取不同的認證方式,保障正常用戶能夠方便、快捷的提交資料,而風險用戶無法簡單的通過盜用他人信息通過認證,確保認證的真實性。
作者:威視@阿里安全部
來源:https://zhuanlan.zhihu.com/p/24826613
本文由 @威視 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
馬云確實是中國一大驕傲
阿里巴巴能發(fā)展這么大不無道理,做的決定和技術都非常具有前瞻性,也早早瞄準了第三方登錄平臺弄了個阿里巴巴開放平臺搞接入,準備和天翼開放平臺爭上一番
介紹很詳細,這個技術以后會應用到很多領域,根據(jù)工信部要求已經(jīng)強制三大運營商和42家虛擬運營商,在用戶入網(wǎng)時候必須實體檢驗了。其實早在大學時候就接觸了OCR技術,那時候人臉識別只有在美國的電影上看到過,我也算是這個技術的踐行者吧!