應用層下的人臉識別(二):人臉庫

7 評論 20360 瀏覽 76 收藏 11 分鐘

本文作者根據多年人臉識別項目經驗,總結了人臉識別技術在安防、商業領域應用及產品設計細節,匯總成應用層下的人臉識別系列文章。

本文為系列文章的第二篇,介紹人臉庫的相關內容。人臉庫是人臉識別的基礎,建立人臉庫往往是人臉項目的首要任務,全文圍繞著什么是人臉庫及如何建立人臉庫展開討論。

1. 什么是人臉庫

簡單來講,人臉庫就是人臉數據的儲存管理中心,能夠為人臉識別提供比對模板,為抓拍人臉數據提供管理空間,為人臉算法檢測提供測試樣本。人臉識別項目是建立在人臉庫的基礎之上,所以人臉識別的首要任務便是是建立人臉庫。

人臉庫按照用途可分為人臉比對庫、人臉抓拍庫、人臉數據集,不同類型人臉庫的組成、結構、作用也有所不同,下面將會依次介紹,本文重點討論人臉比對庫。

1.1?人臉比對庫

人臉比對庫主要用于人臉1:N識別,如下圖,人臉1:N是將人臉抓拍照片的人臉特征與人臉庫中所有人臉特征進行逐一比對。

人臉比對庫主要由人臉庫管理、人臉數據、人臉庫屬性描述三部分組成,如下圖:

人臉比對庫按照應用場景又可分為四類,分別是黑名單庫、白名單庫、紅名單庫灰名單庫

(1)黑名單庫:黑名單指需要重點管控、關注的人員,一般由在逃犯、慣犯、水客、異常行為或是想要重點關注的人員構成。比中黑名單中會產生報警提示,常用于公安追逃;

(2)白名單庫:白名單一般指可信人員,常用于商業領域中的通行管理,白名單中的人員容許進入通過。例如在樓宇內設置人臉識別門禁,只容許公司內部人員進入,于是可將公司員工設置成白名單,白名單一般不會觸發報警;

(3)紅名單庫:紅名屬于白名單的拓展應用,用于白名單中需要重點關注展現的人群,如VIP客戶、領導人等,可在識別后進一步分析該人群的行為特點和活動范圍;

(4)灰名單:介于白名單和黑名單之間,是一類具有異常行為的可疑人員,還需要通過更多數據分析他們是否是黃牛、小偷、罪犯同伙等。

1.2?人臉抓拍庫

人臉抓拍庫是管理人臉抓拍數據的地方,在視頻流或圖片流中凡是能被算法檢測到的人臉都會經過圖像處理形成一張張人臉的抓拍照片及對應的場景照,再將抓拍照片進行數據結構化并與其場景照一同保留至人臉抓拍庫中。

抓拍庫的人臉照片會具有性別、年齡、戴眼鏡、胡須、表情、是否戴帽子、是否有遮擋等圖片描述,方便抓拍照片的檢索及深層次人臉數據應用。

人臉數據分為結構化數據非結構化數據,人臉結構化數據指將原始采集數據按照規則處理,形成具有統一格式,并用數據庫二維邏輯表來表現的數據。

如下圖:抓拍庫儲存的是結構化數據,人臉結構化數據指原始人臉數據經過程序分析和過濾,形成具有統一格式和描述的數據儲存在數據庫中。

1.3?人臉數據集

人臉數據集就是用于檢測人臉算法效果和訓練算法的數據庫,網上有很多公開的人臉數據集可為模型訓練提供數據來源。

常見的人臉數據集可見下表:

人臉識別

人臉檢測

人臉表情

人臉年齡、性別

2. 如何建立人臉庫

人臉庫中人臉比對庫的建立最為為復雜,這里只討論人臉比對庫的建立過程。

2.1 梳理入庫流程

人臉入庫流程見下圖,人臉數據包含人臉特征向量人臉信息兩部分,它們儲存在數據庫不同的表中,注意在刪除人臉庫照片時一定要刪除它對應的特征向量。如果照片質量未達到要求,且沒有更好的照片,可以有強制入庫的選項。

2.2 制定入庫規則

人臉數據的質量關系到人臉比對的效果,盡可能將人臉清晰、正臉、本人近期的人臉照片入庫。在人臉入庫時,產品經理需要制定入庫規則來過濾質量不佳、格式不規范的人臉數據。

入庫規則應該包含:

  • 圖片的顏色:可支持彩色及灰度的圖片,最低要求256灰度圖片;
  • 圖片的格式:各類主流圖片格式,例如 bmp/jpg/png等,圖片命名格式統一,如常用的命名“姓名_證件號”;
  • 圖片像素:雙眼中心之間的距離大于30像素;
  • 圖片尺寸:尺寸大于70X80以上;
  • 人臉角度:人臉左右偏轉30度以內,上下偏轉20度以內;
  • 入庫圖片大小建議幾十KB~幾百KB之間為宜,但也不能太大,超過1M,會影響入庫和識別的速度。

2.3?設計人臉庫功能、及界面

人臉庫應包含人臉信息的增、刪、改、查等基本功能,人臉庫界面可參見下圖的樣式:

人臉信息可以從客戶端批量導入,客戶端需要提供人臉批量導入模板,批量導入適合小規模格式統一的數據。

當人臉項目中需要入庫數萬以上的人臉信息,并且人臉數據格式并不統一,整理起來很麻煩,這時就需要設計批量入庫工具。

新建的人臉庫需要設定人臉規模,一般分為<1W、1W-100W、100W-1000W、>1000W四個范圍,大庫容進行人臉比對需要更高配置服務器,服務器配置與圖像處理能力的關系將會在后續文章中詳細討論。

2.4 采集人臉庫數據

如果想通過人臉識別技術識別某人,就需要先獲取到該人的人臉數據,并錄入人臉庫中作為比對模板,那么如何采集人臉庫數據呢?采集方式依據使用場景而定。

公安類項目,人臉數據提供方是公安,公安內部有大量的人臉數據,可通過對接公安信息資源庫來獲取人臉數據,如下圖為八大公安信息資源庫。

公安的信息資源庫是嚴禁外泄的,對產品的網絡安全及數據保密性要求頗為嚴格,在產品設計時需要考慮到相關問題。

刷臉通行或新零售類項目,一般是用戶配合式采集人臉信息,需要設計人臉信息采集入口,用戶可在微信公眾號、手機app或PC端進行注冊時上傳人臉信息。

大型商業類或平安城市項目中,需要設計非配合式采集人臉信息。一般會通過在主要出入口、通道、走廊等地部署的人臉抓拍機,抓拍路人人臉,自動建立該人檔案庫,這里需要用到一人一檔,作者會在后期文章詳細討論。

以上就是系列文章的第二篇-人臉庫的相關內容,后續將會推出人臉識別系列文章,歡迎大家與我交流圖像識別相關問題。

相關閱讀

應用層下的人臉識別(一):圖像獲取

 

本文由@陽春柏樰 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 人臉庫的界面看不清?。?/p>

    回復
  2. 人臉庫除了業務黑灰白名單,還有識別效率上的考慮,單庫都盡量小于1萬.那么怎么劃分人臉庫呢?

    來自北京 回復
  3. 人臉數據集也不需要在產品層面進行后臺設計了吧

    回復
  4. 如果是保險行業的人臉核身,則是直接和身份證的高清證件照進行比對,這種的就不需要進行人臉庫的錄入和采集了吧。就是文中提到的人臉庫的設計。

    回復
  5. 您好,我是人民郵電出版社編輯,想與您合作相關內容,可否詳談18811565025

    來自北京 回復
    1. 您好,可以加微信“陽春柏樰”聊聊

      回復
  6. 寫的很詳細,學習了

    來自江蘇 回復