AI技術(shù)中最有商業(yè)想象空間的能力——人臉識(shí)別
編輯導(dǎo)讀:人臉識(shí)別技術(shù)已經(jīng)被運(yùn)用到生活的各個(gè)角落,滿足人們不同的需求。本文作者基于自身經(jīng)驗(yàn),對(duì)人臉識(shí)別技術(shù)的相關(guān)后臺(tái)流程和技術(shù)產(chǎn)品應(yīng)用展開(kāi)了分析討論,與大家分享,希望通過(guò)此文能夠加深你對(duì)人臉識(shí)別技術(shù)的認(rèn)識(shí)。
人臉識(shí)別技術(shù)一項(xiàng)很有意思的技術(shù),未來(lái)理想的狀態(tài)是在你不經(jīng)意的時(shí)候就已經(jīng)查明你的身份。對(duì)于系統(tǒng),你已不再是隱形之人。
在我之前的文章中也詳細(xì)通俗的介紹了語(yǔ)義理解及語(yǔ)音識(shí)別技術(shù)的具體細(xì)節(jié),但是作為AI界三大基礎(chǔ)技術(shù)是必須要講完的,所以今天我們談?wù)勅四樧R(shí)別究竟是如何認(rèn)出你的?
按照慣例,我們先大致了解人臉識(shí)別技術(shù)的后臺(tái)流程:
人臉識(shí)別原理過(guò)程
第一步:人臉圖像采集及檢測(cè),顧名思義,其實(shí)就是給你照個(gè)相,然后傳遞給下一個(gè)模塊。
第二步:這個(gè)時(shí)候照完像我們是不是該處理,比如ps啊,美圖啊,瘦臉啊,美白啊。識(shí)別技術(shù)也同樣需要對(duì)你的臉做一下校正,讓它用自己那一套自己熟悉的處理方式給你打打光(光線補(bǔ)償)避免暗色過(guò)多,順便做一下灰度變換,濾波、銳化等等一套組合拳打下來(lái)。
第三步:美完圖了,這個(gè)時(shí)候重頭戲就到了,應(yīng)該開(kāi)始提取你的特征點(diǎn)了,你張的是不是歪瓜劣棗,怎么歪的?歪的特點(diǎn)在哪里。當(dāng)然我只是比喻,真正提取特征的方式很多種,比如視覺(jué)特征、像素統(tǒng)計(jì)特征、人臉圖像變換系數(shù)特征等等,方式不同提取的料也不同。當(dāng)然也就容易影響識(shí)別的效果,還是需要具體看在哪個(gè)場(chǎng)景應(yīng)用哪種識(shí)別方法。
第四步:提取特征數(shù)據(jù)后傳輸?shù)綌?shù)據(jù)庫(kù)中開(kāi)始檢索,看看誰(shuí)更像這人?但是以什么為標(biāo)準(zhǔn)說(shuō)像這個(gè)人呢?我們?cè)O(shè)定一個(gè)閥值,超過(guò)這個(gè)數(shù)值我們就認(rèn)為他們很像,搞不好是兄弟姐妹。但是會(huì)出現(xiàn)一個(gè)問(wèn)題,一旦出現(xiàn)好幾個(gè)閥值以上的人,那到底誰(shuí)是呢?這個(gè)時(shí)候我們可能就要重新多采集一些你的照片,多優(yōu)化一下模型以便更好的認(rèn)識(shí)你了。
這就是大致的一個(gè)原理流程,具體場(chǎng)景還需要增加具體步驟。
01 人臉識(shí)別技術(shù)的分類
我們經(jīng)常說(shuō)的人臉識(shí)別只是人臉技術(shù)的一個(gè)子技術(shù),人臉識(shí)別技術(shù)是分很多類別的,出門(mén)別丟人哦。
人臉技術(shù)分類-摘自百度
我們以百度的人臉技術(shù)舉例,先看看人臉檢測(cè)及跟蹤
人臉檢測(cè)跟蹤
百度一般都會(huì)給識(shí)別到的人臉規(guī)劃一個(gè)方框,用于識(shí)別人臉?biāo)?。初步定位,以便后面做更加詳?xì)的分解。
業(yè)內(nèi)熟悉的朋友可能都了解,在人臉上都會(huì)布置關(guān)鍵點(diǎn)位,點(diǎn)位越多,越詳細(xì),識(shí)別的效果越優(yōu)秀,用關(guān)鍵點(diǎn)位的方式能夠詳細(xì)的分析我們的臉型特征,能夠?yàn)樘卣魈崛∑鸬胶芎玫闹Α?/p>
這項(xiàng)技術(shù)應(yīng)該是很多妹子的真愛(ài),左上角是原圖,右上角是算法經(jīng)過(guò)關(guān)鍵點(diǎn)位分析出來(lái)的像素人臉,算法中會(huì)分析出人臉中鼻子在哪里?眼睛在哪里?
大家可能會(huì)問(wèn),能干嘛呢?看下面兩張圖,是美白之后的效果。可以應(yīng)用于視頻美白處理,天然黑妹子的福音。
02 人臉屬性定義
人臉屬性值表分析
在給該算法模型一張圖片,可以分析出我們想要的任何維度屬性值以及結(jié)果概率,這項(xiàng)技術(shù)在未來(lái)應(yīng)用上是非常廣泛的,相當(dāng)于計(jì)算機(jī)視覺(jué)類的大腦,通俗來(lái)講就是讓機(jī)器能讀懂它看到的一切。大家創(chuàng)業(yè),找工作的都可以往這里來(lái)靠哈。
03 人臉識(shí)別技術(shù)產(chǎn)品應(yīng)用
活體檢測(cè)
金融行業(yè)驗(yàn)證
貼紙相機(jī)
當(dāng)前很流行的貼紙相機(jī)產(chǎn)品,依據(jù)人臉檢索跟蹤的技術(shù),不斷的調(diào)整貼紙位置,達(dá)成圖中的效果。
圖像文字識(shí)別
這項(xiàng)技術(shù)也是系統(tǒng)錄入員工的最愛(ài),基本一拍照便能依照系統(tǒng)欄目維度規(guī)定自動(dòng)錄入文本。
從以上的介紹后大家是否能夠理解人臉識(shí)別技術(shù)的具體流程?或者該技術(shù)在未來(lái)和現(xiàn)在都能應(yīng)用在哪些場(chǎng)景?
你認(rèn)為什么技術(shù)最有可能影響未來(lái)的世界,影響你的生活?
從作者從業(yè)者角度來(lái)思考的話,語(yǔ)音、語(yǔ)義、圖像識(shí)別三大基礎(chǔ)AI技術(shù)都缺一不可,但商業(yè)角度來(lái)看,當(dāng)前最有可能衍生出大量新場(chǎng)景的技術(shù)是圖像識(shí)別,而圖像識(shí)別最大的應(yīng)用空間是人臉識(shí)別
在人臉識(shí)別技術(shù)應(yīng)用中,通過(guò)標(biāo)注出來(lái)的有包括人像,物體的信息的圖像數(shù)據(jù),和核心算法、深度學(xué)習(xí)技術(shù)行成自己的產(chǎn)品,比如人臉識(shí)別的閘機(jī)、人臉識(shí)別機(jī)器人等,然后再通過(guò)產(chǎn)品本身來(lái)服務(wù)用戶,在用戶使用的過(guò)程當(dāng)中自主去學(xué)習(xí)從而產(chǎn)生用戶行為數(shù)據(jù),接而再反哺并促使產(chǎn)品和技術(shù)不斷優(yōu)化、自我學(xué)習(xí)。
04 基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)
人臉識(shí)別是一個(gè)較為寬泛的概念,涵蓋了構(gòu)建人臉識(shí)別系統(tǒng)的一系列技術(shù),包括人臉檢測(cè)、防偽檢測(cè)、人臉對(duì)齊、特征提取、特征對(duì)比等,其按照對(duì)比的量級(jí)可分為1:1、1:N、N:N。目前先進(jìn)的人臉識(shí)別算法均采用了深度學(xué)習(xí)技術(shù),在公開(kāi)的百萬(wàn)基準(zhǔn)數(shù)據(jù)集MegaFace中已能達(dá)到98%的精度,人臉識(shí)別技術(shù)基本趨于成熟。
1:1人臉識(shí)別模式主要用于身份驗(yàn)證
1:1即Face Verification,1:1人臉識(shí)別技術(shù)是一種靜態(tài)對(duì)比,比較兩個(gè)人的相似度。主要是利用圖像處理技術(shù)從圖像中提取人臉特征值,計(jì)算機(jī)對(duì)當(dāng)前人臉與人像數(shù)據(jù)庫(kù)進(jìn)行快速人臉比對(duì),并得出是否匹配的過(guò)程,可以簡(jiǎn)單理解為證明你就是你。
1:1人臉識(shí)別的應(yīng)用場(chǎng)景主要為人臉手機(jī)解鎖、人證合一,通常應(yīng)用落地場(chǎng)景為手機(jī)廠商尋找有算法識(shí)別技術(shù)的軟件供應(yīng)商為其內(nèi)置SDK,輔助代碼移植,使其手機(jī)擁有人臉識(shí)別解鎖的能力,典型代表為OPPO、華為等手機(jī)廠商。
1:N人臉識(shí)別模式主要是用于行業(yè)場(chǎng)景落地
1:N人臉識(shí)別技術(shù)是在海量的人像數(shù)據(jù)庫(kù)中找出當(dāng)前用戶的人臉數(shù)據(jù)并進(jìn)行匹配。N的數(shù)目在千萬(wàn)級(jí)。其特點(diǎn)是動(dòng)態(tài)和非配合,這是對(duì)于1:N而言也是非常重要的兩個(gè)點(diǎn),所謂的動(dòng)態(tài)也就是識(shí)別的是一個(gè)動(dòng)態(tài)的視頻流;非配合是指識(shí)別對(duì)象不用感知到攝像頭的位置并配合完成識(shí)別工作,而地點(diǎn),陰暗,光線,玻璃都會(huì)影響識(shí)別的準(zhǔn)確性,所以1:N相對(duì)更具挑戰(zhàn)性。
1:N人臉識(shí)別的應(yīng)用場(chǎng)景包括學(xué)校電子班牌、物業(yè)小區(qū)、新零售的客戶識(shí)別等。
學(xué)校電子班牌, 將走班制課程表與多模式多方式班級(jí)考勤關(guān)聯(lián),實(shí)現(xiàn)校務(wù)與教務(wù)的信息化管理,成為學(xué)校和班級(jí)、教師和學(xué)生、家長(zhǎng)和學(xué)生之間交流與互動(dòng)的橋梁。
從物業(yè)小區(qū)到企業(yè)樓宇,結(jié)合企業(yè)的需要可以用于人臉閘機(jī)、考勤、OA管理、訪客的管理和注冊(cè),隨之而來(lái)的就是更加智能的管理人群和流向。
在新零售行業(yè),幫助線下零售商家更了解他們的客戶,將線下人群信息向線上轉(zhuǎn)化。通過(guò)前端的圖像獲取硬件和機(jī)器視覺(jué)技術(shù)分析客群,提供精準(zhǔn)的客流分析如顧客年齡、性別,甚至停留時(shí)長(zhǎng)、行為分析等多維數(shù)據(jù)。
N:N人臉識(shí)別模式主要用于政府機(jī)關(guān)
N:N是1:N的延伸,即同時(shí)對(duì)多張人臉進(jìn)行人臉檢索,需要占用更多的計(jì)算資源。是通過(guò)計(jì)算機(jī)對(duì)場(chǎng)景內(nèi)所有人進(jìn)行面部識(shí)別并與人像數(shù)據(jù)庫(kù)進(jìn)行比對(duì)的過(guò)程,是動(dòng)態(tài)人臉比對(duì)。
N:N人臉識(shí)別的應(yīng)用場(chǎng)景主要為公共安防、天網(wǎng)系統(tǒng)等。比如公共場(chǎng)所動(dòng)態(tài)監(jiān)控、緝拿逃犯、人員布控等就是典型的運(yùn)用N:N人臉識(shí)別模式。
本文由 @南國(guó)書(shū)生 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!