人臉識別行業分析

11 評論 17934 瀏覽 156 收藏 43 分鐘

人臉識別與其它生物識別技術相比,優勢在于非接觸性、非侵擾性、硬件基礎完善、可拓展性。本文主要跟大家分析一下人臉識別這個行業,enjoy~

一、人臉識別概況

生物識別,是指依靠人體的身體特征來進行身份驗證的識別技術,目前較為主流的識別技術有:人臉識別、指紋識別、虹膜識別、語音識別等四類。

人臉識別,是基于人的臉部特征信息進行身份識別的一種生物識別技術。通常采用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉。人臉識別系統主要包括四個組成部分,分別為人臉圖像采集及檢測、人臉識別預處理、人臉圖像特征提取以及匹配與識別。

人臉識別與其它生物識別技術相比,優勢在于非接觸性、非侵擾性、硬件基礎完善、可拓展性。指紋識別唯一性比較強,采集成本較低,但是指紋可由指紋貼、指紋膜等復制,且接觸性、侵擾性較強,人臉識別與其相比接觸性和侵擾性較低;虹膜識別最精準,但是采集成本非常高,識別效率較低,接觸性、侵擾性也較強,人臉識別與其相比,采集成本低、識別效率高;語音識別采集成本低,但語音具有可變性,人臉識別與其相比,識別效率高。

人臉識別技術原理簡單來講主要是三大步驟:

  • 一是建立一個包含大批量人臉圖像的數據庫;
  • 二是通過各種方式來獲得當前要進行識別的目標人臉圖像;
  • 三是將目標人臉圖像與數據庫中既有的人臉圖像進行比對和篩選。

根據人臉識別技術原理具體實施起來的技術流程則主要包含以下四個部分,即人臉圖像的采集與預處理、人臉檢測、人臉特征提取、人臉識別和活體鑒別。

1. 采集

需要考慮圖像大小,圖像分辨率,光照環境,模糊程度,遮擋程度,采集角度 。

人臉圖像的采集有兩種途徑,分別是:人臉圖像的批量導入和人臉圖像的實時采集。前者是指將采集好的人臉圖像批量導入至人臉識別系統,系統會自動完成個人臉圖像的采集工作;后者是指調用攝像機或攝像頭在設備的可拍攝范圍內自動實時抓取人臉圖像并完成采集工作。

人臉圖像的預處理是指對系統采集到的人臉圖像進行光線、旋轉、切割、過濾、降噪、放大縮小等處理來使得該人臉圖像符合人臉圖像特征提取的標準要求。

目前主要有三種圖像預處理手段,即灰度調整、圖像濾波、圖像尺寸歸一化。 其中灰度調整是對地點、設備、光照等造成的圖像質量差異進行處理,圖像濾波是對噪聲造成的圖像質量差異進行降噪處理,圖像尺寸歸一化是針對圖像像素大小不同進行尺寸處理。

2. 人臉檢測

在圖像中準確標定出人臉的位置和大小,并把其中有用的信息挑出來(如直方圖特征、顏色特征、模板特征、結構特征及Haar特征等),然后利用信息來達到人臉檢測的目的。

人臉檢測是指判斷是否存在人臉及定位出人臉的位置、大小與姿態。目前的人臉檢測方法可分為三類,分別是基于膚色模型的檢測、基于邊緣特征的檢測、基于統計理論方法的檢測。

  • 基于膚色模型的檢測是利用人臉的膚色特征建立膚色模型從而進行檢測,其優點是人臉的檢測速度較高,對遮擋和光照有一定的魯棒性,不足是和其他方法不太兼容, 且不易處理復雜背景和多人物同框;
  • 基于邊緣特征的檢測則是利用圖像的邊緣特征進行人臉檢測,優點是計算量相對較小,可實現實時檢測,與其它特征方法可融合, 缺點是在復雜背景下誤檢率比較高;
  • 基于統計理論方法的檢測則是通過對人臉特征值的循環迭代來檢測人臉,其計算速度快,應用廣泛,但是誤檢率較高。

3. 特征提取

人臉識別系統可使用的特征通常分為視覺特征、像素統計特征、人臉圖像變換系數特征、人臉圖像代數特征等。人臉特征提取就是針對人臉的某些特征進行的,也稱人臉表征,它是對人臉進行特征建模的過程。主要方法有基于知識的表征方法(主要包括基于幾何特征法和模板匹配法)和基于代數特征或統計學習的表征方法。

  1. 基于知識的提取方法是根據人臉五官結構特征等先驗知識來進行提取,其特點是識別方法比較簡單、容易理解, 檢測速度較快, 但是沒有形成統一的特征提取標準,對動態人臉圖像的魯棒性較差;
  2. 基于代數特征的提取方法是基于統計學習的特征提取方法, 特點是特征易抽取,識別精度較高,應用廣泛, 但是需要與相應的數據庫進行統計訓練。

4. 匹配與識別

這一精確篩選的過程分為兩類:一是一對一的篩選,即對人臉身份進行確認的過程;二是一對多的篩選,即根據人臉相似程度進行匹配比對的過程。此外人臉識別包含活體鑒別環節,即區別識別的特征信號是否來自于真正的生物體。

關鍵技術指標:檢測率、誤檢率、漏檢率、速度。識別中的精確率、召回率、錯誤接受率/認假率/誤識率、錯誤拒絕率/拒真率/拒識率

二、行業概況

2.1 行業邏輯

2.1.1 人臉識別技術日趨成熟、準確率高

2018 年 11 月 16 日,美國國家標準與技術研究院(NIST)公布了全球權威人臉識別比賽(FRVT)最新報告,從前十名企業在千分之一的誤報率下的識別準確率來看,其平均能達到 99.69%,在千萬分之一誤報下的識別準確率超過99%。

意味著機器幾乎可以做到在1000萬人的規模下準確識別每一個人,而人腦記憶并辨別 100 個人的身份都很有可能犯錯,相比于去年同期,全球人臉識別性能提升了80%,且中國企業占據榜單前五位,居世界領先水平,為人臉識別的技術落地提供技術面支撐。

從研究學者分布來看,中國占據世界第三的位置,人才儲備居優勢地位。2018 年, AMiner 基于發表于國際期刊會議的學術論文,對人臉識別領域全 TOP1000 的學者進行計算分析。

從全球范圍來看,美國人臉識別研究學者聚集最多的國家,在人臉識別領域的研究占有絕對的優勢;英國緊隨其后,位列第二;中國位列全球第三,占有一席之地??梢钥闯?,中國的追趕勢頭不容忽視。

從公開專利數量來看, 2007-2017年,我國人臉識別專利公開數量總體呈上升趨勢,為人臉識別商業化應用打下基礎。

從每年新增數量來看, 2007 年新增專利尚不足百例,至 2015 年迎來了爆發,全年新增專利已達到 1398 例,至 2017 年,我國人臉識別專利公開數量 2698 項,達到近年來最大值;截至 2018年7月,專利公開數量為2163 項, 技術實力的顯著增強也為國內商業化產品的迅速普及打下了堅實的基礎。

2.1.2 政策推動

長期以來,國家高度重視人臉識別產業落地的發展,出臺多項政策助推產業發展。

2015 年以來,國家密集出臺了《關于銀行業金融機構遠程開立人民幣賬戶的指導意見(征求意見稿)》,給人臉識別普及打開;其后,《安全防范視頻監控人臉識別系統技術要求》、《信息安全技術網絡人臉識別認證系統安全技術要求》等法律法規,為人臉識別在金融、安防、醫療等領域的普及打下了堅實的基礎,掃清了政策障礙。

同時, 2017 年人工智能首次寫入國家政府報告,作為人工智能的重要細分領域,國家對人臉識別相關的政策支持力度在不斷的加大。 2017 年 12 月發布的《促進新一代人工智能產業發展三年行動計劃(2018-2020 年)》 則具體規劃“到 2020 年,復雜動態場景下人臉識別有效檢出率超過 97%,正確識別率超過 90%”。

另外,工地場景上,住房和城鄉建設部、人力資源社會保障部印發《建筑工人實名制管理辦法(試行)》明確提出:建筑企業應配備實現建筑工人實名制管理所必須的硬件設施設備,施工現場原則上實施封閉式管理,設立進出場門禁系統,采用人臉、指紋、虹膜等生物識別技術進行電子打卡;不具備封閉式管理條件的工程項目,應采用移動定位、電子圍欄等技術實施考勤管理。相關電子考勤和圖像、影像等電子檔案保存期限不少于2年。

2.1.3 資金推動

根據 CB Insights 在 2018 年發布的《Top AI Trends To Watch In 2018》顯示,:中國在人工智能初創公司的資金支持方面已超過美國,位列世界第一,其投入的資金主要專注于人臉識別核心技術。

2017 年,全球AI 創業公司獲得資金支持 152 億美元,其中 48%流向中國, 38%流向美國,中國在人工智能初創公司的資金支持方面已超過美國, 而中國在人工智能上投入的資金主要專注于人臉識別核心技術,僅在 2017 年就突破十億美元大關,達到 16.40 億美元。

此外, 政府對人臉識別初創公司的資金支持已達億級以上。僅在 2017 年,就有廣州市政府和有國務院國資委背景的中國國有資本風險投資基金對云從科技、曠視科技投入億級以上資金。

人臉識別是AI領域融資最多的方向。

2.2 行業規模與結構

2017 年,全球視覺人工智能市場規模約為 70 億美元,同比增長 12.36%,而中國視覺人工智能市場規模達到 41 億元,同比增長 259.6%,遠高于全球市場的增速。隨著視覺人工智能技術的逐漸成熟及應用領域的逐步擴大,預計到 2020 年中國視覺人工智能市場規模將進一步擴大,達到 755.5 億元。

視覺人工智能是中國人工智能市場上最大的組成部分。根據中國信通院數據,2017 年中國人工智能市場中視覺人工智能的占比超過 37%。在視覺人工智能領域,安防影像分析是最大的應用場景,2017 年占比約 67.9%。其他主要應用包括廣告、互聯網、云服務、手機等。

2.3 行業場景與應用

最近三年,視覺人工智能技術不僅帶來了生產效率的提升,而且還催生了眾多新產業、新商業模式與新應用場景,推動了多行業產業鏈的重構。隨著視覺人工智能技術的不斷發展,市場規模的不斷擴大及行業應用解決方案的建立和完善,視覺人工智能行業的應用場景將進一步滲透,助力各應用行業解決痛點,實現行業轉型和升級,需求前景廣闊。

最近幾年機器視覺行業實現快速發展的背景是: 2015 年基于深度學習的計算機視覺算法在ImageNet 數據庫上的識別準確率首次超過人類, 同年 Google 在開源自己的深度學習算法。

這些帶動中美兩國的科學家把計算機視覺算法運用到安防、金融、互聯網、物流、零售、醫療、制造業等不同垂直行業。但在實際的運用當中,由于數據可得性,算法成熟度,服務的容錯率等因素的影響,落地的速度開始出現分化。 移動互聯網/安防領跑,零售/物流跟進,醫療/無人駕駛發展較慢。

2.3.1 智能安防

安防領域是人臉識別技術最成熟的落地領域,也是 AI 視覺公司普遍首先切入的細分領域。安防領域的特性在于:

  1. 公共安全的剛需應用,可極大提高效率;
  2. 市場預算分級、高度碎片化,且政府訂單為主,可有效貢獻收入;
  3. 深度賽道,不斷面臨新問題與新需求,問題難度跨度大(簡單需求如車牌識別、困難需求如動態識別與犯罪預防等)。

作為公共安全的剛需應用,安防領域計算機視覺未來將繼續向多模態融合、萬路以上廣聯網發展。

2.3.2 移動互聯網

計算機視覺在移動互聯網上的應用目前主要包括:

  1. 互聯網直播行業的主播美顏;
  2. 鑒黃、廣告推薦等視頻分析;
  3. 智能手機里的 AI 美顏和人臉解鎖。

一方面,移動互聯網行業數據較為豐富,數據可得性較高;另一方面,由于應用多為“錦上添花”型的娛樂、廣告應用,容錯率較高,技術難度相應下降。因此計算機視覺在移動互聯網得以快速順利落地。

移動互聯網應用的普及離不開深度攝像頭的應用,如面部識別可以使手機解鎖及支付更加安全快捷,手勢動作識別可以增強游戲體驗,人形及物體建??梢允咕W絡購物更加直觀方便快捷。通過與人工智能、虛擬現實等技術有機結合,深度攝像可廣泛應用在智能手機、智能汽車、智能安防、智能家居、金融等領域,給消費者帶來全新的用戶體驗,提高生產和生活效率。

因此,深度攝像擁有廣闊的市場空間,預計到 2021 年,全球范圍內深度攝像頭市場規模有望達到78.9 億美元,較 2017 年的 22 億美元增長 262.73%。

2.3.3 金融

金融領域中的人臉識別,主要用途分為身份核驗和場景規?;瘧谩I矸莺蓑?,也稱作 1:1 刷臉,廣泛地被應用于互聯網金融、銀行的遠程開戶、遠程身份認證、遠程支付,通過刷臉的方式進行校驗。場景規?;瘧靡卜Q作 1:N 刷臉,多用在刷臉支付、取款等。

由于金融人群龐大,身份核驗、場景應用等環節給人臉識別技術發展提供助力, 預計可提供億級以上的市場體量。以銀行為例,人臉識別在銀行領域的業務點主要有私有云部署、智慧網點改造、自助機具改造、網點 VIP。四大業務點市場體量都在百億元級別,智慧網點改造更是達千億元級別,人臉識別可發揮的空間巨大。

筆者認為,金融行業容錯率低,出于謹慎性原則,方案推行周期較長,且當前很難大規模在全國推廣,因此爆發力有所欠缺。

2.3.4 其他場景

醫療領域: 醫療數據碎片化嚴重,各種疾病需要的影像資料不同, 數據標注需要有專業醫師參與,成本高,進展慢。導致發展低于預期。

無人駕駛: 無人駕駛涉及采集攝像頭、 雷達等多種數據,并根據多重數據進行車輛、物體、 道路、 行人等不同識別后進行決策。我們認為離實現通用無人駕駛還早,在限定場景下實現商用的機會較大。

2.4 商業模式

視覺人工智能公司提供服務的方式主要包括 3 種,分別為 API、SDK 與解決方案。

  1. API 提供云端比對識別服務,具有彈性、靈活、高效等特點,互聯網金融公司多采用此種形式。
  2. SDK基于對數據的保護或實時性要求,向客戶提供核心算法模塊,在用戶端或客戶的服務器端完成視覺計算,手機及互聯網娛樂公司多采用此種形式。
  3. 解決方案向客戶提供較為全面的軟硬件集成解決方案,可能涉及軟件系統、嵌入式解決方案、前端硬件設備、專有服務器部署等,公安、銀行多采用此種形式。

與服務方式相對應,視覺人工智能公司的主要收費方式也包括 3 種,分別為按調用量或包時收費、結合授權設備量及授權周期定價與結合具體項目收費,后續每年可有升級維保收入。API 服務大多采用第一種收費方式,SDK 服務多采用第二種收費方式,解決方案多采用第三種收費方式。

目前市面曠視等主流廠商SDK價格約50-100元/臺設備。

2.5 產業鏈與競爭格局

視覺人工智能產業鏈可以劃分為三個部分,分別為:

  1. 基礎支撐層:包含芯片(寒武紀、地平線)、傳感器(海康、大華、速騰創新、鐳神智能)、系統架構和初級算法(谷歌 、百度、微軟、臉書)等部分。
  2. 技術提供層:包含圖像識別平臺和嵌入式視覺軟件兩類。前者直接提供應用服務,后者需要和硬件進行系統集成后在終端產品中使用。國內主要廠商包括曠視科技、商湯科技、圖漾信息、格靈深瞳、虹軟科技等。
  3. 場景應用層:直接解決具體應用場景的需求,產品的形式可能是應用系統,也可能是軟硬件一體的終端產品或服務,主要的應用場景包括智能駕駛(佑駕創新、馭勢科技、格林深瞳)、智能安防(商湯科技、格靈深瞳、曠視科技、依圖科技)、智能醫療(商湯科技、依圖科技)、智能家居(速感科技、依圖科技)、智慧金融(格靈深瞳、曠視科技、商湯科技、依圖科技、云從科技)、智能硬件(云天勵飛、依圖科技)、智慧商業(商湯科技、曠視科技、碼隆科技、圖普科技)、娛樂(曠視科技、圖普科技)等。

2.5.1 上游芯片領域亟待突破,與算法、數據集共同解決算力問題

人臉識別產業鏈上游,即基礎層,影響發展的三大要素是芯片、算法和數據集。

(1)芯片領域

在芯片領域,由于目前沒有專門用于人臉識別的處理芯片,只能采用通用芯片代為處理。因深度學習算法對算力資源需求高,一般采取核心處理器(如 CPU、 ARM 芯片)進行視頻采集,把視頻中的人臉圖像摳取下來,而核心數據處理芯片無法執行人臉識別結構化運算,只能將圖像處理的工作交給更合適的專門處理芯片進行結構化處理。

目前常見芯片的有 GPU 顯示核心、 FPGA 現場可編程門陣列、 ASIC 專用集成電路, 其中 GPU 是 AI芯片的主導者。

  • GPU 優勢在于解決浮點運算、數據并行計算問題,在大量數據元素并行程序方面有極高的計算密度,但是仍有兩個致命缺點,一是功耗大,需依托 X86 架構服務器運行,不適用于更為廣泛的人臉識別產品方案開發,尤其是人臉識別民用化趨勢日漸增強的當下,GPU 不適于在小型化項目的采用。二是成本高昂,采用 GPU 方案,折算單路人臉識別成本在萬元以上,相較其他千元級,甚至是百元級的方案,毫無成本優勢可言,不利于商業平民化推廣。目前在 GPU 芯片領域的龍頭企業為 NVIDIA(英偉達),其所占份額為 60%。其次是 Xeon Phi,所占份額為 21%。
  • FPGA 具有可編程性,讓軟件與終端應用公司能夠提供與其競爭對手不同的解決方案,并且能夠靈活地針對自己所用的算法修改電路,但是其設計資源受到很大的限制,一旦型號選定,其邏輯資源上限就確定,其布線資源也受限制,不像 GPU 這樣走 ASIC flow,因此,在峰值性能方面,FPGA 要遠遜于 GPU。
  • ASIC 芯片的優勢是運算能力強、規模量產成本低,但開發周期長、單次流片成本高, 主要適用于量大、對運算能力要求較高、開發周期較長的領域,比如大部分消費電子芯片和實驗。

為滿足當下人臉識別等人工智能的發展需求,行業也推出了各種針對深度學習芯片,如 TPU、 NPU、DPU、 BPU 等,但因其受場景限制以及性能不及 GPU 等,市場上仍以 GPU 等通用芯片占主導。

從上游芯片市場看,高端市場均被國外企業壟斷。根據上文我們的分析,人臉識別芯片目前均采用人工智能通用芯片,而根據市場研究顧問公司 Compass Intelligence 在 2018 年 5 月發布的關于 AI 芯片最新調研報告,排名靠前的均是國外企業——英偉達、英特爾、 IBM 與谷歌。

排行榜中共有七家中國人工智能芯片公司入圍榜單 Top24,華為排名 12,成中國大陸地區最強芯片廠商,其余六家中國公司分別為:聯發科、Imagination、瑞芯微、芯原、寒武紀、地平線。

而目前在中國人臉識別設備商中,商湯科技與瑞芯微達成戰略合作,將其 SDK 軟件包直接整合進瑞芯微芯片平臺中;而云從科技則在布局“基于自研 SoC 芯片的高準確度人臉識別產業化應用”項目,人臉識別芯片仍有待突破。

(2)算法和數據集

在算法開發市場上,根據最新的 FRVT 比賽排名,我國人臉識別依圖科技、商湯科技包攬前四名,識別率均在 99%以上,處世界前列。 此外,目前的算法主要是基于上文提到的基于代數特征的提取方法,算法需要不斷的進行訓練?;诖?, 測試中的算法準確率與實際應用中的準確率仍有一定的差距,因此擴充數據集以鍛煉算法的不斷升級成為重點。

目前主流的數據集有 FERET 人臉數據庫、 CMU Multi-PIE 人臉數據庫、 YALE 人臉數據庫、 MIT 人臉數據庫、 ORL 人臉數據庫、 BioID 人臉數據庫、 UMIST 圖像集、年齡識別數據集 IMDB-WIKI。

綜上所述,上游芯片領域由于缺乏人臉識別專用的芯片,在成本和性能上制約人臉識別技術的應用,而在算法方面,目前中國已領跑世界,但在實際應用的測試準確性來說仍是不夠的,而此時數據集的擴充成為鍛煉算法的重要途徑。

2.5.2 中游3D 人臉識別技術是方向,但仍需進行技術性突破

中游人臉識別技術市場的解決方案主要包括 2D 識別、 3D 識別,目前市場主流為 2D 識別,但 3D 識別有不可比擬的優勢,將成為未來人臉識別技術發展的趨勢。與 2D 人臉識別技術比較, 3D 人臉識別的優點在于:

  1. 精準度高——3D 人臉識別系統采集人體面部三維特征,識別精度高,錯誤拒絕率和錯誤接受率極低,大量面部特征和數據點足以區分雙胞胎;
  2. 環境穩定性強——3D 人臉識別系統對光線、背景燈環境的實用性更強,系統更穩定;
  3. 防偽穩定性高——3D 人臉識別系統更穩定,系統不易被輕易愚弄、欺騙,而冒充身份者能夠通過合法用戶的視頻圖像或相片騙過 2D 人臉識別系統;
  4. 實用性強——3D 人臉識別系統不需要用戶配合,當人臉有姿態、角度、表情、面部遮擋物等時,其識別性能穩定,實用性強,而 2D 人臉識別系統識別性能下降劇烈。

目前 3D 技術應用程度并不高,主要是蘋果等手機廠商在應用,而從 Counterpoint Research 的研究數據來看,未來 3D 技術在手機端將比 2D 技術占據更高的市場份額;而根據 Yole Developpement 的研究數據顯示, 3D 技術不僅在 C 端市場份額進一步擴大,在 B 端商用領域也將進一步擴大市場份額。

目前, 主流的 3D 成像技術有三種:

  1. 結構光(Structured Light):結構光投射特定的光信息到物體表面后,由攝像頭采集。根據物體造成的光信號的變化來計算物體的位置和深度等信息,進而復原整個三維空間。代表性產品應用為蘋果 X。
  2. TOF(Time Of Flight): 通過專有傳感器,捕捉近紅外光從發射到接收的飛行時間,判斷物體距離。
  3. 雙目測距(Stereo System):利用雙攝像頭拍攝物體,再通過三角形原理計算物體距離。

具體而言,結構光技術具有低光下表現良好,分辨率較高,成本、功耗適中等優點,但易受陽光影響,識別距離短,識別速度稍慢;而 TOF 技術具有響應時間快,抗光照表現尚可,深度信息精確度高、識別距離遠,但分辨率低、成本高、功耗高、模塊太大;而雙目測距技術分辨率高,模塊小,成本低,但是昏暗環境下不適用,算法開發難度大,識別速度慢。

盡管 3D 人臉識別相較 2D 人臉識別有質的飛越,但是可以從現在主流的 3D 結構光技術抗光照能力弱、識別速度不高、硬件成本高以及工作距離短的缺點以及尚未普及的 TOF 技術分辨率低、精度低的缺點看出, 3D 人臉識別仍有技術難關需要攻破。

在中游技術解決方案市場上,由于在 B 端普遍的人臉識別技術方案是 2D 人臉識別技術,市場格局并未明朗,各方根據場景應用均采取差異化戰略。如商湯科技、曠視科技、阿里巴巴、騰訊等采用圖像人臉識別技術,海康威視等采取視頻對象提取分析技術, 而云從科技則在于 2018 年 2 月 7 日首發國內 3D 結構光人臉識別技術。

2.5.3 下游場景應用是決定未來人臉識別行業競爭格局的關鍵

在人臉識別下游場景應用領域,廠商眾多。 在占據人臉識別市場大部分份額的 B 端領域,既有做傳統安防起家的??低曉诓季?,也有人臉識別四大獨角獸——依圖科技、曠視科技、商湯科技、云從科技在布局,并且云從科技是人臉識別銀行領域第一供應商,海康威視為安防領域龍頭。

而在體量很小的 C 端領域,有騰訊、 阿里巴巴、 商湯科技等企業布局, 市場較為分散, 其中互聯網巨頭騰訊、阿里巴巴等依據自己在 C 端產品的優勢有手機 QQ 人臉識別登錄、支付寶“smile to pay”, 商湯科技則為小咖秀、美圖等 C端 APP 提供人臉識別技術。

人臉識別對場景要求非常強,產品能否達到實際使用要求,核心并不只在于算法本身,還在于對場景的深耕。對于下游應用場景本身而言,人臉識別終歸落地成產品形態,并且在商用和民用領域價值巨大,從上文對人臉識別應用的主要兩個領域——安防、金融來看,這兩個領域由于與細分市場的商家聯系緊密。

(1)行業參與者

視覺人工智能領域內的企業可劃分為工業巨頭(直接面向該領域客戶,在該行業已有較長時間積累,市場份額大)、互聯網巨頭(從事計算機視覺相關研究的互聯網巨頭,技術水平領先)與創業公司(從事計算機視覺技術服務的創業公司)。這三類公司的技術獲取方式、優劣勢與發展預期都不盡相同。

計算機視覺技術在中國的快速落地,吸引了以商湯、 曠視、 依圖為代表的以算法為核心競爭力的 AI 初創公司, 擁有強大數據采集及軟件開發能力的互聯網公司, ??怠⒋笕A、 宇視等深耕安防行業的公司,以及華為、 平安等科技行業巨頭。 經過一年多的發展, 各個公司根據自己資源稟賦的不同,企業戰略出現了分化。

初創企業在算法與模型訓練上占優;互聯網企業則擁有天然的數據優勢;安防企業則憑借極強的工程能力加速安防項目落地。后起之秀如深蘭則選擇細分市場廣泛落地。

互聯網巨頭利用自己強大的數據優勢和豐富的內部應用場景,提升自身業務場景的增值服務, 如阿里巴巴的淘寶拍立淘、騰訊優圖在手機 QQ 與微信的應用、今日頭條的短視頻甄別等。

AI 頭部初創企業近年來融資動作頻繁,受到資本市場的青睞,在資金方面暫無瓶頸, 然而面臨互聯網巨頭的挑戰,商湯等初創企業或應依托已有的獨立設計算法的能力,構建平臺型解決方案,在研發能力與方案落地速度上取勝。

AI 頭部創業公司布局思路各異:在商湯、曠視、依圖等頭部企業看,各家戰略思路差異明顯。

商湯致力于構造平臺,專注底層基礎應用,力圖在完善平臺后于其他領域快速落地。曠視則在致力于在安防、金融、零售、汽車、教育等廣泛領域提供軟硬件一體化的解決方案。依圖則表現出對安防、醫療兩大領域的專注深耕,依托產品化、工程化能力深入落地。

(2)國外企業

美、日等國視覺人工智能的發展已經過了快速增長階段,進入穩定增長期。國外巨頭一方面利用資源優勢積極進行底層架構建設,并將技術廣泛應用到已有的產品升級中,另一方面利用資金優勢大量收購優秀的技術和數據創業公司,迅速彌補技術短板、數據短板和人才短板。

例如:蘋果、英特爾、Facebook、谷歌和亞馬遜等互聯網巨頭沿著與主業有協同效應的方向并購布局,對象多為圖像識別、建模。而我國計算機視覺起步較晚,技術主要沿襲國外,產業發展仍處于初創期,投融資空間大。

國內視覺人工智能企業主要集中于場景應用層,以多點垂直化企業服務切入,在工控領域的應用主要集中在系統集成應用,而消費領域的應用多與人臉識別、圖像處理相關。

對于頭部企業來說,底層算法的同質化問題嚴重,因此目前最重要的任務是迅速將技術商業化,落地相關應用場景。商業壁壘的構建除前沿算法之外,也有賴于產品、服務、市場等綜合建設。

 

作者:作者:阿旺,著名投資人兼連續創業者,會從自身投資以及創業經歷,不定期輸出各類行業研究,如您想了解更多關于創業以及投資方面的內容,歡迎關注本人公眾號:awangblog

本文由 @阿旺 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 厲害了

    來自廣東 回復
  2. 果斷關注了!期待作者的下一次更新~

    來自廣東 回復
    1. 謝謝支持哈

      來自浙江 回復
  3. 太棒了,謝謝作者的分享?。。?/p>

    回復
    1. 謝謝支持,歡迎多多關注

      回復
  4. 精彩

    回復
    1. 感謝支持,希望能夠繼續關注,謝謝

      來自浙江 回復
  5. 特別棒

    回復
    1. 感謝支持,我會繼續創作優秀的作品的

      來自浙江 回復
  6. 很精彩

    來自浙江 回復
    1. 感謝支持,希望能夠持續關注,謝謝

      來自浙江 回復