人工智能行業(yè)研究報告

0 評論 29243 瀏覽 140 收藏 32 分鐘

“人工智能就像一列火車,它臨近時你聽到了轟隆隆的聲音,你在不斷期待著它的到來。它終于到了,一閃而過,隨后便遠(yuǎn)遠(yuǎn)地把你拋在身后?!?/p>

“人工智能已經(jīng)來了,而且就在我們的身邊,幾乎無處不在?!?/p>

一、什么是人工智能

人工智能(Artificial Intelligence),英文縮寫為AI,是達(dá)特茅斯大學(xué)助理教授John McCarthy在1956年提出的。但是,對于人工智能的定義一直沒有統(tǒng)一的觀點(diǎn),不同的學(xué)者和研究人員根據(jù)不同的語境和關(guān)注的角度提出了多種對于人工智能的定義。

筆者根據(jù)多年的投資經(jīng)驗(yàn)以及對人工智能項(xiàng)目的實(shí)地盡調(diào),認(rèn)為人工智能是指使用機(jī)器代替人類實(shí)現(xiàn)認(rèn)知、識別、分析、決策等功能,其本質(zhì)是對人的意識與思維的信息過程的模擬。 而我們在衡量人工智能能力的時候,必然涉及到三方面的能力,即計(jì)算能力、感知能力、認(rèn)知能力。

其中,計(jì)算能力是指機(jī)器快速計(jì)算和記憶存儲能力。在計(jì)算能力方面,計(jì)算機(jī)已遠(yuǎn)遠(yuǎn)超過人類的計(jì)算和存儲能力;感知能力,是解決機(jī)器聽到看到問題,一般指視覺、聽覺、觸覺等感知能力,在技術(shù)層面,一般認(rèn)為語音識別、圖像識別等技術(shù)屬于感知智能的領(lǐng)域;認(rèn)知能力,解決機(jī)器聽懂看懂的問題,通俗講是“能理解、會思考”。

二、國內(nèi)AI市場概況

(1)技術(shù)層面,計(jì)算機(jī)視覺是當(dāng)前熱點(diǎn),芯片和算法等底層會是未來方向

通過上圖我們可以發(fā)現(xiàn),近幾年,國內(nèi)AI行業(yè)高速發(fā)展,環(huán)比增速在45%左右,預(yù)計(jì)到2020年,整個國內(nèi)的AI市場容量將達(dá)到710億元,說完了整體市場容量,筆者再帶大家看下當(dāng)前人工智能市場的技術(shù)規(guī)模結(jié)構(gòu):

其中各個技術(shù)板塊的主要技術(shù)應(yīng)用分別如下:

  • 語音:語音識別、語音合成、語音交互、語音評測、人機(jī)對話、聲紋識別;
  • 計(jì)算機(jī)視覺:生物識別(人臉識別、虹膜識別、指紋識別、靜脈識別)、情感計(jì)算、情緒識別、表情識別、行為識別、手勢識別、人體識別、視頻內(nèi)容識別、物體和場景識別、計(jì)算機(jī)視覺、機(jī)器視覺、移動視覺、OCR、手寫識別、文字識別、圖像處理、圖像識別、模式識別、眼球追蹤、人機(jī)交互、SLAM、移動視覺、空間識別、三維掃描、三維重建 ;
  • 自然語言處理:自然語言交互、自然語言理解、語義理解、機(jī)器翻譯、文本挖掘(語義分析、語義計(jì)算、分類、聚類)、信息提取、人機(jī)交互;
  • ML/DL 算法及平臺:機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、算法平臺 ;
  • 基礎(chǔ)硬件:芯片、高清圖傳設(shè)備、激光雷達(dá)、傳感器、服務(wù)器。

從餅狀圖,可以看到,目前國內(nèi)人工智能技術(shù),主要在感知智能,感知智能正在突飛猛進(jìn),技術(shù)成熟度相對較高,而對于認(rèn)知智能(自然語言理解等),仍然需要進(jìn)一步的發(fā)展。

(2)應(yīng)用層面, “AI+”和智能機(jī)器人占據(jù)主導(dǎo)

通過上圖,我們可以發(fā)現(xiàn)現(xiàn)在在應(yīng)用層面上,AI+的應(yīng)用占比最大,達(dá)到40%,其次是智能機(jī)器人,達(dá)到27%,各個產(chǎn)業(yè)具體應(yīng)用如下:

  1. 智能機(jī)器人(含解決方案):工業(yè)機(jī)器人(側(cè)重生產(chǎn)過程,如搬運(yùn)、焊接、裝配、碼垛、噴涂等)、行業(yè)服務(wù)機(jī)器人(應(yīng)用于銀行、餐廳、酒店、商場、展廳、醫(yī)院、物流)、個人/家用機(jī)器人(虛擬助理、情感陪伴機(jī)器人、兒童機(jī)器人、教育機(jī)器人、家庭作業(yè)機(jī)器人(掃地、擦窗等)、家用安防機(jī)器人、車載機(jī)器人);
  2. 智能駕駛(含解決方案):智能駕駛、無人駕駛、自動駕駛、輔助駕駛、高級駕駛輔助系統(tǒng)(ADAS)、激光雷達(dá)、超聲波雷達(dá)、毫米波雷達(dá)、GPS 定位、高精度地圖、車載芯片、人車交互、車聯(lián)網(wǎng);
  3. 無人機(jī)(含解決方案):消費(fèi)級無人機(jī)(娛樂、航拍) 工業(yè)無人機(jī)(農(nóng)林、電力、物流、安防等領(lǐng)域);
  4. 大數(shù)據(jù)及數(shù)據(jù)服務(wù):數(shù)據(jù)可視化、數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)挖掘、數(shù)據(jù)解決方案。

在AI+方面,當(dāng)前AI和具體行業(yè)或場景的結(jié)合情況如下,其中最主要的場景分別為金融、制造、電商、醫(yī)療等。

數(shù)據(jù)來源:2017 CSDN中國開發(fā)者大調(diào)查

(3)融資層面,融資金額逐年提高,單筆金額逐漸增大

數(shù)據(jù)來源:IT桔子 2012-2017AI融資趨勢

從2012年至今,我國AI領(lǐng)域共有1354家公司,投資事件1353起,投資總額為1448億人民幣。2012年,我國的AI投資事件共26起,投資金額為6億元人民幣,到了2017年,投資事件已經(jīng)高達(dá)334起,投資總額已經(jīng)超過550億元人民幣,相比2012年翻了上百倍。不過,相對2016年,2017年的投資事件有所下降,但是投資總額大幅上升,資本對于AI的熱情還是值得肯定的。

三、人工智能發(fā)展背景

1. 人工智能發(fā)展史

從1956年提出概念,到2016年大規(guī)模爆發(fā),在這60多年里,人工智能一共經(jīng)歷了三起二落,在1970年和2000年,人工智能的發(fā)展陷入了低谷,原因主要是:

  1. 當(dāng)時的算法和科技水平無法滿足人工智能的需求,最后也都是依靠算法的進(jìn)化和計(jì)算能力的提升而突破。
  2. 人工智能的應(yīng)用達(dá)不到人們的預(yù)期,政府縮減投入。

當(dāng)前,人工智能正處于第三次熱潮。這次熱潮除了結(jié)合技術(shù)以及算法的提高之外,最大特點(diǎn)是通過深度學(xué)習(xí)和大數(shù)據(jù)的結(jié)合,使得人工智能在多個領(lǐng)域找到了真實(shí)的應(yīng)用場景,與具體業(yè)務(wù)場景相結(jié)合,開始在一些行業(yè)中發(fā)揮著巨大的作用。

2. 人工智能發(fā)展三要素

如果用一個公式來概括人工智能發(fā)展受那些因素影響,那么這個公式可以是AI=算力+算法+數(shù)據(jù),關(guān)于這三者的關(guān)系,著名人工智能專家吳恩達(dá)曾有一個著名的比喻:發(fā)展人工智能就像用火箭發(fā)射衛(wèi)星,需要強(qiáng)有力的引擎和足夠的燃料,如果燃料不夠,火箭無法將衛(wèi)星推到合適的軌道;如果引擎推力不夠,火箭甚至都不能起飛。而這當(dāng)中,算法模型就好像引擎,高性能的計(jì)算機(jī)是打造引擎的工具,海量的數(shù)據(jù)就是引擎的燃料。

(1)算力,主要包含芯片+超級計(jì)算機(jī)+云計(jì)算

FLOPS是Floating-point Operations Per Second每秒所執(zhí)行的浮點(diǎn)運(yùn)算次數(shù)的英文縮寫,它是一個衡量計(jì)算機(jī)計(jì)算能力的量,計(jì)算機(jī)每秒執(zhí)行的浮點(diǎn)運(yùn)算次數(shù)越多,算力越強(qiáng),1GFLOPS (gigaFLOPS) =每秒10億 (=10^9) 次的浮點(diǎn)運(yùn)算。

注:浮點(diǎn)運(yùn)算能力大?。?/p>

  • 1MFLOPS (megaFLOPS) =每秒1百萬 (=10^6) 次的浮點(diǎn)運(yùn)算
  • 1GFLOPS (gigaFLOPS) =每秒10億 (=10^9) 次的浮點(diǎn)運(yùn)算
  • 1TFLOPS (teraFLOPS) =每秒1萬億 (=10^12) 次的浮點(diǎn)運(yùn)算
  • 1PFLOPS (petaFLOPS) =每秒1千萬億 (=10^15) 次的浮點(diǎn)運(yùn)算

(2)算法

傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的時候,由于技術(shù)能力的限制,人工智能在很多行業(yè)都沒法具體應(yīng)用和落地,深度神經(jīng)網(wǎng)絡(luò)出現(xiàn)之后,人工智能的技術(shù)能力有了飛速的提升。

以計(jì)算機(jī)視覺為例:其主要識別方式發(fā)生重大轉(zhuǎn)變,自學(xué)習(xí)狀態(tài)成為視覺識別主流,機(jī)器從海量數(shù)據(jù)庫里自行歸納物體特征,然后按照該特征規(guī)律識別物體。圖像識別的精準(zhǔn)度也得到極大的提升,從70%+提升到95%。

(3)數(shù)據(jù)

2017年全球人口有75億,一個人,一年產(chǎn)生的數(shù)據(jù)量大約是52GB的信息, 雖然作為個體的我們的確非常的渺小,但是整個人工智能的發(fā)展也離不開我們每一個人的貢獻(xiàn),因?yàn)槲覀兠總€人無時無刻都在給AI輸送著燃料。

四、人工智能的產(chǎn)業(yè)鏈分析

人工智能從底層到應(yīng)用層,大致可以分為技術(shù)支撐層,基礎(chǔ)應(yīng)用層和方案集成層,下面筆者會對每塊內(nèi)容,做個說明。

1. 技術(shù)支撐層

(1)芯片

1)芯片分類

芯片一般是指集成電路的載體,由晶圓分割而成,芯片按照功能不同可分為很多種,有負(fù)責(zé)音頻視頻處理的,有負(fù)責(zé)圖像處理的,還有負(fù)責(zé)復(fù)雜運(yùn)算處理的,算法必須借助芯片才能夠運(yùn)行,不同場景及技術(shù),對于芯片的性能要求也不一樣。當(dāng)前大家接觸比較多的芯片應(yīng)該就是CPU和GPU了。

CPU 基于高通用、強(qiáng)邏輯的設(shè)計(jì)—偏認(rèn)知能力的應(yīng)用

CPU需要很強(qiáng)的通用性來處理各種不同的數(shù)據(jù)類型,在大規(guī)模并行計(jì)算能力上極受限制,而更擅長于邏輯控制。核心:存儲程序,順序執(zhí)行。

GPU是基于大吞吐量、高并發(fā)設(shè)計(jì)—偏感知能力的應(yīng)用

和通用類型數(shù)據(jù)運(yùn)算不同,GPU擅長的是大規(guī)模并發(fā)計(jì)算,這也正是密碼破解等所需要的。

CPU和GPU的區(qū)別:

舉個栗子:一個數(shù)學(xué)教授和100個小學(xué)生PK。

  • 第一回合,四則運(yùn)算,100道題。教授拿到卷子一道道算,一百個小學(xué)生各拿一道題各自算,教授剛開始算到第5題的時候,小學(xué)生集體交卷,第一回合小學(xué)生碾壓教授。
  • 第二回合,證明題。一道題,當(dāng)教授搞定后,一百個小學(xué)生還不知道在干嘛…….
  • 第二回合,教授碾壓一百個小學(xué)生,這就是CPU和GPU的淺顯比較。

高通用:除了四則運(yùn)算、還可以有證明題、幾何體、微積分題等等。

強(qiáng)邏輯:證明題,證明過程上下是有邏輯的,單獨(dú)抽出來看一行是沒有意義。

高并發(fā):一下子100道題。

因?yàn)镃PU的架構(gòu)中需要大量的空間去放置存儲單元和控制單元,相比之下計(jì)算單元只占據(jù)了很小的一部分,所以它在大規(guī)模并行計(jì)算能力上極受限制,而更擅長于邏輯控制。這方面,GPU剛好相反,但GPU無法單獨(dú)工作,必須由CPU進(jìn)行控制調(diào)用才能工作。CPU可單獨(dú)作用,處理復(fù)雜的邏輯運(yùn)算和不同的數(shù)據(jù)類型,但當(dāng)需要大量的處理類型統(tǒng)一的數(shù)據(jù)時,則可調(diào)用GPU進(jìn)行并行計(jì)算。

2)芯片上下游產(chǎn)業(yè)鏈情況

不同的芯片在不同的算法及應(yīng)用場景下,功能和價值是不一樣的,原因主要和集成電路設(shè)計(jì)的結(jié)構(gòu)有關(guān)。

晶圓:芯片是半導(dǎo)體,主要材料是硅,制作硅的工藝,較小、較薄,節(jié)省材料,單位材料下可以做更多芯片。

專業(yè)封測:封裝材料塑料、陶瓷、玻璃、金屬等,完成封裝后,便要進(jìn)入測試的階段,在這個階段便要確認(rèn)封裝完的 IC 是否有正常的運(yùn)作,正確無誤之后便可出貨給組裝廠。

在芯片產(chǎn)業(yè)鏈上,越接近上游,附加值越高,技術(shù)門檻越大,資本投入的效益也越高。當(dāng)前在芯片這塊,Intel、IBM、三星這幾家巨頭企業(yè)在芯片上下游的工藝全有,整體產(chǎn)業(yè)鏈控制力強(qiáng),而國內(nèi)的中興集團(tuán)在通訊設(shè)備和手機(jī)這塊,大量和核心元器件是從國外進(jìn)行采購,一但發(fā)送貿(mào)易摩擦,很容易被國外掐斷這塊原材料的供應(yīng),比較容易受制于人。

3)未來, AI定制芯片必為趨勢

任何一種產(chǎn)品或者商業(yè)模式在她剛出來的時候,當(dāng)對于她在哪個行業(yè)具備較大經(jīng)濟(jì)價值的時候,通常都是先做通用化,然后再做垂直化,通過垂直化的服務(wù)優(yōu)勢,來提升整個產(chǎn)品以及商業(yè)模式的核心競爭力。按照上文所述,CPU和GPU都是較為通用的芯片,但是,隨著行業(yè)的快速發(fā)展,人們對于芯片的個性化要求也越來越高,萬能工具的效率永遠(yuǎn)比不上專用工具。

人工智能領(lǐng)域作為一個數(shù)據(jù)密集的領(lǐng)域,傳統(tǒng)的數(shù)據(jù)處理技術(shù)難以滿足高強(qiáng)度并行數(shù)據(jù)的處理需求。為解決此問題,繼CPU和GPU之后,相繼出現(xiàn)了NPU、FPGA、DSP等專門針對AI的芯片。

TPU—用于加速深度學(xué)習(xí)運(yùn)算能力而研發(fā)的一款芯片

代表公司GOOGLE

原來很多的機(jī)器學(xué)習(xí)以及圖像處理算法大部分都跑在GPU與FPGA(半定制化芯片)上面,但這兩種芯片都還是一種通用性芯片。所以在效能與功耗上還是不能更緊密的適配機(jī)器學(xué)習(xí)算法,TPU與同期的CPU和GPU相比,可以提供15-30倍的性能提升,以及30-80倍的效率提升。

NPU— 即神經(jīng)網(wǎng)絡(luò)處理器,利用電路模擬人類的神經(jīng)元和突觸結(jié)構(gòu)

代表公司寒武紀(jì)

專門高效地進(jìn)行 AI相關(guān)計(jì)算定制的處理器,就像GPU之于圖形處理相關(guān)的計(jì)算,ISP之于成像相關(guān)的計(jì)算。NPU性能達(dá)到了1.92TFLOP,使用NPU計(jì)算比使用CPU計(jì)算要高出25倍的速度,50倍的能效比。

4)國內(nèi)芯片企業(yè)介紹

(2)算法模型

筆者前面說了很多關(guān)于人工智能的介紹以及分析,那么到底怎么樣才是智能,也就是人工智能的核心是什么,在筆者看來無非四個字——機(jī)器學(xué)習(xí)。

機(jī)器學(xué)習(xí)是需要算法來支持的,算法的作用:對數(shù)據(jù)進(jìn)行歸納和演繹,最終目的是提高識別效率和準(zhǔn)確率 ,然后對真實(shí)世界中的事件做出決策和預(yù)測。人工智能的核心就是通過不斷地機(jī)器學(xué)習(xí),而讓自己變得更加智能。

那什么又是機(jī)器學(xué)習(xí)呢?

機(jī)器學(xué)習(xí)是讓計(jì)算機(jī)有能力在不需要明確編程的情況下,用大量的數(shù)據(jù)來“訓(xùn)練”,從數(shù)據(jù)中學(xué)習(xí)如何完成任務(wù)。在深度學(xué)習(xí)出現(xiàn)之前,機(jī)器學(xué)習(xí)領(lǐng)域的主流是各種淺層學(xué)習(xí)算法, 如神經(jīng)網(wǎng)絡(luò)的反響傳播算法(BP算法)、支撐向量機(jī)(SVM)、 Boosting、Logistic Regression等。這些算法的局限性在于對有限樣本和計(jì)算單元的情況下對復(fù)雜函數(shù)的表示能力有限,對復(fù)雜數(shù)據(jù)的處理受到制約。

1)深度學(xué)習(xí)是通過模擬大腦結(jié)構(gòu)的多層神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)

大腦中的神經(jīng)元,又稱神經(jīng)細(xì)胞,是構(gòu)成神經(jīng)系統(tǒng)結(jié)構(gòu)和功能的基本單位,它由細(xì)胞體和細(xì)胞突起構(gòu)成,每個神經(jīng)元有好幾個數(shù)突,只有一個軸突,可以把興奮從胞體傳送到另一個神經(jīng)元或其他組織,如肌肉或腺體。

但與大腦中一個神經(jīng)元可以連接一定距離內(nèi)的任意神經(jīng)元不同,人工神經(jīng)網(wǎng)絡(luò)具有離散的層,每一次只連接符合數(shù)據(jù)傳播方向的其它層。

深度學(xué)習(xí)的“深度”指的就是多層神經(jīng)網(wǎng)絡(luò)的層數(shù)較多,模型結(jié)構(gòu)的深度,通常有5層、6層,甚至10多層的隱層節(jié)點(diǎn),每層相當(dāng)于一個可以解決問題不同方面的機(jī)器學(xué)習(xí)。利用這種深層非線性的網(wǎng)絡(luò)結(jié)構(gòu),深度學(xué)習(xí)可以實(shí)現(xiàn)復(fù)雜函數(shù)的逼近,將表征輸入數(shù)據(jù)分布式表示,繼而展現(xiàn)強(qiáng)大的從少數(shù)樣本集中學(xué)習(xí)數(shù)據(jù)集本質(zhì)特征的能力,并使概率向量更加收斂。

2)深度學(xué)習(xí)的出現(xiàn),使得人工智能在很多行業(yè)具備了價值實(shí)現(xiàn)的可能性

深度學(xué)習(xí)出現(xiàn)之后,計(jì)算機(jī)視覺的主要識別方式發(fā)生重大轉(zhuǎn)變,自學(xué)習(xí)狀態(tài)成為視覺識別主流。即,機(jī)器從海量數(shù)據(jù)庫里自行歸納物體特征,然后按照該特征規(guī)律識別物體。圖像識別的精準(zhǔn)度也得到極大的提升,從70%+提升到95%,在醫(yī)學(xué)影像領(lǐng)域,95%的精度識別已經(jīng)具備一定使用價值,而精度識別達(dá)到達(dá)到97%以上后,將具備輔助診斷價值。

3)目前深度學(xué)習(xí)框架的開源已經(jīng)成為了趨勢

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是需要靠算法支撐的,算法是需要不斷的利用數(shù)據(jù)進(jìn)行訓(xùn)練和優(yōu)化。自從深度學(xué)習(xí)取得突破性進(jìn)展以后,巨頭們頻頻開源,當(dāng)AI公司們使用開源平臺進(jìn)行算法的迭代時,開源平臺可以獲取數(shù)據(jù),以及市場對應(yīng)用場景熱度的反饋,加速模型的訓(xùn)練。

在這樣的背景下谷歌公司于2015年2月15日開放了TensorFlow1.0版本。在深度學(xué)習(xí)加速發(fā)展的今天,代碼和數(shù)據(jù)庫都在迅速的更新中,開源所構(gòu)建的開發(fā)者生態(tài)是極為重要的。

4)算法和基礎(chǔ)應(yīng)用技術(shù)的關(guān)聯(lián)

上圖是筆者根據(jù)自身投資行業(yè)經(jīng)驗(yàn)以及理解,做得一個人工智能算法對于基礎(chǔ)應(yīng)用技術(shù)的一個難易程度關(guān)聯(lián),場景化程度越高,對于算法難度的要求也會也會越大。

2. 基礎(chǔ)應(yīng)用層

(1)語音識別

技術(shù)原理:

所謂語音識別,是將聲音信號轉(zhuǎn)化成數(shù)字信號,然后通過特征提取,進(jìn)行歸納演義,推測出對應(yīng)的文字,語音識別的主要難度主要在兩個方面

首先是數(shù)據(jù)的獲取、清洗。語音識別需要大量細(xì)分領(lǐng)域的標(biāo)準(zhǔn)化語料數(shù)據(jù)作為支撐,尤其是各地方言的多樣性更是加大了語料搜集的工作量。

第二個難點(diǎn)是語音特征的提取,目前主要通過具備多層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)來解決,多層的神經(jīng)網(wǎng)絡(luò)相當(dāng)于一個特征提取器,可對信號進(jìn)行逐層深化的 特征描述,最終從部分到整體,從籠統(tǒng)到具象,做到最大程度地還原信號原始特征。

應(yīng)用場景:

投資價值及機(jī)會:

語音識別雖市場龐大但已出現(xiàn)寡頭,留給創(chuàng)業(yè)公司的機(jī)會不多,據(jù)Research and Markets研究報告顯示,全球智能語音市場將持續(xù)顯著增長,預(yù)計(jì)到2020年,全球語音市場規(guī)模預(yù)計(jì)將達(dá)191.7億美元。根據(jù)Capvision報告顯示,從語音行業(yè)市場份額角度來看,全球范圍內(nèi),由Nuance領(lǐng)跑,國內(nèi)則是科大訊飛占據(jù)主導(dǎo)地位。

以科大訊飛為例,截止2018年

1)開放平臺

訊飛開放平臺開發(fā)者達(dá)51.8萬(同比增長102%),年增長量超過前五年總和;應(yīng)用總數(shù)達(dá)40萬(同比增長88%),年增長量超過前五年總和;平臺連接終端設(shè)備總數(shù)累計(jì)達(dá)17.6億(同比增長93%)??拼笥嶏w當(dāng)前將語音識別很多功能模塊SDK化,根據(jù)開發(fā)者終端APP或者是設(shè)備每月的數(shù)據(jù)并發(fā)數(shù)來進(jìn)行收費(fèi)。

2)語音識別準(zhǔn)確率

當(dāng)前語音識別準(zhǔn)確率達(dá)到98%以上,基本能夠滿足大量的的業(yè)務(wù)場景和需求。

3)智能教育、政法、城市服務(wù)程度很深

初創(chuàng)公司想在這三個行業(yè)和科大訊飛競爭很難。

(2)語義識別

技術(shù)原理:

語音識別解決的是計(jì)算機(jī)“聽得見”的問題,而語義識別解決的是 “聽得懂”的問題。自然語言處理(NLP)通過建立計(jì)算機(jī)框架來實(shí)現(xiàn)該語言模型,并根據(jù)該語言模型來設(shè)計(jì)各種實(shí)用系統(tǒng),根據(jù)統(tǒng)計(jì)學(xué)原理推算出用戶想表達(dá)的意思,對用戶行為進(jìn)行預(yù)測,然后給出對應(yīng)的指令或者是反饋。

當(dāng)前,NLP技術(shù)瓶頸主要還是在語義的復(fù)雜性,包含因果關(guān)系和邏輯推理的上下文等,現(xiàn)在解決這些問題的思路主要還是依賴于深度學(xué)習(xí)。

應(yīng)用場景:

投資價值及機(jī)會:

當(dāng)前語義識別領(lǐng)域,大的科技巨頭樂衷于收購,小而美的企業(yè)更偏好細(xì)分場景。

關(guān)于語義識別領(lǐng)域的創(chuàng)業(yè)公司,國內(nèi)代表企業(yè)有出門智能360、出門問問、三角獸、驀然認(rèn)知等。

大公司更側(cè)向于做平臺方面的通用技術(shù),基于平臺,如果有好的項(xiàng)目出現(xiàn),直接收購。做小而美的公司,在特定場景下的語義分析,難度要比通用行業(yè)的語義分析難度低,準(zhǔn)確率甚至可以達(dá)到85%以上,原因是基于特定場景下的語料分析,由于語料相對特定,可以在一定程度上提高準(zhǔn)確率。

智能客服:智齒科技 小I

法律咨詢:無訟、法律谷等

(3)計(jì)算機(jī)視覺

技術(shù)原理:

計(jì)算機(jī)視覺在技術(shù)流程上,首先要得到實(shí)時數(shù)據(jù), 此步驟可通過一系列傳感器獲取,少部分?jǐn)?shù)據(jù)可直接在具備MEMS功能的傳感器端完成處理,大部分?jǐn)?shù)據(jù)會繼續(xù)傳輸至大腦平臺,大腦由運(yùn)算單元和算法構(gòu)成,在此處進(jìn)行運(yùn)算并給出決策支持。

應(yīng)用場景:

計(jì)算機(jī)視覺應(yīng)用場景可分為兩大類:圖像識別和人臉識別,每類又可繼續(xù)劃分為動、靜共四個類別, 基本覆蓋了目前計(jì)算機(jī)視覺的各項(xiàng)應(yīng)用場景。其中動態(tài)人臉識別技術(shù)是目前創(chuàng)業(yè)熱度最高的細(xì)分領(lǐng)域,尤其是金融和安防場景,是其重點(diǎn)布局場景。

投資價值及機(jī)會:

對于計(jì)算機(jī)視覺而言,其主要瓶頸在于受圖片質(zhì)量、光照環(huán)境的影響,現(xiàn)有圖像識別技術(shù)較難解決圖像殘缺、光線過爆、過暗的圖像。此外,受制于被標(biāo)記數(shù)據(jù)的體量和數(shù)量,若無大量、優(yōu)質(zhì)的細(xì)分應(yīng)用場景數(shù)據(jù),該特定應(yīng)用場景的算法迭代很難實(shí)現(xiàn)突破。當(dāng)前,計(jì)算機(jī)視覺市場技術(shù)較為成熟,第一梯隊(duì)格局已經(jīng)形成,留給創(chuàng)業(yè)公司的機(jī)會已經(jīng)不大。

五、總結(jié)

這篇文章是筆者就最近看的一些人工智能項(xiàng)目,結(jié)合自己的投資經(jīng)驗(yàn),做得一個行業(yè)梳理,概括來說:

1)目前AI的發(fā)展仍處于早期,感知技術(shù)取得一定成就,認(rèn)知技術(shù)發(fā)展仍待突破;

2)芯片的未來,AI定制芯片必為趨勢,創(chuàng)業(yè)公司在垂直領(lǐng)域AI芯片的研發(fā)領(lǐng)域仍有機(jī)會;

3)算法是競爭的一個障礙,但AI如何結(jié)合生活和業(yè)務(wù)場景,進(jìn)行落地,才是真正的難點(diǎn);

4)語義識別發(fā)展瓶頸仍然較大,小而美的企業(yè)具備收購價值;

5)有一手?jǐn)?shù)據(jù)源、能夠與實(shí)際業(yè)務(wù)相結(jié)合的公司有望建立起自身的競爭壁壘,數(shù)據(jù)將成為制約AI公司在行業(yè)領(lǐng)域發(fā)展速度以及競爭門檻的重要要素。

當(dāng)前人工智能行業(yè)仍然處于一個投資風(fēng)口期,希望通過這篇文章,能夠給有志于在這個行業(yè)中創(chuàng)業(yè)或者是進(jìn)行產(chǎn)品設(shè)計(jì)的人一定的啟發(fā)。

 

作者:作者:阿旺,著名投資人兼連續(xù)創(chuàng)業(yè)者,會從自身投資以及創(chuàng)業(yè)經(jīng)歷,不定期輸出各類行業(yè)研究,如您想了解更多關(guān)于創(chuàng)業(yè)以及投資方面的內(nèi)容,歡迎關(guān)注本人公眾號:awangblog

本文由 @阿旺 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!