人工智能產(chǎn)品應(yīng)用現(xiàn)狀總覽與未來思考
一個(gè)很大、很難成品的題目,但是自己很喜歡這一塊,并且碩士期間也在從事基于深度學(xué)習(xí)的目標(biāo)檢測與識別的研究,所以希望能在總結(jié)與思考之后有一定的收獲和一個(gè)清晰的脈絡(luò)。無法一覽無余,但愿能見微知著。
- 本篇文章,會先談一下自己對人工智能產(chǎn)品的一個(gè)理解和使用體驗(yàn)(用戶角度)。
- 接著以【行業(yè)應(yīng)用】和【產(chǎn)品形式】兩個(gè)角度,總結(jié)一下人工智能產(chǎn)品的應(yīng)用情況。
- 最后,通過學(xué)習(xí)與總結(jié)再以一個(gè)產(chǎn)品人的角度,展望AI產(chǎn)品的未來。
【真假】“人工”智能
先從用戶的角度,談一下,現(xiàn)如今已經(jīng)滿大街都飛揚(yáng)著的“人工智能”。
總結(jié)一下:說自己是AI產(chǎn)品的,大部分都是人工的AI;你感受不到的,卻處處有AI。
我覺得上面的總結(jié)形容地應(yīng)該很貼切了,由于很多普通用戶對技術(shù)實(shí)現(xiàn)上沒有太大的概念,所以總是被一些帶有迷惑性質(zhì)的AI宣傳所欺騙,最后自己使用之后,評價(jià)基本都是:“什么破人工智能,真笨!”。而真正的人工智能技術(shù),其實(shí)已經(jīng)進(jìn)入我們的生活,只是我們未曾察覺,而好的技術(shù)就是這樣,不需要大張旗鼓的宣揚(yáng),卻真真切切的提高了我們生活的效率。
先說說我們能看到的那些“假”人工智能。
智能水杯:?主要功能為,水溫顯示、水溫鬧鐘、高溫預(yù)警、飲水提醒、微信互聯(lián)、定位尋找等。其實(shí)來看一下,這里面的功能,都是需要人為的在對應(yīng)的智能硬件APP上設(shè)定,才能達(dá)到智能。當(dāng)我們有新的想法時(shí),還得去重新設(shè)定。是實(shí)實(shí)在在的【人工手動(dòng)】智能。可這樣的杯子,可以在某電商自營平臺賣到300+、400+的價(jià)格。
智能水杯功能宣傳圖
從智能水杯,再看很多類似的“智能硬件”設(shè)備。它們通過人工的一些設(shè)定,達(dá)到自動(dòng)的作用,但是如果情況有變, 我們希望更改設(shè)置時(shí),就還需要人工的去設(shè)定,就非常的不智能了。
但其實(shí),是否需要人工設(shè)定,這個(gè)界限是有點(diǎn)模糊的,因?yàn)楹芏嗳斯ぶ悄芟到y(tǒng)需要一個(gè)冷啟動(dòng),但很多這樣的智能硬件設(shè)備確實(shí)是一點(diǎn)AI的相關(guān)技術(shù)都沒有用到,靠的是傳感器顯示和人工程序設(shè)定。
不過這類產(chǎn)品,可能也沒想往AI上設(shè)計(jì),但只是介于智能和普通之間,找不到其他好聽的修飾詞,所以便取了“智能”。就像剛出來的智能手機(jī)一樣。這里就再不細(xì)談這些產(chǎn)品是否可以算入“假”的人工智能(因?yàn)槿思乙矝]有明確自己是AI產(chǎn)品),但是,確實(shí),會給用戶帶來一定的混淆。
【弱】人工智能產(chǎn)品的前因后果
不過,真正使用了”Machine Learning”的【弱】人工智能產(chǎn)品,才是讓用戶說出“什么破人工智能”的禍?zhǔn)住?/p>
智能機(jī)器人:現(xiàn)在市面上的機(jī)器人基本可以用能動(dòng)的和不能動(dòng)的來區(qū)分價(jià)位。在交互上,有純語音交互的,也有視覺+語音的。這些產(chǎn)品集成了大量的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù),一開始的亮相驚艷無比,但是慢慢的新鮮感就會下降。
其實(shí)出現(xiàn)這樣的現(xiàn)象,根本的原因是這些產(chǎn)品無法自學(xué)習(xí)。雖然對比不同的交互,會有不同的設(shè)定,甚至在出現(xiàn)訓(xùn)練時(shí)沒有輸入過的陌生指令,也可以很好地拆解并做出反應(yīng)。但是,這些算法始終都無法自學(xué)習(xí)(無監(jiān)督學(xué)習(xí)),所以,某種意義上來講,就是【弱】人工智能。
還有類似的:“智能推薦”、“個(gè)人語音助手”等,我們會發(fā)現(xiàn)都是在一定程度上的“智能”。這也是監(jiān)督學(xué)習(xí)的一個(gè)弊端。機(jī)器無法自學(xué)習(xí),在某種意義上就是【弱】人工智能。雖然,現(xiàn)在也有些“智能推薦”應(yīng)用,可以根據(jù)用戶的使用數(shù)據(jù),不斷學(xué)習(xí)用戶行為迭代更新模型參數(shù),但是,由于還是偏向?qū)W習(xí)用戶歷史行為數(shù)據(jù),所以,這類的產(chǎn)品也會因?yàn)闊o法適應(yīng)人類多變的興趣和情感需求,而被詬病。
而對于,“聊天機(jī)器人”來講,很多用戶在使用過程中很容易跳戲,或者覺得并不智能。
清華大學(xué)的黃民烈博士表示,想要讓機(jī)器像人一樣與用戶交流,還要需要幾個(gè)關(guān)鍵點(diǎn):
- 需要給機(jī)器一個(gè)固定的人格和屬性。
- 要讓機(jī)器知道交談的話題是什么, 并且是在跟誰交談。
- 要考慮對話時(shí)的一些其他環(huán)境信息,甚至考慮多方面的綜合感知信息:如語音、語調(diào)、姿態(tài)和表情。
不過,以上說的這些,都是人工智能呈現(xiàn)一個(gè)完整的閉環(huán)產(chǎn)品形式在展現(xiàn), 涉及到的使用場景是非常廣泛開放性的,所以用戶無法真切地感受到AI給我們生活中的細(xì)節(jié)末梢?guī)淼木薮笞兓?/p>
系統(tǒng)化、閉環(huán)形式的產(chǎn)品,總是難以打造的。當(dāng)技術(shù)未成熟時(shí),人工智能,很難作為一個(gè)獨(dú)立的載體,開放式地為人類服務(wù)。但是,由于深度學(xué)習(xí)近幾年的飛速發(fā)展,在一些細(xì)分領(lǐng)域上,人工智能已經(jīng)可以勝任人類的工作,例如:人臉識別、智能安防、語音識別等等。
所以接下來,我們就來看看,應(yīng)用了AI技術(shù)的產(chǎn)品都有哪些,如今的AI+ 是如何改變我們生活方式和產(chǎn)品形態(tài)的。
??這些年我們遇見的人工智能
這一塊的內(nèi)容思前想后了半天,寫了又刪,刪了又寫,主要是不知道該如何邏輯清晰地把概況都總結(jié)下來。最后還是覺得用【產(chǎn)品形式】和【應(yīng)用行業(yè)】這兩個(gè)角度進(jìn)行總結(jié),雖然有交叉的地方,但是大部分都還是有區(qū)別的,盡量全面的了解一下AI的各種應(yīng)用。
AI應(yīng)用中的產(chǎn)品形式展現(xiàn)
首先,先上一個(gè)導(dǎo)圖。我按照產(chǎn)品的輸入形式分為了4種:文字、語音、圖像、視頻。接下來,按照AI技術(shù)如何處理這些輸入或產(chǎn)品的輸出形式進(jìn)行了舉例。
AI產(chǎn)品——產(chǎn)品形式
首先要提一下,由于深度學(xué)習(xí)大量地應(yīng)用到這些領(lǐng)域的研究中,所以從12年到現(xiàn)在,在上述的大部分領(lǐng)域中,學(xué)術(shù)界大幅地提升了算法的精度,這給產(chǎn)品化的應(yīng)用帶來了前提條件。因?yàn)?,在學(xué)術(shù)界,可能提高1%就可以發(fā)論文;但是在工業(yè)界,需要有一個(gè)很高的精度,才能投入使用。并且,值得一提的是,在有些領(lǐng)域里,機(jī)器的準(zhǔn)確率已經(jīng)比人類還要高。
這里我們需要感謝硬件的不斷發(fā)展,讓我們得到了巨大的計(jì)算能力。也要感謝互聯(lián)網(wǎng)的不斷發(fā)展,讓我們積累了龐大的數(shù)據(jù)。最后,也得感謝Geoff Hinton、Yann LeCun等學(xué)術(shù)泰斗,他們的堅(jiān)持和創(chuàng)造讓學(xué)術(shù)界重新看到了深度學(xué)習(xí)的無限潛力。
好了,開始細(xì)細(xì)說一下這些已經(jīng)應(yīng)用在我們生活中的AI產(chǎn)品。
文字
機(jī)器翻譯:
這個(gè)大家應(yīng)該都會用到:【百度翻譯】、【google翻譯】。目前的【google翻譯】已經(jīng)擁有100多種語言之間的互譯功能,十分強(qiáng)大。雖然,對于有歧義的句子等,還是無法很正確的翻譯;但是,對于日常的輔助閱讀,已經(jīng)十分夠用了。
智能客服:
這個(gè)應(yīng)該也很熟悉了,現(xiàn)在很多行業(yè)90%以上的客服回答都是由機(jī)器人來完成的。由于很多問題,都是相似的,可以直接對用戶輸入的文字做分詞處理,匹配關(guān)鍵詞,然后回答相應(yīng)的問題,極大地減少了人工客服重復(fù)性的工作。
閱讀理解:
讓機(jī)器閱讀文章并回答問題。雖然,我們讓機(jī)器做閱讀理解并評分意義不大,但是如果作為一個(gè)輔助技術(shù)是非常重要的:可以幫助人類在大量的文本中找到想要的答案,減少人力付出。
機(jī)器人寫稿:
這項(xiàng)應(yīng)用已經(jīng)在很多細(xì)分領(lǐng)域中開展了。比如地震新聞、體育新聞、財(cái)經(jīng)新聞等。這些領(lǐng)域中的新聞播報(bào)都有固定的格式,讓機(jī)器學(xué)習(xí)這些模板,然后給機(jī)器輸入相關(guān)的數(shù)據(jù),可以在極短間內(nèi)輸出新聞報(bào)道。前段時(shí)間關(guān)于四川九寨溝發(fā)生的7.0級地震,中國地震臺網(wǎng)機(jī)器人自動(dòng)編寫稿件僅用25秒出稿,寫了540字并配發(fā)4張圖片。
2017年8月8日21時(shí)37分15秒,中國地震網(wǎng)機(jī)器人自動(dòng)編寫的稿件
拼寫補(bǔ)全:
我們在日常打字的時(shí)候,在我們未拼寫完全的時(shí)候,輸入法就會猜我們需要打什么字。這個(gè)就是利用大數(shù)據(jù)讓機(jī)器更了解我們。
語音
語音識別:
這個(gè)大家就再熟悉不過了,現(xiàn)在手機(jī)上的主流輸入法都支持語音輸入,并且自己也會經(jīng)常使用,自己走在路上給對方發(fā)消息,但是對方不方便接受語音消息時(shí),依然可以抬著頭走路,剛需啊!這里值得一提的是,國內(nèi)的一些相關(guān)廠商在安靜的環(huán)境下,中文的語音識別準(zhǔn)確率達(dá)到97%。但是,同樣,未來的技術(shù)重點(diǎn)也是要在這個(gè)【安靜的環(huán)境】。不過語音識別更重要的意義在于,它給我們連接機(jī)器提供了一個(gè)更方便的接口。
即時(shí)翻譯:
語音識別+機(jī)器翻譯,就出現(xiàn)了現(xiàn)在很多即時(shí)翻譯軟件,出國旅游的利器。
語音合成:
這里,想要強(qiáng)調(diào)的是,語音合成技術(shù)是TTS系統(tǒng)中最基本而重要的模塊。而TTS是text-to-speech.作者本人一開始居然還傻傻地以為是將兩段語音合成。所以,我們在使用siri時(shí),就是語音合成技術(shù)讓她開的口。很多,閱讀軟件中的機(jī)器讀文功能,也是通過語音合成技術(shù)模仿人聲。說白了, 就是通過訓(xùn)練,讓機(jī)器可以學(xué)習(xí)人的聲音說話。
語音喚醒:
很多電影,主角一聲吼,各種機(jī)器小弟來相見,這就是用到了語音喚醒。語音喚醒有兩種基本方式,一種就是通過語音識別,然后匹配喚醒詞。第二種,利用聲學(xué)模型(音調(diào)、頻率等),匹配喚醒庫里發(fā)音詞的發(fā)音特征,從而喚醒。
語音分離:
之前在講語音識別時(shí)是不是提到,在嘈雜的環(huán)境下識別率會降低。這里就有語音分離的用武之地了,可以將非人聲或其他噪聲分離出來,只將我們想要的聲音輸入。
圖像
人臉識別:
已經(jīng)大量應(yīng)用,iphone X刷臉解鎖;刷臉支付也已進(jìn)入試用階段;甚至還可以通過兒童時(shí)候的照片找出長大之后的人臉;在一些安檢點(diǎn)會通過照相匹配身份證上的人臉信息,以查看是否是本人。這都是人臉識別的應(yīng)用。
目標(biāo)檢測&目標(biāo)識別:
大多數(shù)情況下這兩個(gè)技術(shù)都是同時(shí)應(yīng)用的。這項(xiàng)技術(shù)也是整個(gè)計(jì)算機(jī)視覺的基礎(chǔ),很多應(yīng)用的核心技術(shù)也是基于此。效果就是可以檢測出一張圖片中你想要檢測的目標(biāo)并識別出它是什么(人、動(dòng)物、手機(jī)、汽車等等)?,F(xiàn)在學(xué)術(shù)界的Yolo9000可以檢測并識別9000種類別的物體,并且可以達(dá)到實(shí)時(shí)的速度。而且,目前機(jī)器識別目標(biāo)的準(zhǔn)確率早已高于人類(在一些標(biāo)準(zhǔn)數(shù)據(jù)集上的測試結(jié)果)。所以整個(gè)技術(shù)的成熟度已經(jīng)很高,可以作為基礎(chǔ)技術(shù)應(yīng)用到各種復(fù)雜系統(tǒng)中去:例如,智能駕駛中需要檢測并識別周圍的物體;智能安防領(lǐng)域中需要檢測攝像頭中的感興趣目標(biāo),等等。
最后,用一句話概括,就是可以讓機(jī)器認(rèn)識物體。
場景識別:
一張圖片我們分為前景和背景。當(dāng)人站在足球場上時(shí),我們就可以利用目標(biāo)檢測和識別技術(shù)將人檢測并識別出來,而場景識別呢,就可以告訴我們,這是足球場。一個(gè)是檢測前景物體的,一個(gè)是檢測背景的。而場景識別,要更加復(fù)雜一點(diǎn)。
OCR:
Optical Character Recognition——光學(xué)字符識別。是指對文本資料的圖像文件進(jìn)行分析識別處理,獲取文字及版面信息的過程。
這個(gè)應(yīng)用就十分廣泛了,而且也已深入我們的生活:比如,你在手機(jī)上添加銀行卡時(shí),很多軟件會讓你直接把卡放在攝像頭的中央位置,然后就會自動(dòng)識別出卡號。還有一些軟件需要添加身份證或者是個(gè)人證件時(shí),也可以使用相似的操作;以及你在停車場進(jìn)出的時(shí)候,車牌識別,其實(shí)也算這個(gè)領(lǐng)域。也有很多軟件應(yīng)用在直接把PDF的內(nèi)容轉(zhuǎn)換成可編輯的文檔??芍^十分廣泛。也是非?;A(chǔ)的一個(gè)應(yīng)用。
圖像處理:
其實(shí)在這個(gè)領(lǐng)域內(nèi),有些方法并沒有用到機(jī)器學(xué)習(xí)的內(nèi)容,但是也有用到的。應(yīng)用也是十分廣泛的。現(xiàn)在的很多美圖軟件,都可以按照用戶想要的效果輸出處理后的圖片。當(dāng)然還有一些更有意義的:比如,圖像去霧、圖像去燥、暗光增強(qiáng)、失焦修復(fù)。當(dāng)然還有各種濾鏡啊等等。應(yīng)用十分廣泛。
還有值得一提的是,圖像超分辨率:就是可以用深度學(xué)習(xí)模型將原始低分辨率的圖像經(jīng)過處理后變成高分辨率的圖像。并且,效果就是,你會認(rèn)為處理過后的圖像就是原始圖像。再多說一句,這項(xiàng)技術(shù)更進(jìn)一步,可以達(dá)到,你給機(jī)器輸入一個(gè)文字:“貓”,它就可以幫你生成一張貓的圖片。
圖像融合:
其實(shí)圖像融合也可以算是一種圖像處理的方式。目前已經(jīng)有很多圖像融合的APP了,并且這些圖像融合不是簡單的兩個(gè)圖像相疊加,是在風(fēng)格上的融合,并保持一定的內(nèi)容特征。在學(xué)術(shù)上,叫做圖像風(fēng)格遷移,可以讓人人都成為梵高風(fēng)、畢加索風(fēng)的圖片創(chuàng)造者。大家可以下一個(gè)【prisma】體驗(yàn)一下。
這里其實(shí),想說,看很多文章說這樣機(jī)械化的創(chuàng)造,會不會消滅藝術(shù);但,我覺得,雖然機(jī)器在融合的過程中并不會加入情感和思考,但是,背后操作的人,依然有著溫度。所以,作為一個(gè)工具,可以讓我們?nèi)巳硕汲蔀橐粋€(gè)“假”的藝術(shù)家,可這也是藝術(shù)希望的啊。我們需要做的,就是更好地了解這些工具,并讓他們成為生產(chǎn)力。
圖像分割:
其實(shí)圖像分割,就是摳圖,并且是完全按照物體的輪廓扣出來的圖?,F(xiàn)在很多軟件也可以做到,把你想要的前景目標(biāo)按照其邊界輪廓扣出來,然后,你就可以任意妄為的讓它去你想去的地方了。
最后看一下兩篇在各自領(lǐng)域內(nèi)較頂級的論文中的實(shí)驗(yàn)截圖,感受一下目標(biāo)檢測與識別 和 圖像分割的區(qū)別。其中,左圖上面的數(shù)字就是機(jī)器認(rèn)為是該物體的概率(最大為1.0)。真正的技術(shù)上原始的輸出是這樣子的,在此基礎(chǔ)上,到產(chǎn)品端給用戶的展示方式和形態(tài)可以有更多的想象力。
目標(biāo)檢測與識別&圖像分割
真正的技術(shù)上原始的輸出是這樣子的,在此基礎(chǔ)上,到產(chǎn)品端給用戶的展示方式和形態(tài)可以有更多的想象力。
視頻
其實(shí)視頻中的很多應(yīng)用基礎(chǔ)是上一節(jié)講過的圖像技術(shù),因?yàn)橐曨l都是由一張又一張的圖片組成的。在處理視頻時(shí)也會將其作為圖片進(jìn)行處理,隨后再將其連貫起來看。但是需要注意的是,視頻,比圖片多了一個(gè)時(shí)間序列信息。而利用這個(gè)信息,也是很多視頻應(yīng)用中,最關(guān)鍵的一步。
行為分析:
當(dāng)我們將視頻中出現(xiàn)的目標(biāo)按照先后關(guān)系連續(xù)去看每一個(gè)動(dòng)作時(shí),其中就蘊(yùn)含著行為的特征。技術(shù)上實(shí)現(xiàn)的原理也是這樣的,先通過把每一幀里 人的動(dòng)作給識別出來,然后再放到另一個(gè)模型中連貫的去處理這些動(dòng)作特征,最后得到預(yù)測的行為結(jié)果。
這個(gè),在人機(jī)交互中有十分大的潛在應(yīng)用價(jià)值。而在實(shí)際投入使用中,很多城市都安裝了預(yù)警攝像頭,如果在其監(jiān)控范圍內(nèi)有潛在的犯罪行為,就會自動(dòng)報(bào)警。
視頻分割:
這個(gè)就是做連續(xù)的圖像分割。把視頻中的一些前景或背景分割出來,有利用更好的研究視頻的內(nèi)容信息。也可以作為一種輔助工具,用于無人機(jī)導(dǎo)航和智能駕駛中去。
視頻語義理解:
視頻語義的理解其實(shí)是一個(gè)多特征的融合。利用之前提到過的:行為分析、人臉識別、語音識別等技術(shù),對視頻的相應(yīng)內(nèi)容進(jìn)行識別,并綜合這些特征,理解視頻內(nèi)容。
SLAM:
Simultaneous Localization and mapping,同步定位與地圖構(gòu)建。是近幾年很火的一項(xiàng)研究。我所知道的,有兩個(gè)應(yīng)用:
- 無人機(jī)在室內(nèi)環(huán)境下無法利用GPS導(dǎo)航飛行,這個(gè)時(shí)候就需要SLAM技術(shù),在陌生的室內(nèi)環(huán)境中進(jìn)行視覺導(dǎo)航。大致的原理就是,通過攝像頭拍下室內(nèi)的場景,然后進(jìn)行地圖的構(gòu)建,隨后用戶就可以操作無人機(jī)飛行室內(nèi)的一些指定位置了。這樣就解決了之前無人機(jī)無法在室內(nèi)定位導(dǎo)航飛行的難題。
- 在陸地上走的機(jī)器人,進(jìn)入一個(gè)陌生的環(huán)境也需要進(jìn)行導(dǎo)航。通過在運(yùn)動(dòng)過程中拍下的室內(nèi)場景,構(gòu)建室內(nèi)地形地圖特征,并定位自身位置和姿態(tài)。這個(gè)在一些災(zāi)難救援場景中,就顯得尤為關(guān)鍵和重要。
目標(biāo)跟蹤:
目標(biāo)跟蹤就是將目標(biāo)在視頻中的行動(dòng)軌跡給畫出來,從而就能定位一個(gè)人。目標(biāo)跟蹤其實(shí)是在目標(biāo)檢測的基礎(chǔ)之上做的一個(gè)算法跟蹤。因?yàn)?,因?yàn)槟繕?biāo)檢測無法區(qū)分檢測到的兩個(gè)人,并且,在目標(biāo)被遮擋的情況下,也是無法檢測到目標(biāo)的。而應(yīng)用目標(biāo)跟蹤技術(shù),即使在遮擋的情況下,根據(jù)目標(biāo)移動(dòng)的軌跡也可以預(yù)測出他的位置,并且,如果同時(shí)檢測到多個(gè)目標(biāo),還可以區(qū)分出這些目標(biāo)的軌跡。
智能安防:
以前,我們安防預(yù)警需要靠人盯著,或者說在事發(fā)之后,需要人為地去翻看錄像。而,將以上目標(biāo)檢測與識別、人臉識別、目標(biāo)跟蹤、行為分析等技術(shù)整合之后,就可以依靠機(jī)器查出犯罪嫌疑人分的移動(dòng)方向,甚至在城市的其他攝像頭中找到犯罪嫌疑人。也可以,讓機(jī)器全天候24小時(shí)的情況下監(jiān)控一些關(guān)鍵區(qū)域,預(yù)警是否有危險(xiǎn)情況的出現(xiàn)。
智能安防是一個(gè)領(lǐng)域,其中需要應(yīng)用到的技術(shù)是依據(jù)場景和需求而定,但其中肯定少不了AI的應(yīng)用。
AR/VR:
這一塊的技術(shù)應(yīng)用筆者不是很了解,但是,其中肯定集成了深度學(xué)習(xí)的一些基礎(chǔ)應(yīng)用技術(shù),例如:人臉識別、目標(biāo)檢測、場景識別等。而VR/AR未來可能會隨著硬件的普及,重新定義一些我們的生活方式。不過,在此之前,應(yīng)該先很好地解決長時(shí)間佩戴眩暈問題。
好了,到這就先告一段落了,仔細(xì)回顧一下上面所介紹的,在產(chǎn)品的形式上,AI幾乎已經(jīng)是包攬了所有的計(jì)算機(jī)軟件形態(tài)(不知道這樣說準(zhǔn)確不)了。而一些基礎(chǔ)應(yīng)用,已經(jīng)滲入到各行各業(yè)中,有的作為工具、有的作為零件,被集成到了行業(yè)中的系統(tǒng)中,為用戶或使用人員帶來了便利。
而其中,有一個(gè)特點(diǎn),就是應(yīng)用最為廣泛的,是一些基礎(chǔ)技術(shù)。它們作為工具,加快了傳統(tǒng)的人工處理或一些傳統(tǒng)技術(shù)處理的速度。
AI產(chǎn)品在各行業(yè)中的應(yīng)用展現(xiàn)
這一章節(jié),先上圖,隨后我們對這些行業(yè)進(jìn)行一些簡單的介紹和分析,如果有對某項(xiàng)應(yīng)用感興趣的,可以直接在網(wǎng)上搜索下面的關(guān)鍵詞,都可以得到很多的資料和介紹。
AI產(chǎn)品——行業(yè)應(yīng)用
以上,我挑了幾個(gè)公認(rèn)的AI改變巨大的行業(yè)進(jìn)行了細(xì)分。
生活服務(wù):
如今的智能手機(jī)就是集各種AI技術(shù)的產(chǎn)品。未來的手機(jī),可能都是人工智能+概念,成為最懂你的生活助手。在本地收集你的信息,然后訓(xùn)練模型,為你進(jìn)行個(gè)性化推薦。并且,手機(jī)上可以集成更多的深度學(xué)習(xí)技術(shù)。
- 當(dāng)你游玩時(shí)看到一束花,然后打開手機(jī)的攝像頭,手機(jī)就會告訴你這個(gè)花的一些信息。
- 當(dāng)你在朋友圈看到別人發(fā)的風(fēng)景照,再也不用在下面評論這是哪呀,直接點(diǎn)擊圖片搜索,就會告訴你這個(gè)游玩地點(diǎn),和一些景點(diǎn)基本信息。
當(dāng)然在生活服務(wù)方面,還有更多的事可以做。
- 夏天,在下班前的20分鐘,將家里的空調(diào)打開。調(diào)節(jié)到事宜的溫度。
- 出去買東西,孩子自己一個(gè)人在家里,一哭鬧,手機(jī)立馬報(bào)警,可能同時(shí)還有一個(gè)家庭機(jī)器人開始唱歌陪伴孩子。
其實(shí)這些事,很多已經(jīng)可以做到了,就等待未來這樣的生活普及到千家萬戶。很多智能硬件廠商,也都在積極部署自己的智能家居生態(tài),這里,【智能音箱】成為了行業(yè)內(nèi)的兵家必爭之地,作為連接各個(gè)智能家居的中樞入口。
這里,看一下在國慶期間谷歌的2017秋季新品發(fā)布會,就能感受到,AI+在生活服務(wù)中的方方面面。
零售:
AI在對整個(gè)電商零售行業(yè)的改變可謂是巨大的。我們能感受到的最深刻的就是個(gè)性化推薦。
- 你在某平臺上看羽毛球拍,基本上在其推薦區(qū)域可能就會有很多同價(jià)位的羽毛球拍的推薦。
- 當(dāng)你買完羽毛球拍,推薦更多的可能是羽毛球或球鞋等等。
個(gè)性化推薦其實(shí)已經(jīng)應(yīng)用到各行各業(yè)中了,很多面對消費(fèi)者的企業(yè)都將”千人千面”掛在嘴邊,成了下一個(gè)戰(zhàn)略目標(biāo)。其實(shí),真正去看實(shí)現(xiàn)的原理,發(fā)現(xiàn)確實(shí)是”千人千面”,但是由于用戶畫像的標(biāo)簽數(shù)量級很難達(dá)到另一個(gè)量級,發(fā)展到最后就依然還是“億人千面”。
對于傳統(tǒng)的零售行業(yè),通過大數(shù)據(jù)+機(jī)器學(xué)習(xí)可以對未來的貨品需求進(jìn)行預(yù)測,大大減少了商品壓倉的概率。
2017 TechWorld大會上,劉強(qiáng)東表示,在明年雙十一之前,會將建立第一個(gè)無人倉庫,沒有一個(gè)操作員。京東在昆山已經(jīng)有一個(gè)無人分揀中心,分揀能力可以達(dá)到9000件/小時(shí),每個(gè)場地可以節(jié)省180人力,可以實(shí)現(xiàn)整個(gè)分揀大環(huán)節(jié)的全流程無人操作。
而今年7月份亮相的阿里巴巴無人超市,也讓我們看到了零售實(shí)體店的未來。配合刷臉支付,試想一下,未來,你去一家這樣的超市,刷一下臉,然后挑選商品,出門、抬頭、支付、走人?,F(xiàn)在看來這樣可能是一件很裝X的事情,但是未來,有沒有可能大家都習(xí)以為常。
用馬老師的話說,未來,中國每天的物流量可能都能到達(dá)現(xiàn)在雙十一的流量。所以,人工智能的應(yīng)用已經(jīng)是大勢所趨,可以減少大量的人工重復(fù)性工作,并且還能幫助人類完成優(yōu)化決策。
教育:
我們都知道,大班教育沒有小班教育好,而小班教育沒有私教好。而,當(dāng)人工智能應(yīng)用到教育行業(yè)時(shí),我們將較容易得體驗(yàn)到這些昂貴的私教服務(wù)。為用戶構(gòu)建私人的知識圖譜,讓用戶更容易地、更準(zhǔn)確地發(fā)現(xiàn)適合自己的內(nèi)容。
美國紅雀模擬器公司推出的紅雀FMX型全動(dòng)飛行訓(xùn)練裝置經(jīng)過了美國美國航空管理局(FAA)認(rèn)證,價(jià)值幾千萬美金的模擬機(jī)。 中航國際曾采用這款飛行器訓(xùn)練我國飛行員。
而,模擬機(jī)和真機(jī)的飛行感覺沒有差別, 并且,模擬機(jī)的訓(xùn)練更為便捷。
模擬飛行器
通過大數(shù)據(jù)+人工智能,機(jī)器人可以幫助我們更好地報(bào)考志愿,現(xiàn)在已經(jīng)有很多這樣的收費(fèi)產(chǎn)品。輸入文理專業(yè)、分?jǐn)?shù)、生源地,就可以幫你推薦合適的學(xué)校和專業(yè)。并且,我覺得,通過往年的數(shù)據(jù),不摻雜感情地預(yù)測,可能更加準(zhǔn)確客觀。并且,最大的優(yōu)點(diǎn)是:可以更快、更準(zhǔn)確、更全面地得到所有的選擇可能。
安防:
安防領(lǐng)域之前已經(jīng)說過很多了。想想,以前是需要人在那里盯著屏幕一直看,而人還需要休息,有時(shí)也會走神。但是,機(jī)器只要運(yùn)行程序就行,只要程序沒有問題,機(jī)器就可以一直工作。所以,AI在安防領(lǐng)域的應(yīng)用也確實(shí)大大解放了很多勞動(dòng)力。
上面的應(yīng)用可以是實(shí)時(shí)的,作為預(yù)警作用;也可以是在刑偵辦案時(shí),幫助警方更快速地找到可疑目標(biāo)。
金融:
金融行業(yè)對人工智能的青睞其實(shí)很早就開始了。
1969年,愛德華·索普利利用他發(fā)明的”科學(xué)股票市場系統(tǒng)”(實(shí)際上是一種股票權(quán)證定價(jià)模型),和里根合伙成立了第一個(gè)量化投資基金——可轉(zhuǎn)換對沖合伙基金。
而,近幾年,從海外到國內(nèi),智能投顧也開始興起。2016年也被稱為中國智能投顧的元年。
通過大數(shù)據(jù)+人工智能的技術(shù),可以讓用戶最大概率的獲得收益,這和金融的本質(zhì),控制分險(xiǎn)是一致的。并且,機(jī)器在面對金融時(shí),是不會有貪婪之意的,有非常大的優(yōu)勢。所以,人工智能未來還是會成為金融從業(yè)者最有力的決策工具。
除了,投資方面,人工智能技術(shù)也開始深入到了金融中的方方面面。
- 刷臉支付已經(jīng)慢慢地開始進(jìn)入到商用時(shí)代。
- 在后臺的每一筆支付中,人工智能都在計(jì)算操作的安全性,保障我們的賬戶安全。(我們在外地、或新?lián)Q手機(jī)支付時(shí),有時(shí)會需要短信驗(yàn)證碼。而在常住地,大部分時(shí)間都不需要。)
個(gè)性化推薦,也在金融獲客中起到了重要的作用。如今的很多信貸產(chǎn)品,你只需要輸入一些個(gè)人信息,金融機(jī)構(gòu)就可以迅速地計(jì)算出一個(gè)合理的信貸額度。
保險(xiǎn)產(chǎn)品琳瑯滿目,而現(xiàn)在的產(chǎn)品,也可以根據(jù)你購買行為,資產(chǎn)配置情況等,進(jìn)行個(gè)性化推薦保險(xiǎn)。
交通:
- 自動(dòng)駕駛,大家可能覺得就是自動(dòng)駕駛小轎車,而如今,自動(dòng)駕駛所應(yīng)用的程度更加廣泛:目前、包括Google、蘋果、百度、樂視、Nvidia、Uber、福特、通用、特斯拉、奧迪、豐田、日產(chǎn)、本田、現(xiàn)代、奔馳、寶馬、奧迪、Faraday Future、BOSCH、沃爾沃等眾多科技或汽車廠商都已經(jīng)在研究和測試自動(dòng)駕駛。
- 2017年8月中旬,中國中車研發(fā)的全球首款12米“無人駕駛”智能客車初次上路,在3公里的運(yùn)行測試中表現(xiàn)出色。
- 在深圳市2017年“公交出行宣傳周及無車日”活動(dòng)啟動(dòng)儀式上,深圳巴士集團(tuán)董事長余鋼透露,他們正在與國家智能運(yùn)輸技術(shù)中心、華為公司等合作,共同研發(fā)無人駕駛技術(shù),2017年年底將在深圳市南科大等處試驗(yàn)推出2條無人駕駛路線。、
- 近日,Rio Tinto公司宣布其生產(chǎn)的火車已經(jīng)完成了首個(gè)無人駕駛?cè)蝿?wù),它實(shí)現(xiàn)近100公里無人駕駛。Rio Tinto希望在2018年年底之前擁有一個(gè)完全自主的列車網(wǎng)絡(luò)。
看看以上的一些咨詢和新聞,現(xiàn)在自動(dòng)駕駛確實(shí)是百家爭鳴,應(yīng)用廣泛。不出意外,未來,自助駕駛就會進(jìn)入我們的生活了。大膽設(shè)想,如果自動(dòng)駕駛非常成熟,成為了主要駕駛方式,未來的車禍率是不是會減少很多,而且也完美的解決了酒駕問題。
各廠商無人車集錦
其他的,智能交通燈系統(tǒng),根據(jù)對路上車流量的檢測和整個(gè)城市交通的情況分析,自動(dòng)控制并調(diào)節(jié)交通信號燈的轉(zhuǎn)變。
還有無人機(jī)的應(yīng)用,除了無人機(jī)航拍之外,我們還可以利用無人機(jī)送貨,也可以進(jìn)行特殊環(huán)境下的災(zāi)難救援等等。
醫(yī)療健康:
人工智能在醫(yī)療領(lǐng)域的應(yīng)用意義十分重大。目前,很多疾病都是由于發(fā)現(xiàn)不及時(shí),而導(dǎo)致死亡等等。而,我們在體檢的時(shí)候,一些細(xì)小的指標(biāo)或者醫(yī)學(xué)影像醫(yī)生很難發(fā)現(xiàn)。此時(shí),人工智能便可以替代人力做這樣一件繁瑣、重復(fù),但十分有意義的工作。這可以輔助醫(yī)生做診斷,減少誤診率,漏診率。
在老年看護(hù)方面,我們可以在老年人身上放置一些傳感器,通過對數(shù)據(jù)的實(shí)時(shí)監(jiān)測,來完成對老年人的看護(hù)。
目前很多公司都開始提供基因檢測服務(wù),基本的檢測在1000元以內(nèi),通過人工智能技術(shù),我們可以在基因檢測之后做進(jìn)一步的診斷。
還有智能診斷,醫(yī)療機(jī)器人、康復(fù)機(jī)器人等應(yīng)用產(chǎn)品。
不過目前,這些應(yīng)用都處在初期階段。很多產(chǎn)品都無法大規(guī)模的商用,而有的還處在實(shí)驗(yàn)室階段。但是,未來,人工智能作為醫(yī)生最好的決策助手,指日可待。
其他:
Alpha Go 已經(jīng)火得不要不要的。
Camera Effects:
facebook在2017年F8大會上發(fā)布的AR平臺。讓相機(jī)成為變成一個(gè)AR平臺,可以給人臉添加配飾,通過AR換裝,在實(shí)物上涂鴉等等。并且它的意義在于,這將是一個(gè)開放式的平臺,全球的發(fā)布者都可以講自己創(chuàng)造的素材發(fā)布到平臺里,讓傳統(tǒng)的AR添加素材更加多元化。
LipNet:
由牛津大學(xué)人工智能實(shí)驗(yàn)室,谷歌DeepMind和CIFAR聯(lián)合發(fā)布的一篇論文。該文介紹了利用機(jī)器學(xué)習(xí)實(shí)現(xiàn)語句層面的自動(dòng)唇讀技術(shù)。結(jié)論顯示,在GIRID預(yù)料庫上,LipNet實(shí)現(xiàn)了93.4%的準(zhǔn)確度,超過了經(jīng)驗(yàn)豐富的人類唇讀者和之前的79.6%的最佳準(zhǔn)確度;并且,這一文本轉(zhuǎn)換的速度幾乎是實(shí)時(shí)的。
雖然這篇論文在學(xué)術(shù)界投稿上磕磕絆絆,但對于工業(yè)界是一個(gè)很好的應(yīng)用方向和工具。
百度尋人:
平臺致力于運(yùn)用百度的人臉識別技術(shù)更加快捷方便地幫助走失人員回歸家庭, 現(xiàn)已對接民政部全國救助尋親網(wǎng)中近3萬條走失人口信息,用戶可以上傳走失親人的照片進(jìn)行快速比對。并且,現(xiàn)已有成功尋人的案例,個(gè)人認(rèn)為十分有意義。
好了,終于通過【產(chǎn)品形式】和【行業(yè)應(yīng)用】這兩個(gè)角度介紹完了大部分的人工智能產(chǎn)品,不知道大家看到這里,是否覺得未來,就像蒸汽機(jī)帶來工業(yè)革命一樣, 深度學(xué)習(xí)的這波潮流即將要帶來人工智能時(shí)代?
我個(gè)人認(rèn)為,此言差矣,欲問為何,還看最后一節(jié)的總結(jié)分析。
在這一章節(jié)的最后,貼上目前AI領(lǐng)域的四大天王以示敬意,目前已有3人在工業(yè)界任職。
從左至右:Yann Lecun、Geoffrey Hinton、Yoshua Bengio、Andrew Ng(吳恩達(dá))
再次膜拜…
AI產(chǎn)品的今天和明天
首先總結(jié)一下AI產(chǎn)品的特點(diǎn):
1.目前成熟的AI技術(shù)偏向于基礎(chǔ)應(yīng)用,呈現(xiàn)工具化、零件化的形態(tài)。
2.在一些領(lǐng)域中,由于AI程序化的設(shè)計(jì),使得機(jī)器可以完全勝任一些重復(fù)性、繁雜的工作。解放人力,打破了傳統(tǒng)人力在自然、人體機(jī)能前的限制。
3.由于大數(shù)據(jù)的發(fā)展,在很多方面,人工智能通過大量地學(xué)習(xí)以往經(jīng)驗(yàn),在掌握大量信息的情況下,可以做出準(zhǔn)確率十分高的決策。而,與此同時(shí),人類可能無法像機(jī)器一樣考慮得全面。
4.想要應(yīng)用AI的行業(yè),必須要有大量的數(shù)據(jù)積累。也就是必須要有基礎(chǔ)業(yè)務(wù),而人工智能作為其中的一環(huán)或者工具依附在上,作為一種支持系統(tǒng)。
5.大的AI系統(tǒng)必須細(xì)分化,不斷拆解其技術(shù)問題,通過結(jié)合大量的、成熟的基礎(chǔ)AI應(yīng)用來完成整個(gè)AI系統(tǒng)任務(wù)。
個(gè)人認(rèn)為,以上總結(jié)的5條,體現(xiàn)了目前絕大多數(shù)AI產(chǎn)品的設(shè)計(jì)邏輯。
而我們從一些使用體驗(yàn)比較失敗的產(chǎn)品身上,得到的一些結(jié)論,會發(fā)現(xiàn)跟前面的一些特點(diǎn)會恰恰相反:
- AI所應(yīng)用的領(lǐng)域在之前沒有傳統(tǒng)的基礎(chǔ)業(yè)務(wù)做積淀,AI系統(tǒng)封閉性太強(qiáng),形成了單獨(dú)的閉環(huán)系統(tǒng)。
- 由于監(jiān)督學(xué)習(xí)的算法特點(diǎn)無法自學(xué)習(xí),AI系統(tǒng)不夠“聰明”,導(dǎo)致無法面對非常廣泛的、開放式的環(huán)境中產(chǎn)生的所有情況。
- 性價(jià)比低,由于AI算法的應(yīng)用,需要更高的硬件資源,而實(shí)際達(dá)到的效果與增長的價(jià)格不符合預(yù)期,價(jià)值低。
這里,如果再做進(jìn)一步的現(xiàn)象總結(jié)的話, 我們可以發(fā)現(xiàn):用戶體驗(yàn)不好的產(chǎn)品,都是屬于全新的產(chǎn)品鏈,并面向C端用戶的。這樣的產(chǎn)品幾乎占了上面的3條特點(diǎn)。而與行業(yè)內(nèi)數(shù)據(jù)儲備龐大、業(yè)務(wù)經(jīng)驗(yàn)豐厚、2C端產(chǎn)品成熟的B端廠商相結(jié)合,提供底層的AI技術(shù)支持,是目前最成功的商業(yè)模式。
以上3條是目前一些真的人工智能產(chǎn)品出現(xiàn)的一些問題,注意,這里說的是真正的人工智能產(chǎn)品。這里我們可以看兩則消息:
康奈爾大學(xué)的研究人員對Siri、Google Assistant、度秘等人工智能語音助手進(jìn)行了智商測試。這項(xiàng)研究仍在進(jìn)行之中,但最新公布的結(jié)果顯示:Google Assistant的IQ為47.28,略低于6歲兒童的智商。而Siri則是23.9,大幅落后于后者。
Geoffrey Hinton對人工智能的未來非常擔(dān)憂,在最近的一次人工智能會議上,Hinton表示自己對于反向傳播[非常懷疑],并提出【應(yīng)該拋棄它并重新開始】。
然而目前,反向傳播是監(jiān)督學(xué)習(xí)的核心,也是深度學(xué)習(xí)不可或缺的一部分,但是,就像之前提到的,利用反向傳播調(diào)整模型,可能AI永遠(yuǎn)無法達(dá)到【強(qiáng)】人工智能。
接下來,想說,其實(shí)AI到目前為止最主要的就兩個(gè)作用:
- 將人類從繁雜的、重復(fù)的工作中解脫出來。
- 通過目前已知的情況,幫助人類做出決策。
如果說大部分成功的產(chǎn)品都講究一個(gè)社會階段和環(huán)境養(yǎng)分的話,那么,現(xiàn)在的AI產(chǎn)品在設(shè)計(jì)時(shí),應(yīng)該本著這兩條去考慮。而那些我們感覺到不盡如人意的AI產(chǎn)品,大都是沒有按照這兩條的意圖去設(shè)計(jì)的。
對于“AI會讓很多人失業(yè)”,“有可能威脅到人類”等反AI的觀點(diǎn), 我還是持相反意見的。我們的老祖先很早就說過:【以史為鑒】。只是當(dāng)時(shí)沒有存儲數(shù)據(jù)的機(jī)制,沒有相應(yīng)的計(jì)算算法,更沒有計(jì)算的機(jī)器。否則人工智能可能會更早的出現(xiàn)。而現(xiàn)在,這些條件都已具備,我們?yōu)槭裁床淮竽懙負(fù)肀亍?/p>
想想,我們可以利用多年積累的數(shù)據(jù)和經(jīng)驗(yàn),代替很多重復(fù)性的工作。我們可以利用存儲量大于常人的機(jī)器,幫助我們記住很多信息并作出決策建議。這,并不是機(jī)器威脅人類的方式,而是人類利用機(jī)器,解放自己,從而走向更加快速發(fā)展的道路。
好了,最后了。我們聊聊未來。
其實(shí)就是一句話:理智、客觀地看待人工智能的潮起潮落。
人工智能已經(jīng)經(jīng)歷過了兩次寒冬,這里,有資本過熱地毒害,也有學(xué)術(shù)無法繼續(xù)前進(jìn)的問題,可能最冷的Winter is coming. 當(dāng)監(jiān)督學(xué)習(xí)無法滿足一些任務(wù),而,新的學(xué)術(shù)方法還未能出現(xiàn)解決時(shí),可能最后一次寒冬就來了。
不過,可能大家會拋棄現(xiàn)在的算法和網(wǎng)絡(luò),但是,人工智能時(shí)代終究會到來,因?yàn)槿祟惤K將會用工具代替現(xiàn)在的自己,并開始從事其他更有意義的工作??萍加肋h(yuǎn)會向前走的,人類也需要更多的人力去轉(zhuǎn)動(dòng)歷史的車輪,去完成更有意義的事情。(這里套用一下我本科高數(shù)謝老師的一句課上名言)
人類的出現(xiàn)就是為了揭上帝的底牌。
雖然,可能前景一片美好,但是路漫漫,高低坑洼還有迷霧。資本需要和市場一樣理智;創(chuàng)業(yè)者也需要在做人工智能時(shí),牢牢依附著傳統(tǒng)行業(yè),少一些【強(qiáng)】人工智能的夢想,多一點(diǎn)細(xì)分化場景的創(chuàng)造。人工智能的基礎(chǔ)技術(shù)已經(jīng)十分成熟,在各行各業(yè)中都有應(yīng)用的條件,可能,現(xiàn)在只需要一個(gè)靠譜、新穎的idea.
而,目前,我們需要做的,了解人工智能技術(shù)的邊界,深入行業(yè)研究具體業(yè)務(wù),最后,架起一座又一座橋梁。
當(dāng)然,這里我們不可能一番風(fēng)順,可能會在數(shù)據(jù)獲取、數(shù)據(jù)清洗、制作數(shù)據(jù)標(biāo)簽時(shí)等等環(huán)節(jié)中遇到困難。但是,歷史的責(zé)任,需要無數(shù)的AI從業(yè)者去理智地推動(dòng)這件事。
作為一個(gè)還沒有怎么經(jīng)歷社會歷練的小鮮肉,居然在最后一章節(jié),說了這么多裝X、預(yù)測、總結(jié)的話。還望,各位看官大佬包涵。不過,希望自己能夠從事到這樣的一件事情中去。
文中如果有錯(cuò)誤,希望能批評指出,也歡迎與您一起討論。
本文由 @~永遠(yuǎn)的一號~ 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Pixabay,基于CC0協(xié)議
- 目前還沒評論,等你發(fā)揮!