人工智能與設(shè)計(jì)(1):人工智能的發(fā)展和定義
本文是主題為“人工智能與設(shè)計(jì)”系列文章的第一篇,主要講述現(xiàn)在人工智能的基礎(chǔ)知識(shí),enjoy~
今年年初出于個(gè)人興趣,我開始了對(duì)人工智能的研究。為了更好理解人工智能和設(shè)計(jì)的關(guān)系,我開始學(xué)習(xí)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、Alexa開發(fā)等知識(shí),從當(dāng)初覺得人工智能只會(huì)讓大部分設(shè)計(jì)師失業(yè),到現(xiàn)在覺得人工智能只是一個(gè)設(shè)計(jì)的輔助工具,也算是成長(zhǎng)了不少。
這次希望能將積累的知識(shí)寫成一本電子書,沒別的,因?yàn)樽痔?,更重要的是這樣很酷。由寫作時(shí)間可能太長(zhǎng),互聯(lián)網(wǎng)每天都在變化,一些比較前沿的思考可能轉(zhuǎn)眼成為現(xiàn)實(shí),所以先把前四章陸續(xù)發(fā)出來。
前四章主要講了現(xiàn)在人工智能的基礎(chǔ)知識(shí)、底層設(shè)計(jì)、互聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)以及人工智能與設(shè)計(jì)的關(guān)系,后面會(huì)通過3~4章詳細(xì)分析人工智能對(duì)不同行業(yè)設(shè)計(jì)的影響,目前考慮的領(lǐng)域是室內(nèi)設(shè)計(jì)、公共設(shè)計(jì)和服務(wù)設(shè)計(jì)。
人工智能的發(fā)展歷史
說起人工智能這詞,不得不提及人工智能的歷史。人工智能的概念主要由Alan Turing提出:機(jī)器會(huì)思考嗎?如果一臺(tái)機(jī)器能夠與人類對(duì)話而不被辨別出其機(jī)器的身份,那么這臺(tái)機(jī)器具有智能的特征。同年,Alan Turing還預(yù)言了存有一定的可能性可以創(chuàng)造出具有真正智能的機(jī)器。
說明:Alan Turing(1912.6.23-1954.6.7)曾協(xié)助英國(guó)軍隊(duì)破解了德國(guó)的著名密碼系統(tǒng)Enigma,幫助盟軍取得了二戰(zhàn)的勝利。因提出一種用于判定機(jī)器是否具有智能的試驗(yàn)方法,即圖靈試驗(yàn),被后人稱為計(jì)算機(jī)之父和人工智能之父。
AI誕生
1956年,在達(dá)特茅斯學(xué)院舉行的一次會(huì)議上,不同領(lǐng)域(數(shù)學(xué),心理學(xué),工程學(xué),經(jīng)濟(jì)學(xué)和政治學(xué))的科學(xué)家正式確立了人工智能為研究學(xué)科。
2006年達(dá)特茅斯會(huì)議當(dāng)事人重聚,左起:Trenchard More、John McCarthy、Marvin? Minsky、Oliver Selfridge、Ray Solomonoff
第一次發(fā)展高潮(1955年—1974年)
達(dá)特茅斯會(huì)議之后是大發(fā)現(xiàn)的時(shí)代。對(duì)很多人來講,這一階段開發(fā)出來的程序堪稱神奇:計(jì)算機(jī)可以解決代數(shù)應(yīng)用題、證明幾何定理、學(xué)習(xí)和使用英語。在眾多研究當(dāng)中,搜索式推理、自然語言、微世界在當(dāng)時(shí)最具影響力。
大量成功的AI程序和新的研究方向不斷涌現(xiàn),研究學(xué)者認(rèn)為具有完全智能的機(jī)器將在二十年內(nèi)出現(xiàn)并給出了如下預(yù)言:
1958年,H. A. Simon,Allen Newell:“十年之內(nèi),數(shù)字計(jì)算機(jī)將成為國(guó)際象棋世界冠軍。”?“十年之內(nèi),數(shù)字計(jì)算機(jī)將發(fā)現(xiàn)并證明一個(gè)重要的數(shù)學(xué)定理?!?/p>
1965年,H. A. Simon:“二十年內(nèi),機(jī)器將能完成人能做到的一切工作?!?/p>
1967年,Marvin Minsky:“一代之內(nèi)……創(chuàng)造“人工智能”的問題將獲得實(shí)質(zhì)上的解決。”
1970年,Marvin Minsky:“在三到八年的時(shí)間里我們將得到一臺(tái)具有人類平均智能的機(jī)器?!?/p>
美國(guó)政府向這一新興領(lǐng)域投入了大筆資金,每年將數(shù)百萬美元投入到麻省理工學(xué)院、卡耐基梅隆大學(xué)、愛丁堡大學(xué)和斯坦福大學(xué)四個(gè)研究機(jī)構(gòu),并允許研究學(xué)者去做任何感興趣的方向。
當(dāng)時(shí)主要成就:
- 人工神經(jīng)網(wǎng)絡(luò)在30-50年代被提出,1951年Marvin Minsky制造出第一臺(tái)神經(jīng)網(wǎng)絡(luò)機(jī)
- 貝爾曼公式(增強(qiáng)學(xué)習(xí)雛形)被提出
- 感知器(深度學(xué)習(xí)雛形)被提出
- 搜索式推理被提出
- 自然語言被提出
- 首次提出人工智能擁有模仿智能的特征,懂得使用語言,懂得形成抽象概念并解決人類現(xiàn)存問題
- Arthur Samuel在五十年代中期和六十年代初開發(fā)的國(guó)際象棋程序,棋力已經(jīng)可以挑戰(zhàn)具有相當(dāng)水平的業(yè)余愛好者
- 機(jī)器人SHAKEY項(xiàng)目受到了大力宣傳,它能夠?qū)ψ约旱男袨檫M(jìn)行“推理”;人們將其視作世界上第一臺(tái)通用機(jī)器人
- 微世界的提出
第一次寒冬(1974年—1980年)
70年代初,AI遭遇到瓶頸。研究學(xué)者逐漸發(fā)現(xiàn),雖然機(jī)器擁有了簡(jiǎn)單的邏輯推理能力,但遭遇到當(dāng)時(shí)無法克服的基礎(chǔ)性障礙,AI停留在“玩具”階段止步不前,遠(yuǎn)遠(yuǎn)達(dá)不到曾經(jīng)預(yù)言的完全智能。由于此前的過于樂觀使人們期待過高,當(dāng)AI研究人員的承諾無法兌現(xiàn)時(shí),公眾開始激烈批評(píng)AI研究人員,許多機(jī)構(gòu)不斷減少對(duì)人工智能研究的資助,直至停止撥款。
當(dāng)時(shí)主要問題:
- 計(jì)算機(jī)運(yùn)算能力遭遇瓶頸,無法解決指數(shù)型爆炸的復(fù)雜計(jì)算問題
- 常識(shí)和推理需要大量對(duì)世界的認(rèn)識(shí)信息,計(jì)算機(jī)達(dá)不到“看懂”和“聽懂”的地步
- 無法解決莫拉維克悖論
- 無法解決部分涉及自動(dòng)規(guī)劃的邏輯問題
- 神經(jīng)網(wǎng)絡(luò)研究學(xué)者遭遇冷落
說明:莫拉維克悖論:如果機(jī)器像數(shù)學(xué)天才一樣下象棋,那么它能模仿嬰兒學(xué)習(xí)又有多難呢?然而,事實(shí)證明這是相當(dāng)難的。
第二次發(fā)展高潮(1980年—1987年)
80年代初,一類名為“專家系統(tǒng)”的AI程序開始為全世界的公司所采納,人工智能研究迎來了新一輪高潮。在這期間,卡耐基梅隆大學(xué)為DEC公司設(shè)計(jì)的XCON專家系統(tǒng)能夠每年為DEC公司節(jié)省數(shù)千萬美金。日本經(jīng)濟(jì)產(chǎn)業(yè)省撥款八億五千萬美元支持第五代計(jì)算機(jī)項(xiàng)目。其目標(biāo)是造出能夠與人對(duì)話、翻譯語言、解釋圖像、能夠像人一樣推理的機(jī)器。其他國(guó)家也紛紛作出了響應(yīng),并對(duì)AI和信息技術(shù)的大規(guī)模項(xiàng)目提供了巨額資助。
說明:專家系統(tǒng)是一種程序,能夠依據(jù)一組從專門知識(shí)中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。由于專家系統(tǒng)僅限于一個(gè)很小的領(lǐng)域,從而避免了常識(shí)問題?!爸R(shí)處理”隨之也成為了主流 AI 研究的焦點(diǎn)。
當(dāng)時(shí)主要成就:
- 專家系統(tǒng)的誕生
- AI研究人員發(fā)現(xiàn)智能可能需要建立在對(duì)分門別類的大量知識(shí)的多種處理方法之上
- BP算法實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的突破,神經(jīng)網(wǎng)絡(luò)研究學(xué)者重新受到關(guān)注
- AI研究人員首次提出:機(jī)器為了獲得真正的智能,機(jī)器必須具有軀體,它需要有感知、移動(dòng)、生存,與這個(gè)世界交互的能力。感知運(yùn)動(dòng)技能對(duì)于常識(shí)推理等高層次技能是至關(guān)重要的,基于對(duì)事物的推理能力比抽象能力更為重要,這也促進(jìn)了未來自然語言、機(jī)器視覺的發(fā)展。
第二次寒冬(1987年—1993年)
1987年,AI硬件的市場(chǎng)需求突然下跌。科學(xué)家發(fā)現(xiàn),專家系統(tǒng)雖然很有用,但它的應(yīng)用領(lǐng)域過于狹窄,而且更新迭代和維護(hù)成本非常高。同期美國(guó)Apple和IBM生產(chǎn)的臺(tái)式機(jī)性能不斷提升,個(gè)人電腦的理念不斷蔓延;日本人設(shè)定的“第五代工程”最終也沒能實(shí)現(xiàn)。人工智能研究再次遭遇了財(cái)政困難,一夜之間這個(gè)價(jià)值五億美元的產(chǎn)業(yè)土崩瓦解。
當(dāng)時(shí)主要問題:
- 受到臺(tái)式機(jī)和“個(gè)人電腦”理念的沖擊影響
- 商業(yè)機(jī)構(gòu)對(duì)AI的追捧和冷落,使AI化為泡沫并破裂
- 計(jì)算機(jī)性能瓶頸仍無法突破
- 仍然缺乏海量數(shù)據(jù)訓(xùn)練機(jī)器
第三次發(fā)展高潮(1993年至今)
在摩爾定律下,計(jì)算機(jī)性能不斷突破。云計(jì)算、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、自然語言和機(jī)器視覺等領(lǐng)域發(fā)展迅速,人工智能迎來第三次高潮。
摩爾定律起始于Gordon Moore在1965年的一個(gè)預(yù)言,當(dāng)時(shí)他看到因特爾公司做的幾款芯片,覺得18到24個(gè)月可以把晶體管體積縮小一半,個(gè)數(shù)可以翻一番,運(yùn)算處理能力能翻一倍。沒想到這么一個(gè)簡(jiǎn)單的預(yù)言成真了,下面幾十年一直按這個(gè)節(jié)奏往前走,成為了摩爾定律。
主要事件:
- 1997年:IBM的國(guó)際象棋機(jī)器人深藍(lán)戰(zhàn)勝國(guó)際象棋世界冠軍卡斯帕羅夫
- 2005年:Stanford開發(fā)的一臺(tái)機(jī)器人在一條沙漠小徑上成功地自動(dòng)行駛了131英里,贏得了DARPA挑戰(zhàn)大賽頭獎(jiǎng);
- 2006年:Geoffrey Hinton提出多層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法;Eric Schmidt在搜索引擎大會(huì)提出“云計(jì)算”概念
- 2010年:Sebastian Thrun領(lǐng)導(dǎo)的谷歌無人駕駛汽車曝光,創(chuàng)下了超過16萬千米無事故的紀(jì)錄
- 2011年:IBM Waston參加智力游戲《危險(xiǎn)邊緣》,擊敗最高獎(jiǎng)金得主Brad Rutter和連勝紀(jì)錄保持者Ken Jennings;蘋果發(fā)布語音個(gè)人助手Siri;Nest Lab發(fā)布第一代智能恒溫器Nest。它可以了解用戶的習(xí)慣,并相應(yīng)自動(dòng)地調(diào)節(jié)溫度
- 2012年:Google發(fā)布個(gè)人助理Google Now
- 2013年:深度學(xué)習(xí)算法在語音和視覺識(shí)別率獲得突破性進(jìn)展
- 2014年:微軟亞洲研究院發(fā)布人工智能小冰聊天機(jī)器人和語音助手Cortana;百度發(fā)布Deep Speech語音識(shí)別系統(tǒng)
- 2015年:Facebook發(fā)布了一款基于文本的人工智能助理“M”
- 2016年:Google AlphaGo以比分4:1戰(zhàn)勝圍棋九段棋手李世石;Chatbots這個(gè)概念開始流行;Google發(fā)布為機(jī)器學(xué)習(xí)定制的第一代專用芯片TPU;Google發(fā)布語音助手Assistant
- 2017年:AlphaGO在圍棋網(wǎng)絡(luò)對(duì)戰(zhàn)平臺(tái)以60連勝擊敗世界各地高手;Google 開源深度學(xué)習(xí)系統(tǒng)Tensorflow 1.0正式發(fā)布;Google AlphaGo以比分3:0完勝世界第一圍棋九段棋手柯潔;默默深耕機(jī)器學(xué)習(xí)和機(jī)器視覺的蘋果在WWDC上發(fā)布Core ML,ARKit等組件;Google發(fā)布了ARCore SDK;百度AI開發(fā)者大會(huì)正式發(fā)布Dueros語音系統(tǒng),無人駕駛平臺(tái)Apollo1.0自動(dòng)駕駛平臺(tái);華為發(fā)布全球第一款A(yù)I移動(dòng)芯片麒麟970;iPhone X配備前置 3D 感應(yīng)攝像頭(TrueDepth),臉部識(shí)別點(diǎn)達(dá)到3W個(gè),具備人臉識(shí)別、解鎖和支付等功能;配備的A11 Bionic神經(jīng)引擎使用雙核設(shè)計(jì),每秒可達(dá)到運(yùn)算6000億次
很多專家學(xué)者對(duì)此次人工智能浪潮給予了肯定,認(rèn)為這次人工智能浪潮能引起第四次工業(yè)革命。人工智能逐漸開始在保險(xiǎn),金融等領(lǐng)域開始滲透,在未來健康醫(yī)療、交通出行、銷售消費(fèi)、金融服務(wù)、媒介娛樂、生產(chǎn)制造,到能源、石油、農(nóng)業(yè)、政府……所有垂直產(chǎn)業(yè)都將因人工智能技術(shù)的發(fā)展而受益,那么我們現(xiàn)在講的人工智能究竟是什么?
人工智能是什么?
在60年代,AI研究人員認(rèn)為人工智能是一臺(tái)通用機(jī)器人,它擁有模仿智能的特征,懂得使用語言,懂得形成抽象概念,能夠?qū)ψ约旱男袨檫M(jìn)行推理,它可以解決人類現(xiàn)存問題。由于理念、技術(shù)和數(shù)據(jù)的限制,人工智能在模式識(shí)別、信息表示、問題解決和自然語言處理等不同領(lǐng)域發(fā)展緩慢。
80年代,AI研究人員轉(zhuǎn)移方向,認(rèn)為人工智能對(duì)事物的推理能力比抽象能力更重要,機(jī)器為了獲得真正的智能,機(jī)器必須具有軀體,它需要感知、移動(dòng)、生存,與這個(gè)世界交互。為了積累更多推理能力,AI研究人員開發(fā)出專家系統(tǒng),它能夠依據(jù)一組從專門知識(shí)中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。
1997年,IBM的超級(jí)計(jì)算機(jī)深藍(lán)在國(guó)際象棋領(lǐng)域完勝整個(gè)人類代表卡斯帕羅夫;相隔20年,Google的AlphaGo在圍棋領(lǐng)域完勝整個(gè)人類代表柯潔。劃時(shí)代的事件使大部分AI研究人員確信人工智能的時(shí)代已經(jīng)降臨。
可能大家覺得國(guó)際象棋和圍棋好像沒什么區(qū)別,其實(shí)兩者的難度不在同一個(gè)級(jí)別。國(guó)際象棋走法的可能性雖多,但棋盤的大小和每顆棋子的規(guī)則大大限制了贏的可能性。深藍(lán)可以通過蠻力看到所有的可能性,而且只需要一臺(tái)計(jì)算機(jī)基本上就可以搞定。相比國(guó)際象棋,圍棋很不一樣。圍棋布局走法的可能性可能要比宇宙中的原子數(shù)量還多,幾十臺(tái)計(jì)算機(jī)的計(jì)算能力都搞不定,所以機(jī)器下圍棋想贏非常困難,包括圍棋專家和人工智能領(lǐng)域的專家們也紛紛斷言:計(jì)算機(jī)要在圍棋領(lǐng)域戰(zhàn)勝人類棋手,還要再等100年。結(jié)果機(jī)器真的做到了,并據(jù)說AlphaGo擁有圍棋十幾段的實(shí)力(目前圍棋棋手最高是9段)。
那么深藍(lán)和AlphaGo在本質(zhì)上有什么區(qū)別?簡(jiǎn)單點(diǎn)說,深藍(lán)的代碼是研究人員編程的,知識(shí)和經(jīng)驗(yàn)也是研究人員傳授的,所以可以認(rèn)為與卡斯帕羅夫?qū)?zhàn)的深藍(lán)的背后還是人類,只不過它的運(yùn)算能力比人類更強(qiáng),更少失誤。而AlphaGo的代碼是自我更新的,知識(shí)和經(jīng)驗(yàn)是自我訓(xùn)練出來的。與深藍(lán)不一樣的是,AlphaGo擁有兩顆大腦,一顆負(fù)責(zé)預(yù)測(cè)落子的最佳概率,一顆做整體的局面判斷,通過兩顆大腦的協(xié)同工作,它能夠判斷出未來幾十步的勝率大小。所以與柯潔對(duì)戰(zhàn)的AlphaGo的背后是通過十幾萬盤的海量訓(xùn)練后,擁有自主學(xué)習(xí)能力的人工智能系統(tǒng)。
這時(shí)候社會(huì)上出現(xiàn)了不同的聲音:“人工智能會(huì)思考并解決所有問題”、“人工智能會(huì)搶走人類的大部分工作!”“人工智能會(huì)取代人類嗎?”那么已來臨的人工智能究竟是什么?
人工智能目前有兩個(gè)定義,分別為強(qiáng)人工智能和弱人工智能。
普通群眾所遐想的人工智能屬于強(qiáng)人工智能,它屬于通用型機(jī)器人,也就是60年代AI研究人員提出的理念。它能夠和人類一樣對(duì)世界進(jìn)行感知和交互,通過自我學(xué)習(xí)的方式對(duì)所有領(lǐng)域進(jìn)行記憶、推理和解決問題。這樣的強(qiáng)人工智能需要具備以下能力:
- 存在不確定因素時(shí)進(jìn)行推理,使用策略,解決問題,制定決策的能力
- 知識(shí)表示的能力,包括常識(shí)性知識(shí)的表示能力
- 規(guī)劃能力
- 學(xué)習(xí)能力
- 使用自然語言進(jìn)行交流溝通的能力
- 將上述能力整合起來實(shí)現(xiàn)既定目標(biāo)的能力
說明:以上結(jié)論借鑒李開復(fù)所著的《人工智能》一書。
這些能力在常人看來都很簡(jiǎn)單,因?yàn)樽约憾季邆渲坏捎诩夹g(shù)的限制,計(jì)算機(jī)很難具備以上能力,這也是為什么現(xiàn)階段人工智能很難達(dá)到常人思考的水平。
由于技術(shù)未成熟,現(xiàn)階段的人工智能屬于弱人工智能,還達(dá)不到大眾所遐想的強(qiáng)人工智能。弱人工智能也稱限制領(lǐng)域人工智能或應(yīng)用型人工智能,指的是專注于且只能解決特定領(lǐng)域問題的人工智能,例如AlphaGo,它自身的數(shù)學(xué)模型只能解決圍棋領(lǐng)域的問題,可以說它是一個(gè)非常狹小領(lǐng)域問題的專家系統(tǒng),以及它很難擴(kuò)展到稍微寬廣一些的知識(shí)領(lǐng)域,例如如何通過一盤棋表達(dá)出自己的性格和靈魂。
弱人工智能和強(qiáng)人工智能在能力上存在著巨大鴻溝,弱人工智能想要進(jìn)一步發(fā)展,必須具備以下能力:
- 跨領(lǐng)域推理
- 擁有抽象能力
- “知其然,也知其所以然”
- 擁有常識(shí)
- 擁有審美能力
- 擁有自我意識(shí)和情感
說明:以上結(jié)論借鑒李開復(fù)所著的《人工智能》一書。
在計(jì)算機(jī)理念來說,人工智能是用來處理不確定性以及管理決策中的不確定性。意思是通過一些不確定的數(shù)據(jù)輸入來進(jìn)行一些具有不確定性的決策。從目前的技術(shù)實(shí)現(xiàn)來說,人工智能就是深度學(xué)習(xí),它是06年由Geoffrey Hinton所提出的機(jī)器學(xué)習(xí)算法,該算法可以使程序擁有自我學(xué)習(xí)和演變的能力。
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是什么?
機(jī)器學(xué)習(xí)簡(jiǎn)單點(diǎn)說就是通過一個(gè)數(shù)學(xué)模型將大量數(shù)據(jù)中有用的數(shù)據(jù)和關(guān)系挖掘出來。機(jī)器學(xué)習(xí)建模采用了以下四種方法:
- 監(jiān)督學(xué)習(xí)與數(shù)學(xué)中的函數(shù)有關(guān)。它需要研究學(xué)者不斷地標(biāo)注數(shù)據(jù)從而提高模型的準(zhǔn)確性,挖掘出數(shù)據(jù)間的關(guān)系并給出結(jié)果。
- 非監(jiān)督學(xué)習(xí)與現(xiàn)實(shí)中的描述(例如哪些動(dòng)物有四條腿)有關(guān)。它可以在沒有額外信息的情況下,從原始數(shù)據(jù)中提取模式和結(jié)構(gòu)的任務(wù),它與需要標(biāo)簽的監(jiān)督學(xué)習(xí)相互對(duì)立。
- 半監(jiān)督學(xué)習(xí),它可以理解為監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的結(jié)合。
- 增強(qiáng)學(xué)習(xí),它的大概意思是通過聯(lián)想并對(duì)比未來幾步所帶來的好處而決定下一步是什么。
目前機(jī)器學(xué)習(xí)以監(jiān)督學(xué)習(xí)為主。
深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)下面的一條分支。它能夠通過多層神經(jīng)網(wǎng)絡(luò)以及使用以上四種方法,不斷對(duì)自身模型進(jìn)行自我優(yōu)化,從而發(fā)現(xiàn)出更多優(yōu)質(zhì)的數(shù)據(jù)以及聯(lián)系。
目前的AlphaGo正是采用了深度學(xué)習(xí)算法擊敗了人類世界冠軍,更重要的是,深度學(xué)習(xí)促進(jìn)了人工智能其他領(lǐng)域如自然語言和機(jī)器視覺的發(fā)展。目前的人工智能的發(fā)展依賴深度學(xué)習(xí),這句話沒有任何問題。
人工智能基礎(chǔ)能力
在了解人工智能基礎(chǔ)能力前,我們先聊聊更底層的東西——數(shù)據(jù)。計(jì)算機(jī)數(shù)據(jù)分為兩種,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指具有預(yù)定義的數(shù)據(jù)模型的數(shù)據(jù),它的本質(zhì)是將所有數(shù)據(jù)標(biāo)簽化、結(jié)構(gòu)化,后續(xù)只要確定標(biāo)簽,數(shù)據(jù)就能讀取出來,這種方式容易被計(jì)算機(jī)理解。非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或者不完整,沒有預(yù)定義的數(shù)據(jù)模型的數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)格式多樣化,包括了圖片、音頻、視頻、文本、網(wǎng)頁(yè)等等,它比結(jié)構(gòu)化信息更難標(biāo)準(zhǔn)化和理解。
音頻、圖片、文本、視頻這四種載體可以承載著來自世界萬物的信息,人類在理解這些內(nèi)容時(shí)毫不費(fèi)勁;對(duì)于只懂結(jié)構(gòu)化數(shù)據(jù)的計(jì)算機(jī)來說,理解這些非結(jié)構(gòu)化內(nèi)容比登天還難,這也就是為什么人與計(jì)算機(jī)交流時(shí)非常費(fèi)勁。
全世界有80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),人工智能想要達(dá)到看懂、聽懂的狀態(tài),必須要把非結(jié)構(gòu)化數(shù)據(jù)這塊硬骨頭啃下來。學(xué)者在深度學(xué)習(xí)的幫助下在這領(lǐng)域取得了突破性成就,這成就為人工智能其他各種能力奠定了基礎(chǔ)。
如果將人工智能比作一個(gè)人,那么人工智能應(yīng)該具有記憶思考能力,輸入能力如視覺、聽覺、嗅覺、味覺以及觸覺,以及輸出能力如語言交流、軀體活動(dòng)。以上能力對(duì)相應(yīng)的術(shù)語為:深度學(xué)習(xí)、知識(shí)圖譜、遷移學(xué)習(xí)、自然語言處理、機(jī)器視覺、語音識(shí)別、語音合成(觸覺、嗅覺、味覺在技術(shù)研究上暫無商業(yè)成果,軀體活動(dòng)更多屬于機(jī)器人領(lǐng)域,不在文章中過多介紹)
簡(jiǎn)單點(diǎn)說,知識(shí)圖譜就是一張地圖。它從不同來源收集信息并加以整理,每個(gè)信息都是一個(gè)節(jié)點(diǎn),當(dāng)信息之間有關(guān)系時(shí),相關(guān)節(jié)點(diǎn)會(huì)建立起聯(lián)系,眾多信息節(jié)點(diǎn)逐漸形成了圖。知識(shí)圖譜有助于信息存儲(chǔ),更重要的是提高了搜索信息的速度和質(zhì)量。
遷移學(xué)習(xí)把已學(xué)訓(xùn)練好的模型參數(shù)遷移到新的模型來幫助新模型訓(xùn)練數(shù)據(jù)集。由于大部分領(lǐng)域都沒有足夠的數(shù)據(jù)量進(jìn)行模型訓(xùn)練,遷移學(xué)習(xí)可以將大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上,實(shí)現(xiàn)個(gè)性化遷移,如同人類思考時(shí)使用的類比推理。遷移學(xué)習(xí)有助于人工智能掌握更多知識(shí)。
自然語言處理是一門融語言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的學(xué)科,它是人工智能的耳朵-語音識(shí)別和嘴巴-語音合成的基礎(chǔ)。計(jì)算機(jī)能否理解人類的思想,首先要理解自然語言,其次擁有廣泛的知識(shí),以及運(yùn)用這些知識(shí)的能力。自然語言處理的主要范疇非常廣,包括了語音合成、語音識(shí)別、語句分詞、詞性標(biāo)注、語法分析、語句分析、機(jī)器翻譯、自動(dòng)摘要等等、問答系統(tǒng)等等。
機(jī)器視覺通過攝影機(jī)和計(jì)算機(jī)代替人的眼睛對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量,并進(jìn)一步對(duì)圖像進(jìn)行處理。這是一門研究如何使機(jī)器“看懂”的技術(shù),是人工智能最重要的輸入方式之一。如何通過攝像頭就能做到實(shí)時(shí)、準(zhǔn)確識(shí)別外界狀況,這是人工智能的瓶頸之一,深度學(xué)習(xí)在這方面幫了大忙?,F(xiàn)在熱門的人臉識(shí)別、無人駕駛等技術(shù)都依賴于機(jī)器視覺技術(shù)。
語音識(shí)別的目的是將人類的語音內(nèi)容轉(zhuǎn)換為相應(yīng)的文字。機(jī)器能否與人類自然交流的前提是機(jī)器能聽懂人類講什么,語音識(shí)別也是人工智能的最重要輸入方式之一。由于不同地區(qū)有著不同方言和口音,這對(duì)于語音識(shí)別來說都是巨大的挑戰(zhàn)。目前百度、科大訊飛等公司的語音識(shí)別技術(shù)在普通話上的準(zhǔn)確率已達(dá)到97%,但方言準(zhǔn)確率還有待提高。
目前大部分的語音合成技術(shù)是利用在數(shù)據(jù)庫(kù)內(nèi)的許多已錄好的語音連接起來,但由于缺乏對(duì)上下文的理解以及情感的表達(dá),朗讀效果很差。現(xiàn)在百度和科大訊飛等公司在語音合成上有新的成果:16年3月百度語音合成了張國(guó)榮聲音與粉絲互動(dòng);17年3月本邦科技利用科大訊飛的語音合成技術(shù),成功幫助小米手機(jī)實(shí)現(xiàn)了一款內(nèi)含“黑科技”的營(yíng)銷活動(dòng)H5。它們的主要技術(shù)是通過對(duì)張國(guó)榮、馬東的語音資料進(jìn)行語音識(shí)別,提取該人的聲紋和說話特征,再通過自然語言處理對(duì)講述的內(nèi)容進(jìn)行情緒識(shí)別,合成出來的語音就像本人在和你對(duì)話。新的語音合成技術(shù)不再被數(shù)據(jù)庫(kù)內(nèi)的錄音所限制語言和情感的表達(dá)。
經(jīng)過多年的人工智能研究,人工智能的主要發(fā)展方向分為:計(jì)算智能、感知智能、認(rèn)知智能,這一觀點(diǎn)也得到業(yè)界的廣泛認(rèn)可。
計(jì)算智能是以生物進(jìn)化的觀點(diǎn)認(rèn)識(shí)和模擬智能。有學(xué)者認(rèn)為,智能是在生物的遺傳、變異、生長(zhǎng)以及外部環(huán)境的自然選擇中產(chǎn)生的。在用進(jìn)廢退、優(yōu)勝劣汰的過程中,適應(yīng)度高的(頭腦)結(jié)構(gòu)被保存下來,智能水平也隨之提高。機(jī)器借助大自然規(guī)律的啟示設(shè)計(jì)出具有結(jié)構(gòu)演化能力和自適應(yīng)學(xué)習(xí)能力的智能。計(jì)算智能算法主要包括神經(jīng)計(jì)算、模糊計(jì)算和進(jìn)化計(jì)算三大部分,神經(jīng)網(wǎng)絡(luò)和遺傳算法的出現(xiàn),使得機(jī)器的運(yùn)算能力大幅度提升,能夠更高效、快速處理海量的數(shù)據(jù)。計(jì)算智能是人工智能的基礎(chǔ),AlphaGo是計(jì)算智能的代表。
感知智能是以視覺、聽覺、觸覺等感知能力輔助機(jī)器,讓機(jī)器能聽懂我們的語言、看懂世界萬物。相比起人類的感知能力,機(jī)器可以通過傳感器獲取更多信息,例如溫度傳感器、濕度傳感器、紅外雷達(dá)、激光雷達(dá)等等。感知智能也是人工智能的基礎(chǔ),機(jī)器人、自動(dòng)駕駛汽車是感知智能的代表。
認(rèn)知智能是指機(jī)器具有主動(dòng)思考和理解的能力,不用人類事先編程就可以實(shí)現(xiàn)自我學(xué)習(xí),有目的推理并與人類自然交互。人類有語言,才有概念、推理,所以概念、意識(shí)、觀念等都是人類認(rèn)知智能的表現(xiàn),機(jī)器實(shí)現(xiàn)以上能力還有漫長(zhǎng)的路需要探索。
在認(rèn)知智能的幫助下,人工智能通過發(fā)現(xiàn)世界和歷史上海量的有用信息,并洞察信息間的關(guān)系,不斷優(yōu)化自己的決策能力,從而擁有專家級(jí)別的實(shí)力,輔助人類做出決策。認(rèn)知智能將加強(qiáng)人和人工智能之間的互動(dòng),這種互動(dòng)是以每個(gè)人的偏好為基礎(chǔ)的。認(rèn)知智能通過搜集到的數(shù)據(jù),例如地理位置、瀏覽歷史、可穿戴設(shè)備數(shù)據(jù)和醫(yī)療記錄等等,為不同個(gè)體創(chuàng)造不同的場(chǎng)景。認(rèn)知系統(tǒng)也會(huì)根據(jù)當(dāng)前場(chǎng)景以及人和機(jī)器的關(guān)系,采取不同的語氣和情感進(jìn)行交流。
假如能像設(shè)想的一樣實(shí)現(xiàn)認(rèn)知智能,那么底層平臺(tái)必須足夠?qū)拸V和靈活,以便在各領(lǐng)域甚至跨領(lǐng)域得到應(yīng)用。因此研發(fā)人員需要從全局性出發(fā),打造這個(gè)健壯的底層平臺(tái),它應(yīng)該包括機(jī)器學(xué)習(xí)、自然語言處理、語音和圖像識(shí)別、人機(jī)交互等技術(shù),便于上層應(yīng)用開發(fā)者的開發(fā)和使用。
下一篇文章會(huì)從設(shè)計(jì)底層平臺(tái)的角度來闡述個(gè)人的思考。
閱讀資料:
1、人工智能史
- https://zh.wikipedia.org/wiki/人工智能史
- Alan Turing
- https://zh.wikipedia.org/wiki/艾倫·圖靈
- 科普AI之60年前的達(dá)特茅斯會(huì)議與AI緣起
- https://tech.163.com/16/0313/12/BI1P1CLI00094P0U.html
2、人工神經(jīng)網(wǎng)絡(luò)
https://baike.baidu.com/item/人工神經(jīng)網(wǎng)絡(luò)
3、深度學(xué)習(xí)
https://baike.baidu.com/item/深度學(xué)習(xí)
4、自然語言
https://baike.baidu.com/item/自然語言
5、TensorFlow
https://baike.baidu.com/link?url=dO_lFqvg6FQLYVaQKcwnlol1noc-EgdfIGbG6pQUo481iBQQkXSC8ZtFdAZ7II2SXyvG-mrTu34UuRFGdb0xvu2gmiZL02Sm6X4zOKiJrJ_
6、知識(shí)圖譜
https://www.jiqizhixin.com/articles/2017-03-20
7、《人工智能》-李開復(fù)、王詠剛著
https://item.jd.com/12169266.html
8、小米《奇葩說》花式廣告大賽
http://w.benbun.com/xiaomi/koubo/?state=d81c977eeb74e8d8783dc94e39fe1972&code=1abbb176039771a76583804409fb3354
以上就是第一章的內(nèi)容。
相關(guān)閱讀
人工智能與設(shè)計(jì)(2):面向用戶的人工智能系統(tǒng)底層設(shè)計(jì)
人工智能與設(shè)計(jì)(3):人工智能時(shí)代下交互設(shè)計(jì)的改變
人工智能與設(shè)計(jì)(4):人工智能對(duì)設(shè)計(jì)的影響
作者:薛志榮(微信公眾號(hào):薛志榮),百度交互設(shè)計(jì)師,二年級(jí)生
本文由 @薛志榮 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
作者:薛志榮(微信公眾號(hào):薛志榮),百度交互設(shè)計(jì)師,二年級(jí)生
本文由 @薛志榮 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
來學(xué)習(xí)
第三篇顯示內(nèi)容已丟失
感覺通篇都像是書里的文章搬移,沒看到作者自己有價(jià)值的思考
贊同樓上意見
這一篇都是介紹基礎(chǔ)知識(shí)和歷史,思考的在后面幾篇
這一篇都是介紹基礎(chǔ)知識(shí)和歷史,思考的在后面幾篇