人工智能與設(shè)計(jì)(1):人工智能的發(fā)展和定義

9 評(píng)論 26353 瀏覽 185 收藏 33 分鐘

本文是主題為“人工智能與設(shè)計(jì)”系列文章的第一篇,主要講述現(xiàn)在人工智能的基礎(chǔ)知識(shí),enjoy~

今年年初出于個(gè)人興趣,我開始了對(duì)人工智能的研究。為了更好理解人工智能和設(shè)計(jì)的關(guān)系,我開始學(xué)習(xí)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、Alexa開發(fā)等知識(shí),從當(dāng)初覺得人工智能只會(huì)讓大部分設(shè)計(jì)師失業(yè),到現(xiàn)在覺得人工智能只是一個(gè)設(shè)計(jì)的輔助工具,也算是成長(zhǎng)了不少。

這次希望能將積累的知識(shí)寫成一本電子書,沒別的,因?yàn)樽痔?,更重要的是這樣很酷。由寫作時(shí)間可能太長(zhǎng),互聯(lián)網(wǎng)每天都在變化,一些比較前沿的思考可能轉(zhuǎn)眼成為現(xiàn)實(shí),所以先把前四章陸續(xù)發(fā)出來。

前四章主要講了現(xiàn)在人工智能的基礎(chǔ)知識(shí)、底層設(shè)計(jì)、互聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)以及人工智能與設(shè)計(jì)的關(guān)系,后面會(huì)通過3~4章詳細(xì)分析人工智能對(duì)不同行業(yè)設(shè)計(jì)的影響,目前考慮的領(lǐng)域是室內(nèi)設(shè)計(jì)、公共設(shè)計(jì)和服務(wù)設(shè)計(jì)。

人工智能的發(fā)展歷史

說起人工智能這詞,不得不提及人工智能的歷史。人工智能的概念主要由Alan Turing提出:機(jī)器會(huì)思考嗎?如果一臺(tái)機(jī)器能夠與人類對(duì)話而不被辨別出其機(jī)器的身份,那么這臺(tái)機(jī)器具有智能的特征。同年,Alan Turing還預(yù)言了存有一定的可能性可以創(chuàng)造出具有真正智能的機(jī)器。

說明:Alan Turing(1912.6.23-1954.6.7)曾協(xié)助英國(guó)軍隊(duì)破解了德國(guó)的著名密碼系統(tǒng)Enigma,幫助盟軍取得了二戰(zhàn)的勝利。因提出一種用于判定機(jī)器是否具有智能的試驗(yàn)方法,即圖靈試驗(yàn),被后人稱為計(jì)算機(jī)之父和人工智能之父。

AI誕生

1956年,在達(dá)特茅斯學(xué)院舉行的一次會(huì)議上,不同領(lǐng)域(數(shù)學(xué),心理學(xué),工程學(xué),經(jīng)濟(jì)學(xué)和政治學(xué))的科學(xué)家正式確立了人工智能為研究學(xué)科。

2006年達(dá)特茅斯會(huì)議當(dāng)事人重聚,左起:Trenchard More、John McCarthy、Marvin? Minsky、Oliver Selfridge、Ray Solomonoff

第一次發(fā)展高潮(1955年—1974年)

達(dá)特茅斯會(huì)議之后是大發(fā)現(xiàn)的時(shí)代。對(duì)很多人來講,這一階段開發(fā)出來的程序堪稱神奇:計(jì)算機(jī)可以解決代數(shù)應(yīng)用題、證明幾何定理、學(xué)習(xí)和使用英語。在眾多研究當(dāng)中,搜索式推理、自然語言、微世界在當(dāng)時(shí)最具影響力。

大量成功的AI程序和新的研究方向不斷涌現(xiàn),研究學(xué)者認(rèn)為具有完全智能的機(jī)器將在二十年內(nèi)出現(xiàn)并給出了如下預(yù)言:

1958年,H. A. Simon,Allen Newell:“十年之內(nèi),數(shù)字計(jì)算機(jī)將成為國(guó)際象棋世界冠軍。”?“十年之內(nèi),數(shù)字計(jì)算機(jī)將發(fā)現(xiàn)并證明一個(gè)重要的數(shù)學(xué)定理?!?/p>

1965年,H. A. Simon:“二十年內(nèi),機(jī)器將能完成人能做到的一切工作?!?/p>

1967年,Marvin Minsky:“一代之內(nèi)……創(chuàng)造“人工智能”的問題將獲得實(shí)質(zhì)上的解決。”

1970年,Marvin Minsky:“在三到八年的時(shí)間里我們將得到一臺(tái)具有人類平均智能的機(jī)器?!?/p>

美國(guó)政府向這一新興領(lǐng)域投入了大筆資金,每年將數(shù)百萬美元投入到麻省理工學(xué)院、卡耐基梅隆大學(xué)、愛丁堡大學(xué)和斯坦福大學(xué)四個(gè)研究機(jī)構(gòu),并允許研究學(xué)者去做任何感興趣的方向。

當(dāng)時(shí)主要成就:

  1. 人工神經(jīng)網(wǎng)絡(luò)在30-50年代被提出,1951年Marvin Minsky制造出第一臺(tái)神經(jīng)網(wǎng)絡(luò)機(jī)
  2. 貝爾曼公式(增強(qiáng)學(xué)習(xí)雛形)被提出
  3. 感知器(深度學(xué)習(xí)雛形)被提出
  4. 搜索式推理被提出
  5. 自然語言被提出
  6. 首次提出人工智能擁有模仿智能的特征,懂得使用語言,懂得形成抽象概念并解決人類現(xiàn)存問題
  7. Arthur Samuel在五十年代中期和六十年代初開發(fā)的國(guó)際象棋程序,棋力已經(jīng)可以挑戰(zhàn)具有相當(dāng)水平的業(yè)余愛好者
  8. 機(jī)器人SHAKEY項(xiàng)目受到了大力宣傳,它能夠?qū)ψ约旱男袨檫M(jìn)行“推理”;人們將其視作世界上第一臺(tái)通用機(jī)器人
  9. 微世界的提出

第一次寒冬(1974年—1980年)

70年代初,AI遭遇到瓶頸。研究學(xué)者逐漸發(fā)現(xiàn),雖然機(jī)器擁有了簡(jiǎn)單的邏輯推理能力,但遭遇到當(dāng)時(shí)無法克服的基礎(chǔ)性障礙,AI停留在“玩具”階段止步不前,遠(yuǎn)遠(yuǎn)達(dá)不到曾經(jīng)預(yù)言的完全智能。由于此前的過于樂觀使人們期待過高,當(dāng)AI研究人員的承諾無法兌現(xiàn)時(shí),公眾開始激烈批評(píng)AI研究人員,許多機(jī)構(gòu)不斷減少對(duì)人工智能研究的資助,直至停止撥款。

當(dāng)時(shí)主要問題:

  1. 計(jì)算機(jī)運(yùn)算能力遭遇瓶頸,無法解決指數(shù)型爆炸的復(fù)雜計(jì)算問題
  2. 常識(shí)和推理需要大量對(duì)世界的認(rèn)識(shí)信息,計(jì)算機(jī)達(dá)不到“看懂”和“聽懂”的地步
  3. 無法解決莫拉維克悖論
  4. 無法解決部分涉及自動(dòng)規(guī)劃的邏輯問題
  5. 神經(jīng)網(wǎng)絡(luò)研究學(xué)者遭遇冷落

說明:莫拉維克悖論:如果機(jī)器像數(shù)學(xué)天才一樣下象棋,那么它能模仿嬰兒學(xué)習(xí)又有多難呢?然而,事實(shí)證明這是相當(dāng)難的。

第二次發(fā)展高潮(1980年—1987年)

80年代初,一類名為“專家系統(tǒng)”的AI程序開始為全世界的公司所采納,人工智能研究迎來了新一輪高潮。在這期間,卡耐基梅隆大學(xué)為DEC公司設(shè)計(jì)的XCON專家系統(tǒng)能夠每年為DEC公司節(jié)省數(shù)千萬美金。日本經(jīng)濟(jì)產(chǎn)業(yè)省撥款八億五千萬美元支持第五代計(jì)算機(jī)項(xiàng)目。其目標(biāo)是造出能夠與人對(duì)話、翻譯語言、解釋圖像、能夠像人一樣推理的機(jī)器。其他國(guó)家也紛紛作出了響應(yīng),并對(duì)AI和信息技術(shù)的大規(guī)模項(xiàng)目提供了巨額資助。

說明:專家系統(tǒng)是一種程序,能夠依據(jù)一組從專門知識(shí)中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。由于專家系統(tǒng)僅限于一個(gè)很小的領(lǐng)域,從而避免了常識(shí)問題?!爸R(shí)處理”隨之也成為了主流 AI 研究的焦點(diǎn)。

當(dāng)時(shí)主要成就:

  1. 專家系統(tǒng)的誕生
  2. AI研究人員發(fā)現(xiàn)智能可能需要建立在對(duì)分門別類的大量知識(shí)的多種處理方法之上
  3. BP算法實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的突破,神經(jīng)網(wǎng)絡(luò)研究學(xué)者重新受到關(guān)注
  4. AI研究人員首次提出:機(jī)器為了獲得真正的智能,機(jī)器必須具有軀體,它需要有感知、移動(dòng)、生存,與這個(gè)世界交互的能力。感知運(yùn)動(dòng)技能對(duì)于常識(shí)推理等高層次技能是至關(guān)重要的,基于對(duì)事物的推理能力比抽象能力更為重要,這也促進(jìn)了未來自然語言、機(jī)器視覺的發(fā)展。

第二次寒冬(1987年—1993年)

1987年,AI硬件的市場(chǎng)需求突然下跌。科學(xué)家發(fā)現(xiàn),專家系統(tǒng)雖然很有用,但它的應(yīng)用領(lǐng)域過于狹窄,而且更新迭代和維護(hù)成本非常高。同期美國(guó)Apple和IBM生產(chǎn)的臺(tái)式機(jī)性能不斷提升,個(gè)人電腦的理念不斷蔓延;日本人設(shè)定的“第五代工程”最終也沒能實(shí)現(xiàn)。人工智能研究再次遭遇了財(cái)政困難,一夜之間這個(gè)價(jià)值五億美元的產(chǎn)業(yè)土崩瓦解。

當(dāng)時(shí)主要問題:

  1. 受到臺(tái)式機(jī)和“個(gè)人電腦”理念的沖擊影響
  2. 商業(yè)機(jī)構(gòu)對(duì)AI的追捧和冷落,使AI化為泡沫并破裂
  3. 計(jì)算機(jī)性能瓶頸仍無法突破
  4. 仍然缺乏海量數(shù)據(jù)訓(xùn)練機(jī)器

第三次發(fā)展高潮(1993年至今)

在摩爾定律下,計(jì)算機(jī)性能不斷突破。云計(jì)算、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、自然語言和機(jī)器視覺等領(lǐng)域發(fā)展迅速,人工智能迎來第三次高潮。

摩爾定律起始于Gordon Moore在1965年的一個(gè)預(yù)言,當(dāng)時(shí)他看到因特爾公司做的幾款芯片,覺得18到24個(gè)月可以把晶體管體積縮小一半,個(gè)數(shù)可以翻一番,運(yùn)算處理能力能翻一倍。沒想到這么一個(gè)簡(jiǎn)單的預(yù)言成真了,下面幾十年一直按這個(gè)節(jié)奏往前走,成為了摩爾定律。

主要事件:

  • 1997年:IBM的國(guó)際象棋機(jī)器人深藍(lán)戰(zhàn)勝國(guó)際象棋世界冠軍卡斯帕羅夫
  • 2005年:Stanford開發(fā)的一臺(tái)機(jī)器人在一條沙漠小徑上成功地自動(dòng)行駛了131英里,贏得了DARPA挑戰(zhàn)大賽頭獎(jiǎng);
  • 2006年:Geoffrey Hinton提出多層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法;Eric Schmidt在搜索引擎大會(huì)提出“云計(jì)算”概念
  • 2010年:Sebastian Thrun領(lǐng)導(dǎo)的谷歌無人駕駛汽車曝光,創(chuàng)下了超過16萬千米無事故的紀(jì)錄
  • 2011年:IBM Waston參加智力游戲《危險(xiǎn)邊緣》,擊敗最高獎(jiǎng)金得主Brad Rutter和連勝紀(jì)錄保持者Ken Jennings;蘋果發(fā)布語音個(gè)人助手Siri;Nest Lab發(fā)布第一代智能恒溫器Nest。它可以了解用戶的習(xí)慣,并相應(yīng)自動(dòng)地調(diào)節(jié)溫度
  • 2012年:Google發(fā)布個(gè)人助理Google Now
  • 2013年:深度學(xué)習(xí)算法在語音和視覺識(shí)別率獲得突破性進(jìn)展
  • 2014年:微軟亞洲研究院發(fā)布人工智能小冰聊天機(jī)器人和語音助手Cortana;百度發(fā)布Deep Speech語音識(shí)別系統(tǒng)
  • 2015年:Facebook發(fā)布了一款基于文本的人工智能助理“M”
  • 2016年:Google AlphaGo以比分4:1戰(zhàn)勝圍棋九段棋手李世石;Chatbots這個(gè)概念開始流行;Google發(fā)布為機(jī)器學(xué)習(xí)定制的第一代專用芯片TPU;Google發(fā)布語音助手Assistant
  • 2017年:AlphaGO在圍棋網(wǎng)絡(luò)對(duì)戰(zhàn)平臺(tái)以60連勝擊敗世界各地高手;Google 開源深度學(xué)習(xí)系統(tǒng)Tensorflow 1.0正式發(fā)布;Google AlphaGo以比分3:0完勝世界第一圍棋九段棋手柯潔;默默深耕機(jī)器學(xué)習(xí)和機(jī)器視覺的蘋果在WWDC上發(fā)布Core ML,ARKit等組件;Google發(fā)布了ARCore SDK;百度AI開發(fā)者大會(huì)正式發(fā)布Dueros語音系統(tǒng),無人駕駛平臺(tái)Apollo1.0自動(dòng)駕駛平臺(tái);華為發(fā)布全球第一款A(yù)I移動(dòng)芯片麒麟970;iPhone X配備前置 3D 感應(yīng)攝像頭(TrueDepth),臉部識(shí)別點(diǎn)達(dá)到3W個(gè),具備人臉識(shí)別、解鎖和支付等功能;配備的A11 Bionic神經(jīng)引擎使用雙核設(shè)計(jì),每秒可達(dá)到運(yùn)算6000億次

很多專家學(xué)者對(duì)此次人工智能浪潮給予了肯定,認(rèn)為這次人工智能浪潮能引起第四次工業(yè)革命。人工智能逐漸開始在保險(xiǎn),金融等領(lǐng)域開始滲透,在未來健康醫(yī)療、交通出行、銷售消費(fèi)、金融服務(wù)、媒介娛樂、生產(chǎn)制造,到能源、石油、農(nóng)業(yè)、政府……所有垂直產(chǎn)業(yè)都將因人工智能技術(shù)的發(fā)展而受益,那么我們現(xiàn)在講的人工智能究竟是什么?

人工智能是什么?

在60年代,AI研究人員認(rèn)為人工智能是一臺(tái)通用機(jī)器人,它擁有模仿智能的特征,懂得使用語言,懂得形成抽象概念,能夠?qū)ψ约旱男袨檫M(jìn)行推理,它可以解決人類現(xiàn)存問題。由于理念、技術(shù)和數(shù)據(jù)的限制,人工智能在模式識(shí)別、信息表示、問題解決和自然語言處理等不同領(lǐng)域發(fā)展緩慢。

80年代,AI研究人員轉(zhuǎn)移方向,認(rèn)為人工智能對(duì)事物的推理能力比抽象能力更重要,機(jī)器為了獲得真正的智能,機(jī)器必須具有軀體,它需要感知、移動(dòng)、生存,與這個(gè)世界交互。為了積累更多推理能力,AI研究人員開發(fā)出專家系統(tǒng),它能夠依據(jù)一組從專門知識(shí)中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。

1997年,IBM的超級(jí)計(jì)算機(jī)深藍(lán)在國(guó)際象棋領(lǐng)域完勝整個(gè)人類代表卡斯帕羅夫;相隔20年,Google的AlphaGo在圍棋領(lǐng)域完勝整個(gè)人類代表柯潔。劃時(shí)代的事件使大部分AI研究人員確信人工智能的時(shí)代已經(jīng)降臨。

可能大家覺得國(guó)際象棋和圍棋好像沒什么區(qū)別,其實(shí)兩者的難度不在同一個(gè)級(jí)別。國(guó)際象棋走法的可能性雖多,但棋盤的大小和每顆棋子的規(guī)則大大限制了贏的可能性。深藍(lán)可以通過蠻力看到所有的可能性,而且只需要一臺(tái)計(jì)算機(jī)基本上就可以搞定。相比國(guó)際象棋,圍棋很不一樣。圍棋布局走法的可能性可能要比宇宙中的原子數(shù)量還多,幾十臺(tái)計(jì)算機(jī)的計(jì)算能力都搞不定,所以機(jī)器下圍棋想贏非常困難,包括圍棋專家和人工智能領(lǐng)域的專家們也紛紛斷言:計(jì)算機(jī)要在圍棋領(lǐng)域戰(zhàn)勝人類棋手,還要再等100年。結(jié)果機(jī)器真的做到了,并據(jù)說AlphaGo擁有圍棋十幾段的實(shí)力(目前圍棋棋手最高是9段)。

那么深藍(lán)和AlphaGo在本質(zhì)上有什么區(qū)別?簡(jiǎn)單點(diǎn)說,深藍(lán)的代碼是研究人員編程的,知識(shí)和經(jīng)驗(yàn)也是研究人員傳授的,所以可以認(rèn)為與卡斯帕羅夫?qū)?zhàn)的深藍(lán)的背后還是人類,只不過它的運(yùn)算能力比人類更強(qiáng),更少失誤。而AlphaGo的代碼是自我更新的,知識(shí)和經(jīng)驗(yàn)是自我訓(xùn)練出來的。與深藍(lán)不一樣的是,AlphaGo擁有兩顆大腦,一顆負(fù)責(zé)預(yù)測(cè)落子的最佳概率,一顆做整體的局面判斷,通過兩顆大腦的協(xié)同工作,它能夠判斷出未來幾十步的勝率大小。所以與柯潔對(duì)戰(zhàn)的AlphaGo的背后是通過十幾萬盤的海量訓(xùn)練后,擁有自主學(xué)習(xí)能力的人工智能系統(tǒng)。

這時(shí)候社會(huì)上出現(xiàn)了不同的聲音:“人工智能會(huì)思考并解決所有問題”、“人工智能會(huì)搶走人類的大部分工作!”“人工智能會(huì)取代人類嗎?”那么已來臨的人工智能究竟是什么?

人工智能目前有兩個(gè)定義,分別為強(qiáng)人工智能弱人工智能

普通群眾所遐想的人工智能屬于強(qiáng)人工智能,它屬于通用型機(jī)器人,也就是60年代AI研究人員提出的理念。它能夠和人類一樣對(duì)世界進(jìn)行感知和交互,通過自我學(xué)習(xí)的方式對(duì)所有領(lǐng)域進(jìn)行記憶、推理和解決問題。這樣的強(qiáng)人工智能需要具備以下能力:

  1. 存在不確定因素時(shí)進(jìn)行推理,使用策略,解決問題,制定決策的能力
  2. 知識(shí)表示的能力,包括常識(shí)性知識(shí)的表示能力
  3. 規(guī)劃能力
  4. 學(xué)習(xí)能力
  5. 使用自然語言進(jìn)行交流溝通的能力
  6. 將上述能力整合起來實(shí)現(xiàn)既定目標(biāo)的能力

說明:以上結(jié)論借鑒李開復(fù)所著的《人工智能》一書。

這些能力在常人看來都很簡(jiǎn)單,因?yàn)樽约憾季邆渲坏捎诩夹g(shù)的限制,計(jì)算機(jī)很難具備以上能力,這也是為什么現(xiàn)階段人工智能很難達(dá)到常人思考的水平。

由于技術(shù)未成熟,現(xiàn)階段的人工智能屬于弱人工智能,還達(dá)不到大眾所遐想的強(qiáng)人工智能。弱人工智能也稱限制領(lǐng)域人工智能或應(yīng)用型人工智能,指的是專注于且只能解決特定領(lǐng)域問題的人工智能,例如AlphaGo,它自身的數(shù)學(xué)模型只能解決圍棋領(lǐng)域的問題,可以說它是一個(gè)非常狹小領(lǐng)域問題的專家系統(tǒng),以及它很難擴(kuò)展到稍微寬廣一些的知識(shí)領(lǐng)域,例如如何通過一盤棋表達(dá)出自己的性格和靈魂。

弱人工智能和強(qiáng)人工智能在能力上存在著巨大鴻溝,弱人工智能想要進(jìn)一步發(fā)展,必須具備以下能力:

  1. 跨領(lǐng)域推理
  2. 擁有抽象能力
  3. “知其然,也知其所以然”
  4. 擁有常識(shí)
  5. 擁有審美能力
  6. 擁有自我意識(shí)和情感

說明:以上結(jié)論借鑒李開復(fù)所著的《人工智能》一書。

在計(jì)算機(jī)理念來說,人工智能是用來處理不確定性以及管理決策中的不確定性。意思是通過一些不確定的數(shù)據(jù)輸入來進(jìn)行一些具有不確定性的決策。從目前的技術(shù)實(shí)現(xiàn)來說,人工智能就是深度學(xué)習(xí),它是06年由Geoffrey Hinton所提出的機(jī)器學(xué)習(xí)算法,該算法可以使程序擁有自我學(xué)習(xí)和演變的能力。

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是什么?

機(jī)器學(xué)習(xí)簡(jiǎn)單點(diǎn)說就是通過一個(gè)數(shù)學(xué)模型將大量數(shù)據(jù)中有用的數(shù)據(jù)和關(guān)系挖掘出來。機(jī)器學(xué)習(xí)建模采用了以下四種方法:

  1. 監(jiān)督學(xué)習(xí)與數(shù)學(xué)中的函數(shù)有關(guān)。它需要研究學(xué)者不斷地標(biāo)注數(shù)據(jù)從而提高模型的準(zhǔn)確性,挖掘出數(shù)據(jù)間的關(guān)系并給出結(jié)果。
  2. 非監(jiān)督學(xué)習(xí)與現(xiàn)實(shí)中的描述(例如哪些動(dòng)物有四條腿)有關(guān)。它可以在沒有額外信息的情況下,從原始數(shù)據(jù)中提取模式和結(jié)構(gòu)的任務(wù),它與需要標(biāo)簽的監(jiān)督學(xué)習(xí)相互對(duì)立。
  3. 半監(jiān)督學(xué)習(xí),它可以理解為監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的結(jié)合。
  4. 增強(qiáng)學(xué)習(xí),它的大概意思是通過聯(lián)想并對(duì)比未來幾步所帶來的好處而決定下一步是什么。

目前機(jī)器學(xué)習(xí)以監(jiān)督學(xué)習(xí)為主。

深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)下面的一條分支。它能夠通過多層神經(jīng)網(wǎng)絡(luò)以及使用以上四種方法,不斷對(duì)自身模型進(jìn)行自我優(yōu)化,從而發(fā)現(xiàn)出更多優(yōu)質(zhì)的數(shù)據(jù)以及聯(lián)系。

目前的AlphaGo正是采用了深度學(xué)習(xí)算法擊敗了人類世界冠軍,更重要的是,深度學(xué)習(xí)促進(jìn)了人工智能其他領(lǐng)域如自然語言和機(jī)器視覺的發(fā)展。目前的人工智能的發(fā)展依賴深度學(xué)習(xí),這句話沒有任何問題。

人工智能基礎(chǔ)能力

在了解人工智能基礎(chǔ)能力前,我們先聊聊更底層的東西——數(shù)據(jù)。計(jì)算機(jī)數(shù)據(jù)分為兩種,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指具有預(yù)定義的數(shù)據(jù)模型的數(shù)據(jù),它的本質(zhì)是將所有數(shù)據(jù)標(biāo)簽化、結(jié)構(gòu)化,后續(xù)只要確定標(biāo)簽,數(shù)據(jù)就能讀取出來,這種方式容易被計(jì)算機(jī)理解。非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或者不完整,沒有預(yù)定義的數(shù)據(jù)模型的數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)格式多樣化,包括了圖片、音頻、視頻、文本、網(wǎng)頁(yè)等等,它比結(jié)構(gòu)化信息更難標(biāo)準(zhǔn)化和理解。

音頻、圖片、文本、視頻這四種載體可以承載著來自世界萬物的信息,人類在理解這些內(nèi)容時(shí)毫不費(fèi)勁;對(duì)于只懂結(jié)構(gòu)化數(shù)據(jù)的計(jì)算機(jī)來說,理解這些非結(jié)構(gòu)化內(nèi)容比登天還難,這也就是為什么人與計(jì)算機(jī)交流時(shí)非常費(fèi)勁。

全世界有80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),人工智能想要達(dá)到看懂、聽懂的狀態(tài),必須要把非結(jié)構(gòu)化數(shù)據(jù)這塊硬骨頭啃下來。學(xué)者在深度學(xué)習(xí)的幫助下在這領(lǐng)域取得了突破性成就,這成就為人工智能其他各種能力奠定了基礎(chǔ)。

如果將人工智能比作一個(gè)人,那么人工智能應(yīng)該具有記憶思考能力,輸入能力如視覺、聽覺、嗅覺、味覺以及觸覺,以及輸出能力如語言交流、軀體活動(dòng)。以上能力對(duì)相應(yīng)的術(shù)語為:深度學(xué)習(xí)、知識(shí)圖譜、遷移學(xué)習(xí)、自然語言處理、機(jī)器視覺、語音識(shí)別、語音合成(觸覺、嗅覺、味覺在技術(shù)研究上暫無商業(yè)成果,軀體活動(dòng)更多屬于機(jī)器人領(lǐng)域,不在文章中過多介紹)

簡(jiǎn)單點(diǎn)說,知識(shí)圖譜就是一張地圖。它從不同來源收集信息并加以整理,每個(gè)信息都是一個(gè)節(jié)點(diǎn),當(dāng)信息之間有關(guān)系時(shí),相關(guān)節(jié)點(diǎn)會(huì)建立起聯(lián)系,眾多信息節(jié)點(diǎn)逐漸形成了圖。知識(shí)圖譜有助于信息存儲(chǔ),更重要的是提高了搜索信息的速度和質(zhì)量。

遷移學(xué)習(xí)把已學(xué)訓(xùn)練好的模型參數(shù)遷移到新的模型來幫助新模型訓(xùn)練數(shù)據(jù)集。由于大部分領(lǐng)域都沒有足夠的數(shù)據(jù)量進(jìn)行模型訓(xùn)練,遷移學(xué)習(xí)可以將大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上,實(shí)現(xiàn)個(gè)性化遷移,如同人類思考時(shí)使用的類比推理。遷移學(xué)習(xí)有助于人工智能掌握更多知識(shí)。

自然語言處理是一門融語言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的學(xué)科,它是人工智能的耳朵-語音識(shí)別和嘴巴-語音合成的基礎(chǔ)。計(jì)算機(jī)能否理解人類的思想,首先要理解自然語言,其次擁有廣泛的知識(shí),以及運(yùn)用這些知識(shí)的能力。自然語言處理的主要范疇非常廣,包括了語音合成、語音識(shí)別、語句分詞、詞性標(biāo)注、語法分析、語句分析、機(jī)器翻譯、自動(dòng)摘要等等、問答系統(tǒng)等等。

機(jī)器視覺通過攝影機(jī)和計(jì)算機(jī)代替人的眼睛對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量,并進(jìn)一步對(duì)圖像進(jìn)行處理。這是一門研究如何使機(jī)器“看懂”的技術(shù),是人工智能最重要的輸入方式之一。如何通過攝像頭就能做到實(shí)時(shí)、準(zhǔn)確識(shí)別外界狀況,這是人工智能的瓶頸之一,深度學(xué)習(xí)在這方面幫了大忙?,F(xiàn)在熱門的人臉識(shí)別、無人駕駛等技術(shù)都依賴于機(jī)器視覺技術(shù)。

語音識(shí)別的目的是將人類的語音內(nèi)容轉(zhuǎn)換為相應(yīng)的文字。機(jī)器能否與人類自然交流的前提是機(jī)器能聽懂人類講什么,語音識(shí)別也是人工智能的最重要輸入方式之一。由于不同地區(qū)有著不同方言和口音,這對(duì)于語音識(shí)別來說都是巨大的挑戰(zhàn)。目前百度、科大訊飛等公司的語音識(shí)別技術(shù)在普通話上的準(zhǔn)確率已達(dá)到97%,但方言準(zhǔn)確率還有待提高。

目前大部分的語音合成技術(shù)是利用在數(shù)據(jù)庫(kù)內(nèi)的許多已錄好的語音連接起來,但由于缺乏對(duì)上下文的理解以及情感的表達(dá),朗讀效果很差。現(xiàn)在百度和科大訊飛等公司在語音合成上有新的成果:16年3月百度語音合成了張國(guó)榮聲音與粉絲互動(dòng);17年3月本邦科技利用科大訊飛的語音合成技術(shù),成功幫助小米手機(jī)實(shí)現(xiàn)了一款內(nèi)含“黑科技”的營(yíng)銷活動(dòng)H5。它們的主要技術(shù)是通過對(duì)張國(guó)榮、馬東的語音資料進(jìn)行語音識(shí)別,提取該人的聲紋和說話特征,再通過自然語言處理對(duì)講述的內(nèi)容進(jìn)行情緒識(shí)別,合成出來的語音就像本人在和你對(duì)話。新的語音合成技術(shù)不再被數(shù)據(jù)庫(kù)內(nèi)的錄音所限制語言和情感的表達(dá)。

經(jīng)過多年的人工智能研究,人工智能的主要發(fā)展方向分為:計(jì)算智能、感知智能、認(rèn)知智能,這一觀點(diǎn)也得到業(yè)界的廣泛認(rèn)可。

計(jì)算智能是以生物進(jìn)化的觀點(diǎn)認(rèn)識(shí)和模擬智能。有學(xué)者認(rèn)為,智能是在生物的遺傳、變異、生長(zhǎng)以及外部環(huán)境的自然選擇中產(chǎn)生的。在用進(jìn)廢退、優(yōu)勝劣汰的過程中,適應(yīng)度高的(頭腦)結(jié)構(gòu)被保存下來,智能水平也隨之提高。機(jī)器借助大自然規(guī)律的啟示設(shè)計(jì)出具有結(jié)構(gòu)演化能力和自適應(yīng)學(xué)習(xí)能力的智能。計(jì)算智能算法主要包括神經(jīng)計(jì)算、模糊計(jì)算和進(jìn)化計(jì)算三大部分,神經(jīng)網(wǎng)絡(luò)和遺傳算法的出現(xiàn),使得機(jī)器的運(yùn)算能力大幅度提升,能夠更高效、快速處理海量的數(shù)據(jù)。計(jì)算智能是人工智能的基礎(chǔ),AlphaGo是計(jì)算智能的代表。

感知智能是以視覺、聽覺、觸覺等感知能力輔助機(jī)器,讓機(jī)器能聽懂我們的語言、看懂世界萬物。相比起人類的感知能力,機(jī)器可以通過傳感器獲取更多信息,例如溫度傳感器、濕度傳感器、紅外雷達(dá)、激光雷達(dá)等等。感知智能也是人工智能的基礎(chǔ),機(jī)器人、自動(dòng)駕駛汽車是感知智能的代表。

認(rèn)知智能是指機(jī)器具有主動(dòng)思考和理解的能力,不用人類事先編程就可以實(shí)現(xiàn)自我學(xué)習(xí),有目的推理并與人類自然交互。人類有語言,才有概念、推理,所以概念、意識(shí)、觀念等都是人類認(rèn)知智能的表現(xiàn),機(jī)器實(shí)現(xiàn)以上能力還有漫長(zhǎng)的路需要探索。

在認(rèn)知智能的幫助下,人工智能通過發(fā)現(xiàn)世界和歷史上海量的有用信息,并洞察信息間的關(guān)系,不斷優(yōu)化自己的決策能力,從而擁有專家級(jí)別的實(shí)力,輔助人類做出決策。認(rèn)知智能將加強(qiáng)人和人工智能之間的互動(dòng),這種互動(dòng)是以每個(gè)人的偏好為基礎(chǔ)的。認(rèn)知智能通過搜集到的數(shù)據(jù),例如地理位置、瀏覽歷史、可穿戴設(shè)備數(shù)據(jù)和醫(yī)療記錄等等,為不同個(gè)體創(chuàng)造不同的場(chǎng)景。認(rèn)知系統(tǒng)也會(huì)根據(jù)當(dāng)前場(chǎng)景以及人和機(jī)器的關(guān)系,采取不同的語氣和情感進(jìn)行交流。

假如能像設(shè)想的一樣實(shí)現(xiàn)認(rèn)知智能,那么底層平臺(tái)必須足夠?qū)拸V和靈活,以便在各領(lǐng)域甚至跨領(lǐng)域得到應(yīng)用。因此研發(fā)人員需要從全局性出發(fā),打造這個(gè)健壯的底層平臺(tái),它應(yīng)該包括機(jī)器學(xué)習(xí)、自然語言處理、語音和圖像識(shí)別、人機(jī)交互等技術(shù),便于上層應(yīng)用開發(fā)者的開發(fā)和使用。

下一篇文章會(huì)從設(shè)計(jì)底層平臺(tái)的角度來闡述個(gè)人的思考。

閱讀資料:

1、人工智能史

  • https://zh.wikipedia.org/wiki/人工智能史
  • Alan Turing
  • https://zh.wikipedia.org/wiki/艾倫·圖靈
  • 科普AI之60年前的達(dá)特茅斯會(huì)議與AI緣起
  • https://tech.163.com/16/0313/12/BI1P1CLI00094P0U.html

2、人工神經(jīng)網(wǎng)絡(luò)

https://baike.baidu.com/item/人工神經(jīng)網(wǎng)絡(luò)

3、深度學(xué)習(xí)

https://baike.baidu.com/item/深度學(xué)習(xí)

4、自然語言

https://baike.baidu.com/item/自然語言

5、TensorFlow

https://baike.baidu.com/link?url=dO_lFqvg6FQLYVaQKcwnlol1noc-EgdfIGbG6pQUo481iBQQkXSC8ZtFdAZ7II2SXyvG-mrTu34UuRFGdb0xvu2gmiZL02Sm6X4zOKiJrJ_

6、知識(shí)圖譜

https://www.jiqizhixin.com/articles/2017-03-20

7、《人工智能》-李開復(fù)、王詠剛著

https://item.jd.com/12169266.html

8、小米《奇葩說》花式廣告大賽

http://w.benbun.com/xiaomi/koubo/?state=d81c977eeb74e8d8783dc94e39fe1972&code=1abbb176039771a76583804409fb3354

以上就是第一章的內(nèi)容。

相關(guān)閱讀

人工智能與設(shè)計(jì)(2):面向用戶的人工智能系統(tǒng)底層設(shè)計(jì)

人工智能與設(shè)計(jì)(3):人工智能時(shí)代下交互設(shè)計(jì)的改變

人工智能與設(shè)計(jì)(4):人工智能對(duì)設(shè)計(jì)的影響

 

作者:薛志榮(微信公眾號(hào):薛志榮),百度交互設(shè)計(jì)師,二年級(jí)生

本文由 @薛志榮 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

 

作者:薛志榮(微信公眾號(hào):薛志榮),百度交互設(shè)計(jì)師,二年級(jí)生

本文由 @薛志榮 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 來學(xué)習(xí)

    來自江蘇 回復(fù)
  2. 第三篇顯示內(nèi)容已丟失

    回復(fù)
  3. 感覺通篇都像是書里的文章搬移,沒看到作者自己有價(jià)值的思考

    來自北京 回復(fù)
    1. 贊同樓上意見

      來自廣東 回復(fù)
    2. 這一篇都是介紹基礎(chǔ)知識(shí)和歷史,思考的在后面幾篇

      來自廣東 回復(fù)
    3. 這一篇都是介紹基礎(chǔ)知識(shí)和歷史,思考的在后面幾篇

      來自廣東 回復(fù)