婷婷五月深深久久精品,中文字幕无码成人免费视频,黄色网站在线

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

人工智能與設(shè)計（1）：人工智能的發(fā)展和定義

薛志榮

2017-11-10

9 評論 26353 瀏覽 185 收藏

33 分鐘

本文是主題為“人工智能與設(shè)計”系列文章的第一篇，主要講述現(xiàn)在人工智能的基礎(chǔ)知識，enjoy~

今年年初出于個人興趣，我開始了對人工智能的研究。為了更好理解人工智能和設(shè)計的關(guān)系，我開始學(xué)習(xí)機器學(xué)習(xí)、深度學(xué)習(xí)、Alexa開發(fā)等知識，從當(dāng)初覺得人工智能只會讓大部分設(shè)計師失業(yè)，到現(xiàn)在覺得人工智能只是一個設(shè)計的輔助工具，也算是成長了不少。

這次希望能將積累的知識寫成一本電子書，沒別的，因為字太多，更重要的是這樣很酷。由寫作時間可能太長，互聯(lián)網(wǎng)每天都在變化，一些比較前沿的思考可能轉(zhuǎn)眼成為現(xiàn)實，所以先把前四章陸續(xù)發(fā)出來。

前四章主要講了現(xiàn)在人工智能的基礎(chǔ)知識、底層設(shè)計、互聯(lián)網(wǎng)產(chǎn)品設(shè)計以及人工智能與設(shè)計的關(guān)系，后面會通過3~4章詳細(xì)分析人工智能對不同行業(yè)設(shè)計的影響，目前考慮的領(lǐng)域是室內(nèi)設(shè)計、公共設(shè)計和服務(wù)設(shè)計。

人工智能的發(fā)展歷史

說起人工智能這詞，不得不提及人工智能的歷史。人工智能的概念主要由Alan Turing提出：機器會思考嗎？如果一臺機器能夠與人類對話而不被辨別出其機器的身份，那么這臺機器具有智能的特征。同年，Alan Turing還預(yù)言了存有一定的可能性可以創(chuàng)造出具有真正智能的機器。

說明：Alan Turing（1912.6.23-1954.6.7）曾協(xié)助英國軍隊破解了德國的著名密碼系統(tǒng)Enigma，幫助盟軍取得了二戰(zhàn)的勝利。因提出一種用于判定機器是否具有智能的試驗方法，即圖靈試驗，被后人稱為計算機之父和人工智能之父。

AI誕生

1956年，在達特茅斯學(xué)院舉行的一次會議上，不同領(lǐng)域（數(shù)學(xué)，心理學(xué)，工程學(xué)，經(jīng)濟學(xué)和政治學(xué)）的科學(xué)家正式確立了人工智能為研究學(xué)科。

2006年達特茅斯會議當(dāng)事人重聚，左起：Trenchard More、John McCarthy、Marvin? Minsky、Oliver Selfridge、Ray Solomonoff

第一次發(fā)展高潮（1955年—1974年）

達特茅斯會議之后是大發(fā)現(xiàn)的時代。對很多人來講，這一階段開發(fā)出來的程序堪稱神奇：計算機可以解決代數(shù)應(yīng)用題、證明幾何定理、學(xué)習(xí)和使用英語。在眾多研究當(dāng)中，搜索式推理、自然語言、微世界在當(dāng)時最具影響力。

大量成功的AI程序和新的研究方向不斷涌現(xiàn)，研究學(xué)者認(rèn)為具有完全智能的機器將在二十年內(nèi)出現(xiàn)并給出了如下預(yù)言：

1958年，H. A. Simon，Allen Newell：“十年之內(nèi)，數(shù)字計算機將成為國際象棋世界冠軍?！?“十年之內(nèi)，數(shù)字計算機將發(fā)現(xiàn)并證明一個重要的數(shù)學(xué)定理?！?/p>

1965年，H. A. Simon：“二十年內(nèi)，機器將能完成人能做到的一切工作?！?/p>

1967年，Marvin Minsky：“一代之內(nèi)……創(chuàng)造“人工智能”的問題將獲得實質(zhì)上的解決?！?/p>

1970年，Marvin Minsky：“在三到八年的時間里我們將得到一臺具有人類平均智能的機器。”

美國政府向這一新興領(lǐng)域投入了大筆資金，每年將數(shù)百萬美元投入到麻省理工學(xué)院、卡耐基梅隆大學(xué)、愛丁堡大學(xué)和斯坦福大學(xué)四個研究機構(gòu)，并允許研究學(xué)者去做任何感興趣的方向。

當(dāng)時主要成就：

人工神經(jīng)網(wǎng)絡(luò)在30-50年代被提出，1951年Marvin Minsky制造出第一臺神經(jīng)網(wǎng)絡(luò)機
貝爾曼公式（增強學(xué)習(xí)雛形）被提出
感知器（深度學(xué)習(xí)雛形）被提出
搜索式推理被提出
自然語言被提出
首次提出人工智能擁有模仿智能的特征，懂得使用語言，懂得形成抽象概念并解決人類現(xiàn)存問題
Arthur Samuel在五十年代中期和六十年代初開發(fā)的國際象棋程序，棋力已經(jīng)可以挑戰(zhàn)具有相當(dāng)水平的業(yè)余愛好者
機器人SHAKEY項目受到了大力宣傳，它能夠?qū)ψ约旱男袨檫M行“推理”；人們將其視作世界上第一臺通用機器人
微世界的提出

第一次寒冬（1974年—1980年）

70年代初，AI遭遇到瓶頸。研究學(xué)者逐漸發(fā)現(xiàn)，雖然機器擁有了簡單的邏輯推理能力，但遭遇到當(dāng)時無法克服的基礎(chǔ)性障礙，AI停留在“玩具”階段止步不前，遠(yuǎn)遠(yuǎn)達不到曾經(jīng)預(yù)言的完全智能。由于此前的過于樂觀使人們期待過高，當(dāng)AI研究人員的承諾無法兌現(xiàn)時，公眾開始激烈批評AI研究人員，許多機構(gòu)不斷減少對人工智能研究的資助，直至停止撥款。

當(dāng)時主要問題：

計算機運算能力遭遇瓶頸，無法解決指數(shù)型爆炸的復(fù)雜計算問題
常識和推理需要大量對世界的認(rèn)識信息，計算機達不到“看懂”和“聽懂”的地步
無法解決莫拉維克悖論
無法解決部分涉及自動規(guī)劃的邏輯問題
神經(jīng)網(wǎng)絡(luò)研究學(xué)者遭遇冷落

說明：莫拉維克悖論：如果機器像數(shù)學(xué)天才一樣下象棋，那么它能模仿嬰兒學(xué)習(xí)又有多難呢？然而，事實證明這是相當(dāng)難的。

第二次發(fā)展高潮（1980年—1987年）

80年代初，一類名為“專家系統(tǒng)”的AI程序開始為全世界的公司所采納，人工智能研究迎來了新一輪高潮。在這期間，卡耐基梅隆大學(xué)為DEC公司設(shè)計的XCON專家系統(tǒng)能夠每年為DEC公司節(jié)省數(shù)千萬美金。日本經(jīng)濟產(chǎn)業(yè)省撥款八億五千萬美元支持第五代計算機項目。其目標(biāo)是造出能夠與人對話、翻譯語言、解釋圖像、能夠像人一樣推理的機器。其他國家也紛紛作出了響應(yīng)，并對AI和信息技術(shù)的大規(guī)模項目提供了巨額資助。

說明：專家系統(tǒng)是一種程序，能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。由于專家系統(tǒng)僅限于一個很小的領(lǐng)域，從而避免了常識問題?！爸R處理”隨之也成為了主流 AI 研究的焦點。

當(dāng)時主要成就：

專家系統(tǒng)的誕生
AI研究人員發(fā)現(xiàn)智能可能需要建立在對分門別類的大量知識的多種處理方法之上
BP算法實現(xiàn)了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的突破，神經(jīng)網(wǎng)絡(luò)研究學(xué)者重新受到關(guān)注
AI研究人員首次提出：機器為了獲得真正的智能，機器必須具有軀體，它需要有感知、移動、生存，與這個世界交互的能力。感知運動技能對于常識推理等高層次技能是至關(guān)重要的，基于對事物的推理能力比抽象能力更為重要，這也促進了未來自然語言、機器視覺的發(fā)展。

第二次寒冬（1987年—1993年）

1987年，AI硬件的市場需求突然下跌?？茖W(xué)家發(fā)現(xiàn)，專家系統(tǒng)雖然很有用，但它的應(yīng)用領(lǐng)域過于狹窄，而且更新迭代和維護成本非常高。同期美國Apple和IBM生產(chǎn)的臺式機性能不斷提升，個人電腦的理念不斷蔓延；日本人設(shè)定的“第五代工程”最終也沒能實現(xiàn)。人工智能研究再次遭遇了財政困難，一夜之間這個價值五億美元的產(chǎn)業(yè)土崩瓦解。

當(dāng)時主要問題：

受到臺式機和“個人電腦”理念的沖擊影響
商業(yè)機構(gòu)對AI的追捧和冷落，使AI化為泡沫并破裂
計算機性能瓶頸仍無法突破
仍然缺乏海量數(shù)據(jù)訓(xùn)練機器

第三次發(fā)展高潮（1993年至今）

在摩爾定律下，計算機性能不斷突破。云計算、大數(shù)據(jù)、機器學(xué)習(xí)、自然語言和機器視覺等領(lǐng)域發(fā)展迅速，人工智能迎來第三次高潮。

摩爾定律起始于Gordon Moore在1965年的一個預(yù)言，當(dāng)時他看到因特爾公司做的幾款芯片，覺得18到24個月可以把晶體管體積縮小一半，個數(shù)可以翻一番，運算處理能力能翻一倍。沒想到這么一個簡單的預(yù)言成真了，下面幾十年一直按這個節(jié)奏往前走，成為了摩爾定律。

主要事件：

1997年：IBM的國際象棋機器人深藍(lán)戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫
2005年：Stanford開發(fā)的一臺機器人在一條沙漠小徑上成功地自動行駛了131英里，贏得了DARPA挑戰(zhàn)大賽頭獎；
2006年：Geoffrey Hinton提出多層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法；Eric Schmidt在搜索引擎大會提出“云計算”概念
2010年：Sebastian Thrun領(lǐng)導(dǎo)的谷歌無人駕駛汽車曝光，創(chuàng)下了超過16萬千米無事故的紀(jì)錄
2011年：IBM Waston參加智力游戲《危險邊緣》，擊敗最高獎金得主Brad Rutter和連勝紀(jì)錄保持者Ken Jennings；蘋果發(fā)布語音個人助手Siri；Nest Lab發(fā)布第一代智能恒溫器Nest。它可以了解用戶的習(xí)慣，并相應(yīng)自動地調(diào)節(jié)溫度
2012年：Google發(fā)布個人助理Google Now
2013年：深度學(xué)習(xí)算法在語音和視覺識別率獲得突破性進展
2014年：微軟亞洲研究院發(fā)布人工智能小冰聊天機器人和語音助手Cortana；百度發(fā)布Deep Speech語音識別系統(tǒng)
2015年：Facebook發(fā)布了一款基于文本的人工智能助理“M”
2016年：Google AlphaGo以比分4:1戰(zhàn)勝圍棋九段棋手李世石；Chatbots這個概念開始流行；Google發(fā)布為機器學(xué)習(xí)定制的第一代專用芯片TPU；Google發(fā)布語音助手Assistant
2017年：AlphaGO在圍棋網(wǎng)絡(luò)對戰(zhàn)平臺以60連勝擊敗世界各地高手；Google 開源深度學(xué)習(xí)系統(tǒng)Tensorflow 1.0正式發(fā)布；Google AlphaGo以比分3:0完勝世界第一圍棋九段棋手柯潔；默默深耕機器學(xué)習(xí)和機器視覺的蘋果在WWDC上發(fā)布Core ML，ARKit等組件；Google發(fā)布了ARCore SDK；百度AI開發(fā)者大會正式發(fā)布Dueros語音系統(tǒng)，無人駕駛平臺Apollo1.0自動駕駛平臺；華為發(fā)布全球第一款A(yù)I移動芯片麒麟970；iPhone X配備前置 3D 感應(yīng)攝像頭(TrueDepth)，臉部識別點達到3W個，具備人臉識別、解鎖和支付等功能；配備的A11 Bionic神經(jīng)引擎使用雙核設(shè)計，每秒可達到運算6000億次

很多專家學(xué)者對此次人工智能浪潮給予了肯定，認(rèn)為這次人工智能浪潮能引起第四次工業(yè)革命。人工智能逐漸開始在保險，金融等領(lǐng)域開始滲透，在未來健康醫(yī)療、交通出行、銷售消費、金融服務(wù)、媒介娛樂、生產(chǎn)制造，到能源、石油、農(nóng)業(yè)、政府……所有垂直產(chǎn)業(yè)都將因人工智能技術(shù)的發(fā)展而受益，那么我們現(xiàn)在講的人工智能究竟是什么？

人工智能是什么？

在60年代，AI研究人員認(rèn)為人工智能是一臺通用機器人，它擁有模仿智能的特征，懂得使用語言，懂得形成抽象概念，能夠?qū)ψ约旱男袨檫M行推理，它可以解決人類現(xiàn)存問題。由于理念、技術(shù)和數(shù)據(jù)的限制，人工智能在模式識別、信息表示、問題解決和自然語言處理等不同領(lǐng)域發(fā)展緩慢。

80年代，AI研究人員轉(zhuǎn)移方向，認(rèn)為人工智能對事物的推理能力比抽象能力更重要，機器為了獲得真正的智能，機器必須具有軀體，它需要感知、移動、生存，與這個世界交互。為了積累更多推理能力，AI研究人員開發(fā)出專家系統(tǒng)，它能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。

1997年，IBM的超級計算機深藍(lán)在國際象棋領(lǐng)域完勝整個人類代表卡斯帕羅夫；相隔20年，Google的AlphaGo在圍棋領(lǐng)域完勝整個人類代表柯潔。劃時代的事件使大部分AI研究人員確信人工智能的時代已經(jīng)降臨。

可能大家覺得國際象棋和圍棋好像沒什么區(qū)別，其實兩者的難度不在同一個級別。國際象棋走法的可能性雖多，但棋盤的大小和每顆棋子的規(guī)則大大限制了贏的可能性。深藍(lán)可以通過蠻力看到所有的可能性，而且只需要一臺計算機基本上就可以搞定。相比國際象棋，圍棋很不一樣。圍棋布局走法的可能性可能要比宇宙中的原子數(shù)量還多，幾十臺計算機的計算能力都搞不定，所以機器下圍棋想贏非常困難，包括圍棋專家和人工智能領(lǐng)域的專家們也紛紛斷言：計算機要在圍棋領(lǐng)域戰(zhàn)勝人類棋手，還要再等100年。結(jié)果機器真的做到了，并據(jù)說AlphaGo擁有圍棋十幾段的實力（目前圍棋棋手最高是9段）。

那么深藍(lán)和AlphaGo在本質(zhì)上有什么區(qū)別？簡單點說，深藍(lán)的代碼是研究人員編程的，知識和經(jīng)驗也是研究人員傳授的，所以可以認(rèn)為與卡斯帕羅夫?qū)?zhàn)的深藍(lán)的背后還是人類，只不過它的運算能力比人類更強，更少失誤。而AlphaGo的代碼是自我更新的，知識和經(jīng)驗是自我訓(xùn)練出來的。與深藍(lán)不一樣的是，AlphaGo擁有兩顆大腦，一顆負(fù)責(zé)預(yù)測落子的最佳概率，一顆做整體的局面判斷，通過兩顆大腦的協(xié)同工作，它能夠判斷出未來幾十步的勝率大小。所以與柯潔對戰(zhàn)的AlphaGo的背后是通過十幾萬盤的海量訓(xùn)練后，擁有自主學(xué)習(xí)能力的人工智能系統(tǒng)。

這時候社會上出現(xiàn)了不同的聲音：“人工智能會思考并解決所有問題”、“人工智能會搶走人類的大部分工作！”“人工智能會取代人類嗎？”那么已來臨的人工智能究竟是什么？

人工智能目前有兩個定義，分別為強人工智能和弱人工智能。

普通群眾所遐想的人工智能屬于強人工智能，它屬于通用型機器人，也就是60年代AI研究人員提出的理念。它能夠和人類一樣對世界進行感知和交互，通過自我學(xué)習(xí)的方式對所有領(lǐng)域進行記憶、推理和解決問題。這樣的強人工智能需要具備以下能力：

存在不確定因素時進行推理，使用策略，解決問題，制定決策的能力
知識表示的能力，包括常識性知識的表示能力
規(guī)劃能力
學(xué)習(xí)能力
使用自然語言進行交流溝通的能力
將上述能力整合起來實現(xiàn)既定目標(biāo)的能力

說明：以上結(jié)論借鑒李開復(fù)所著的《人工智能》一書。

這些能力在常人看來都很簡單，因為自己都具備著；但由于技術(shù)的限制，計算機很難具備以上能力，這也是為什么現(xiàn)階段人工智能很難達到常人思考的水平。

由于技術(shù)未成熟，現(xiàn)階段的人工智能屬于弱人工智能，還達不到大眾所遐想的強人工智能。弱人工智能也稱限制領(lǐng)域人工智能或應(yīng)用型人工智能，指的是專注于且只能解決特定領(lǐng)域問題的人工智能，例如AlphaGo，它自身的數(shù)學(xué)模型只能解決圍棋領(lǐng)域的問題，可以說它是一個非常狹小領(lǐng)域問題的專家系統(tǒng)，以及它很難擴展到稍微寬廣一些的知識領(lǐng)域，例如如何通過一盤棋表達出自己的性格和靈魂。

弱人工智能和強人工智能在能力上存在著巨大鴻溝，弱人工智能想要進一步發(fā)展，必須具備以下能力：

跨領(lǐng)域推理
擁有抽象能力
“知其然，也知其所以然”
擁有常識
擁有審美能力
擁有自我意識和情感

說明：以上結(jié)論借鑒李開復(fù)所著的《人工智能》一書。

在計算機理念來說，人工智能是用來處理不確定性以及管理決策中的不確定性。意思是通過一些不確定的數(shù)據(jù)輸入來進行一些具有不確定性的決策。從目前的技術(shù)實現(xiàn)來說，人工智能就是深度學(xué)習(xí)，它是06年由Geoffrey Hinton所提出的機器學(xué)習(xí)算法，該算法可以使程序擁有自我學(xué)習(xí)和演變的能力。

機器學(xué)習(xí)和深度學(xué)習(xí)是什么？

機器學(xué)習(xí)簡單點說就是通過一個數(shù)學(xué)模型將大量數(shù)據(jù)中有用的數(shù)據(jù)和關(guān)系挖掘出來。機器學(xué)習(xí)建模采用了以下四種方法：

監(jiān)督學(xué)習(xí)與數(shù)學(xué)中的函數(shù)有關(guān)。它需要研究學(xué)者不斷地標(biāo)注數(shù)據(jù)從而提高模型的準(zhǔn)確性，挖掘出數(shù)據(jù)間的關(guān)系并給出結(jié)果。
非監(jiān)督學(xué)習(xí)與現(xiàn)實中的描述（例如哪些動物有四條腿）有關(guān)。它可以在沒有額外信息的情況下，從原始數(shù)據(jù)中提取模式和結(jié)構(gòu)的任務(wù)，它與需要標(biāo)簽的監(jiān)督學(xué)習(xí)相互對立。
半監(jiān)督學(xué)習(xí)，它可以理解為監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的結(jié)合。
增強學(xué)習(xí)，它的大概意思是通過聯(lián)想并對比未來幾步所帶來的好處而決定下一步是什么。

目前機器學(xué)習(xí)以監(jiān)督學(xué)習(xí)為主。

深度學(xué)習(xí)屬于機器學(xué)習(xí)下面的一條分支。它能夠通過多層神經(jīng)網(wǎng)絡(luò)以及使用以上四種方法，不斷對自身模型進行自我優(yōu)化，從而發(fā)現(xiàn)出更多優(yōu)質(zhì)的數(shù)據(jù)以及聯(lián)系。

目前的AlphaGo正是采用了深度學(xué)習(xí)算法擊敗了人類世界冠軍，更重要的是，深度學(xué)習(xí)促進了人工智能其他領(lǐng)域如自然語言和機器視覺的發(fā)展。目前的人工智能的發(fā)展依賴深度學(xué)習(xí)，這句話沒有任何問題。

人工智能基礎(chǔ)能力

在了解人工智能基礎(chǔ)能力前，我們先聊聊更底層的東西——數(shù)據(jù)。計算機數(shù)據(jù)分為兩種，結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指具有預(yù)定義的數(shù)據(jù)模型的數(shù)據(jù)，它的本質(zhì)是將所有數(shù)據(jù)標(biāo)簽化、結(jié)構(gòu)化，后續(xù)只要確定標(biāo)簽，數(shù)據(jù)就能讀取出來，這種方式容易被計算機理解。非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或者不完整，沒有預(yù)定義的數(shù)據(jù)模型的數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)格式多樣化，包括了圖片、音頻、視頻、文本、網(wǎng)頁等等，它比結(jié)構(gòu)化信息更難標(biāo)準(zhǔn)化和理解。

音頻、圖片、文本、視頻這四種載體可以承載著來自世界萬物的信息，人類在理解這些內(nèi)容時毫不費勁；對于只懂結(jié)構(gòu)化數(shù)據(jù)的計算機來說，理解這些非結(jié)構(gòu)化內(nèi)容比登天還難，這也就是為什么人與計算機交流時非常費勁。

全世界有80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù)，人工智能想要達到看懂、聽懂的狀態(tài)，必須要把非結(jié)構(gòu)化數(shù)據(jù)這塊硬骨頭啃下來。學(xué)者在深度學(xué)習(xí)的幫助下在這領(lǐng)域取得了突破性成就，這成就為人工智能其他各種能力奠定了基礎(chǔ)。

如果將人工智能比作一個人，那么人工智能應(yīng)該具有記憶思考能力，輸入能力如視覺、聽覺、嗅覺、味覺以及觸覺，以及輸出能力如語言交流、軀體活動。以上能力對相應(yīng)的術(shù)語為：深度學(xué)習(xí)、知識圖譜、遷移學(xué)習(xí)、自然語言處理、機器視覺、語音識別、語音合成（觸覺、嗅覺、味覺在技術(shù)研究上暫無商業(yè)成果，軀體活動更多屬于機器人領(lǐng)域，不在文章中過多介紹）

簡單點說，知識圖譜就是一張地圖。它從不同來源收集信息并加以整理，每個信息都是一個節(jié)點，當(dāng)信息之間有關(guān)系時，相關(guān)節(jié)點會建立起聯(lián)系，眾多信息節(jié)點逐漸形成了圖。知識圖譜有助于信息存儲，更重要的是提高了搜索信息的速度和質(zhì)量。

遷移學(xué)習(xí)把已學(xué)訓(xùn)練好的模型參數(shù)遷移到新的模型來幫助新模型訓(xùn)練數(shù)據(jù)集。由于大部分領(lǐng)域都沒有足夠的數(shù)據(jù)量進行模型訓(xùn)練，遷移學(xué)習(xí)可以將大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上，實現(xiàn)個性化遷移，如同人類思考時使用的類比推理。遷移學(xué)習(xí)有助于人工智能掌握更多知識。

自然語言處理是一門融語言學(xué)、計算機科學(xué)、數(shù)學(xué)于一體的學(xué)科，它是人工智能的耳朵-語音識別和嘴巴-語音合成的基礎(chǔ)。計算機能否理解人類的思想，首先要理解自然語言，其次擁有廣泛的知識，以及運用這些知識的能力。自然語言處理的主要范疇非常廣，包括了語音合成、語音識別、語句分詞、詞性標(biāo)注、語法分析、語句分析、機器翻譯、自動摘要等等、問答系統(tǒng)等等。

機器視覺通過攝影機和計算機代替人的眼睛對目標(biāo)進行識別、跟蹤和測量，并進一步對圖像進行處理。這是一門研究如何使機器“看懂”的技術(shù)，是人工智能最重要的輸入方式之一。如何通過攝像頭就能做到實時、準(zhǔn)確識別外界狀況，這是人工智能的瓶頸之一，深度學(xué)習(xí)在這方面幫了大忙。現(xiàn)在熱門的人臉識別、無人駕駛等技術(shù)都依賴于機器視覺技術(shù)。

語音識別的目的是將人類的語音內(nèi)容轉(zhuǎn)換為相應(yīng)的文字。機器能否與人類自然交流的前提是機器能聽懂人類講什么，語音識別也是人工智能的最重要輸入方式之一。由于不同地區(qū)有著不同方言和口音，這對于語音識別來說都是巨大的挑戰(zhàn)。目前百度、科大訊飛等公司的語音識別技術(shù)在普通話上的準(zhǔn)確率已達到97%，但方言準(zhǔn)確率還有待提高。

目前大部分的語音合成技術(shù)是利用在數(shù)據(jù)庫內(nèi)的許多已錄好的語音連接起來，但由于缺乏對上下文的理解以及情感的表達，朗讀效果很差。現(xiàn)在百度和科大訊飛等公司在語音合成上有新的成果：16年3月百度語音合成了張國榮聲音與粉絲互動；17年3月本邦科技利用科大訊飛的語音合成技術(shù)，成功幫助小米手機實現(xiàn)了一款內(nèi)含“黑科技”的營銷活動H5。它們的主要技術(shù)是通過對張國榮、馬東的語音資料進行語音識別，提取該人的聲紋和說話特征，再通過自然語言處理對講述的內(nèi)容進行情緒識別，合成出來的語音就像本人在和你對話。新的語音合成技術(shù)不再被數(shù)據(jù)庫內(nèi)的錄音所限制語言和情感的表達。

經(jīng)過多年的人工智能研究，人工智能的主要發(fā)展方向分為：計算智能、感知智能、認(rèn)知智能，這一觀點也得到業(yè)界的廣泛認(rèn)可。

計算智能是以生物進化的觀點認(rèn)識和模擬智能。有學(xué)者認(rèn)為，智能是在生物的遺傳、變異、生長以及外部環(huán)境的自然選擇中產(chǎn)生的。在用進廢退、優(yōu)勝劣汰的過程中，適應(yīng)度高的（頭腦）結(jié)構(gòu)被保存下來，智能水平也隨之提高。機器借助大自然規(guī)律的啟示設(shè)計出具有結(jié)構(gòu)演化能力和自適應(yīng)學(xué)習(xí)能力的智能。計算智能算法主要包括神經(jīng)計算、模糊計算和進化計算三大部分，神經(jīng)網(wǎng)絡(luò)和遺傳算法的出現(xiàn)，使得機器的運算能力大幅度提升，能夠更高效、快速處理海量的數(shù)據(jù)。計算智能是人工智能的基礎(chǔ)，AlphaGo是計算智能的代表。

感知智能是以視覺、聽覺、觸覺等感知能力輔助機器，讓機器能聽懂我們的語言、看懂世界萬物。相比起人類的感知能力，機器可以通過傳感器獲取更多信息，例如溫度傳感器、濕度傳感器、紅外雷達、激光雷達等等。感知智能也是人工智能的基礎(chǔ)，機器人、自動駕駛汽車是感知智能的代表。

認(rèn)知智能是指機器具有主動思考和理解的能力，不用人類事先編程就可以實現(xiàn)自我學(xué)習(xí)，有目的推理并與人類自然交互。人類有語言，才有概念、推理，所以概念、意識、觀念等都是人類認(rèn)知智能的表現(xiàn)，機器實現(xiàn)以上能力還有漫長的路需要探索。

在認(rèn)知智能的幫助下，人工智能通過發(fā)現(xiàn)世界和歷史上海量的有用信息，并洞察信息間的關(guān)系，不斷優(yōu)化自己的決策能力，從而擁有專家級別的實力，輔助人類做出決策。認(rèn)知智能將加強人和人工智能之間的互動，這種互動是以每個人的偏好為基礎(chǔ)的。認(rèn)知智能通過搜集到的數(shù)據(jù)，例如地理位置、瀏覽歷史、可穿戴設(shè)備數(shù)據(jù)和醫(yī)療記錄等等，為不同個體創(chuàng)造不同的場景。認(rèn)知系統(tǒng)也會根據(jù)當(dāng)前場景以及人和機器的關(guān)系，采取不同的語氣和情感進行交流。

假如能像設(shè)想的一樣實現(xiàn)認(rèn)知智能，那么底層平臺必須足夠?qū)拸V和靈活，以便在各領(lǐng)域甚至跨領(lǐng)域得到應(yīng)用。因此研發(fā)人員需要從全局性出發(fā)，打造這個健壯的底層平臺，它應(yīng)該包括機器學(xué)習(xí)、自然語言處理、語音和圖像識別、人機交互等技術(shù)，便于上層應(yīng)用開發(fā)者的開發(fā)和使用。

下一篇文章會從設(shè)計底層平臺的角度來闡述個人的思考。