人工智能與設(shè)計(1):人工智能的發(fā)展和定義
本文是主題為“人工智能與設(shè)計”系列文章的第一篇,主要講述現(xiàn)在人工智能的基礎(chǔ)知識,enjoy~
今年年初出于個人興趣,我開始了對人工智能的研究。為了更好理解人工智能和設(shè)計的關(guān)系,我開始學(xué)習(xí)機器學(xué)習(xí)、深度學(xué)習(xí)、Alexa開發(fā)等知識,從當(dāng)初覺得人工智能只會讓大部分設(shè)計師失業(yè),到現(xiàn)在覺得人工智能只是一個設(shè)計的輔助工具,也算是成長了不少。
這次希望能將積累的知識寫成一本電子書,沒別的,因為字太多,更重要的是這樣很酷。由寫作時間可能太長,互聯(lián)網(wǎng)每天都在變化,一些比較前沿的思考可能轉(zhuǎn)眼成為現(xiàn)實,所以先把前四章陸續(xù)發(fā)出來。
前四章主要講了現(xiàn)在人工智能的基礎(chǔ)知識、底層設(shè)計、互聯(lián)網(wǎng)產(chǎn)品設(shè)計以及人工智能與設(shè)計的關(guān)系,后面會通過3~4章詳細(xì)分析人工智能對不同行業(yè)設(shè)計的影響,目前考慮的領(lǐng)域是室內(nèi)設(shè)計、公共設(shè)計和服務(wù)設(shè)計。
人工智能的發(fā)展歷史
說起人工智能這詞,不得不提及人工智能的歷史。人工智能的概念主要由Alan Turing提出:機器會思考嗎?如果一臺機器能夠與人類對話而不被辨別出其機器的身份,那么這臺機器具有智能的特征。同年,Alan Turing還預(yù)言了存有一定的可能性可以創(chuàng)造出具有真正智能的機器。
說明:Alan Turing(1912.6.23-1954.6.7)曾協(xié)助英國軍隊破解了德國的著名密碼系統(tǒng)Enigma,幫助盟軍取得了二戰(zhàn)的勝利。因提出一種用于判定機器是否具有智能的試驗方法,即圖靈試驗,被后人稱為計算機之父和人工智能之父。
AI誕生
1956年,在達特茅斯學(xué)院舉行的一次會議上,不同領(lǐng)域(數(shù)學(xué),心理學(xué),工程學(xué),經(jīng)濟學(xué)和政治學(xué))的科學(xué)家正式確立了人工智能為研究學(xué)科。
2006年達特茅斯會議當(dāng)事人重聚,左起:Trenchard More、John McCarthy、Marvin? Minsky、Oliver Selfridge、Ray Solomonoff
第一次發(fā)展高潮(1955年—1974年)
達特茅斯會議之后是大發(fā)現(xiàn)的時代。對很多人來講,這一階段開發(fā)出來的程序堪稱神奇:計算機可以解決代數(shù)應(yīng)用題、證明幾何定理、學(xué)習(xí)和使用英語。在眾多研究當(dāng)中,搜索式推理、自然語言、微世界在當(dāng)時最具影響力。
大量成功的AI程序和新的研究方向不斷涌現(xiàn),研究學(xué)者認(rèn)為具有完全智能的機器將在二十年內(nèi)出現(xiàn)并給出了如下預(yù)言:
1958年,H. A. Simon,Allen Newell:“十年之內(nèi),數(shù)字計算機將成為國際象棋世界冠軍?!?“十年之內(nèi),數(shù)字計算機將發(fā)現(xiàn)并證明一個重要的數(shù)學(xué)定理?!?/p>
1965年,H. A. Simon:“二十年內(nèi),機器將能完成人能做到的一切工作?!?/p>
1967年,Marvin Minsky:“一代之內(nèi)……創(chuàng)造“人工智能”的問題將獲得實質(zhì)上的解決?!?/p>
1970年,Marvin Minsky:“在三到八年的時間里我們將得到一臺具有人類平均智能的機器。”
美國政府向這一新興領(lǐng)域投入了大筆資金,每年將數(shù)百萬美元投入到麻省理工學(xué)院、卡耐基梅隆大學(xué)、愛丁堡大學(xué)和斯坦福大學(xué)四個研究機構(gòu),并允許研究學(xué)者去做任何感興趣的方向。
當(dāng)時主要成就:
- 人工神經(jīng)網(wǎng)絡(luò)在30-50年代被提出,1951年Marvin Minsky制造出第一臺神經(jīng)網(wǎng)絡(luò)機
- 貝爾曼公式(增強學(xué)習(xí)雛形)被提出
- 感知器(深度學(xué)習(xí)雛形)被提出
- 搜索式推理被提出
- 自然語言被提出
- 首次提出人工智能擁有模仿智能的特征,懂得使用語言,懂得形成抽象概念并解決人類現(xiàn)存問題
- Arthur Samuel在五十年代中期和六十年代初開發(fā)的國際象棋程序,棋力已經(jīng)可以挑戰(zhàn)具有相當(dāng)水平的業(yè)余愛好者
- 機器人SHAKEY項目受到了大力宣傳,它能夠?qū)ψ约旱男袨檫M行“推理”;人們將其視作世界上第一臺通用機器人
- 微世界的提出
第一次寒冬(1974年—1980年)
70年代初,AI遭遇到瓶頸。研究學(xué)者逐漸發(fā)現(xiàn),雖然機器擁有了簡單的邏輯推理能力,但遭遇到當(dāng)時無法克服的基礎(chǔ)性障礙,AI停留在“玩具”階段止步不前,遠(yuǎn)遠(yuǎn)達不到曾經(jīng)預(yù)言的完全智能。由于此前的過于樂觀使人們期待過高,當(dāng)AI研究人員的承諾無法兌現(xiàn)時,公眾開始激烈批評AI研究人員,許多機構(gòu)不斷減少對人工智能研究的資助,直至停止撥款。
當(dāng)時主要問題:
- 計算機運算能力遭遇瓶頸,無法解決指數(shù)型爆炸的復(fù)雜計算問題
- 常識和推理需要大量對世界的認(rèn)識信息,計算機達不到“看懂”和“聽懂”的地步
- 無法解決莫拉維克悖論
- 無法解決部分涉及自動規(guī)劃的邏輯問題
- 神經(jīng)網(wǎng)絡(luò)研究學(xué)者遭遇冷落
說明:莫拉維克悖論:如果機器像數(shù)學(xué)天才一樣下象棋,那么它能模仿嬰兒學(xué)習(xí)又有多難呢?然而,事實證明這是相當(dāng)難的。
第二次發(fā)展高潮(1980年—1987年)
80年代初,一類名為“專家系統(tǒng)”的AI程序開始為全世界的公司所采納,人工智能研究迎來了新一輪高潮。在這期間,卡耐基梅隆大學(xué)為DEC公司設(shè)計的XCON專家系統(tǒng)能夠每年為DEC公司節(jié)省數(shù)千萬美金。日本經(jīng)濟產(chǎn)業(yè)省撥款八億五千萬美元支持第五代計算機項目。其目標(biāo)是造出能夠與人對話、翻譯語言、解釋圖像、能夠像人一樣推理的機器。其他國家也紛紛作出了響應(yīng),并對AI和信息技術(shù)的大規(guī)模項目提供了巨額資助。
說明:專家系統(tǒng)是一種程序,能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。由于專家系統(tǒng)僅限于一個很小的領(lǐng)域,從而避免了常識問題?!爸R處理”隨之也成為了主流 AI 研究的焦點。
當(dāng)時主要成就:
- 專家系統(tǒng)的誕生
- AI研究人員發(fā)現(xiàn)智能可能需要建立在對分門別類的大量知識的多種處理方法之上
- BP算法實現(xiàn)了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的突破,神經(jīng)網(wǎng)絡(luò)研究學(xué)者重新受到關(guān)注
- AI研究人員首次提出:機器為了獲得真正的智能,機器必須具有軀體,它需要有感知、移動、生存,與這個世界交互的能力。感知運動技能對于常識推理等高層次技能是至關(guān)重要的,基于對事物的推理能力比抽象能力更為重要,這也促進了未來自然語言、機器視覺的發(fā)展。
第二次寒冬(1987年—1993年)
1987年,AI硬件的市場需求突然下跌??茖W(xué)家發(fā)現(xiàn),專家系統(tǒng)雖然很有用,但它的應(yīng)用領(lǐng)域過于狹窄,而且更新迭代和維護成本非常高。同期美國Apple和IBM生產(chǎn)的臺式機性能不斷提升,個人電腦的理念不斷蔓延;日本人設(shè)定的“第五代工程”最終也沒能實現(xiàn)。人工智能研究再次遭遇了財政困難,一夜之間這個價值五億美元的產(chǎn)業(yè)土崩瓦解。
當(dāng)時主要問題:
- 受到臺式機和“個人電腦”理念的沖擊影響
- 商業(yè)機構(gòu)對AI的追捧和冷落,使AI化為泡沫并破裂
- 計算機性能瓶頸仍無法突破
- 仍然缺乏海量數(shù)據(jù)訓(xùn)練機器
第三次發(fā)展高潮(1993年至今)
在摩爾定律下,計算機性能不斷突破。云計算、大數(shù)據(jù)、機器學(xué)習(xí)、自然語言和機器視覺等領(lǐng)域發(fā)展迅速,人工智能迎來第三次高潮。
摩爾定律起始于Gordon Moore在1965年的一個預(yù)言,當(dāng)時他看到因特爾公司做的幾款芯片,覺得18到24個月可以把晶體管體積縮小一半,個數(shù)可以翻一番,運算處理能力能翻一倍。沒想到這么一個簡單的預(yù)言成真了,下面幾十年一直按這個節(jié)奏往前走,成為了摩爾定律。
主要事件:
- 1997年:IBM的國際象棋機器人深藍(lán)戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫
- 2005年:Stanford開發(fā)的一臺機器人在一條沙漠小徑上成功地自動行駛了131英里,贏得了DARPA挑戰(zhàn)大賽頭獎;
- 2006年:Geoffrey Hinton提出多層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法;Eric Schmidt在搜索引擎大會提出“云計算”概念
- 2010年:Sebastian Thrun領(lǐng)導(dǎo)的谷歌無人駕駛汽車曝光,創(chuàng)下了超過16萬千米無事故的紀(jì)錄
- 2011年:IBM Waston參加智力游戲《危險邊緣》,擊敗最高獎金得主Brad Rutter和連勝紀(jì)錄保持者Ken Jennings;蘋果發(fā)布語音個人助手Siri;Nest Lab發(fā)布第一代智能恒溫器Nest。它可以了解用戶的習(xí)慣,并相應(yīng)自動地調(diào)節(jié)溫度
- 2012年:Google發(fā)布個人助理Google Now
- 2013年:深度學(xué)習(xí)算法在語音和視覺識別率獲得突破性進展
- 2014年:微軟亞洲研究院發(fā)布人工智能小冰聊天機器人和語音助手Cortana;百度發(fā)布Deep Speech語音識別系統(tǒng)
- 2015年:Facebook發(fā)布了一款基于文本的人工智能助理“M”
- 2016年:Google AlphaGo以比分4:1戰(zhàn)勝圍棋九段棋手李世石;Chatbots這個概念開始流行;Google發(fā)布為機器學(xué)習(xí)定制的第一代專用芯片TPU;Google發(fā)布語音助手Assistant
- 2017年:AlphaGO在圍棋網(wǎng)絡(luò)對戰(zhàn)平臺以60連勝擊敗世界各地高手;Google 開源深度學(xué)習(xí)系統(tǒng)Tensorflow 1.0正式發(fā)布;Google AlphaGo以比分3:0完勝世界第一圍棋九段棋手柯潔;默默深耕機器學(xué)習(xí)和機器視覺的蘋果在WWDC上發(fā)布Core ML,ARKit等組件;Google發(fā)布了ARCore SDK;百度AI開發(fā)者大會正式發(fā)布Dueros語音系統(tǒng),無人駕駛平臺Apollo1.0自動駕駛平臺;華為發(fā)布全球第一款A(yù)I移動芯片麒麟970;iPhone X配備前置 3D 感應(yīng)攝像頭(TrueDepth),臉部識別點達到3W個,具備人臉識別、解鎖和支付等功能;配備的A11 Bionic神經(jīng)引擎使用雙核設(shè)計,每秒可達到運算6000億次
很多專家學(xué)者對此次人工智能浪潮給予了肯定,認(rèn)為這次人工智能浪潮能引起第四次工業(yè)革命。人工智能逐漸開始在保險,金融等領(lǐng)域開始滲透,在未來健康醫(yī)療、交通出行、銷售消費、金融服務(wù)、媒介娛樂、生產(chǎn)制造,到能源、石油、農(nóng)業(yè)、政府……所有垂直產(chǎn)業(yè)都將因人工智能技術(shù)的發(fā)展而受益,那么我們現(xiàn)在講的人工智能究竟是什么?
人工智能是什么?
在60年代,AI研究人員認(rèn)為人工智能是一臺通用機器人,它擁有模仿智能的特征,懂得使用語言,懂得形成抽象概念,能夠?qū)ψ约旱男袨檫M行推理,它可以解決人類現(xiàn)存問題。由于理念、技術(shù)和數(shù)據(jù)的限制,人工智能在模式識別、信息表示、問題解決和自然語言處理等不同領(lǐng)域發(fā)展緩慢。
80年代,AI研究人員轉(zhuǎn)移方向,認(rèn)為人工智能對事物的推理能力比抽象能力更重要,機器為了獲得真正的智能,機器必須具有軀體,它需要感知、移動、生存,與這個世界交互。為了積累更多推理能力,AI研究人員開發(fā)出專家系統(tǒng),它能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。
1997年,IBM的超級計算機深藍(lán)在國際象棋領(lǐng)域完勝整個人類代表卡斯帕羅夫;相隔20年,Google的AlphaGo在圍棋領(lǐng)域完勝整個人類代表柯潔。劃時代的事件使大部分AI研究人員確信人工智能的時代已經(jīng)降臨。
可能大家覺得國際象棋和圍棋好像沒什么區(qū)別,其實兩者的難度不在同一個級別。國際象棋走法的可能性雖多,但棋盤的大小和每顆棋子的規(guī)則大大限制了贏的可能性。深藍(lán)可以通過蠻力看到所有的可能性,而且只需要一臺計算機基本上就可以搞定。相比國際象棋,圍棋很不一樣。圍棋布局走法的可能性可能要比宇宙中的原子數(shù)量還多,幾十臺計算機的計算能力都搞不定,所以機器下圍棋想贏非常困難,包括圍棋專家和人工智能領(lǐng)域的專家們也紛紛斷言:計算機要在圍棋領(lǐng)域戰(zhàn)勝人類棋手,還要再等100年。結(jié)果機器真的做到了,并據(jù)說AlphaGo擁有圍棋十幾段的實力(目前圍棋棋手最高是9段)。
那么深藍(lán)和AlphaGo在本質(zhì)上有什么區(qū)別?簡單點說,深藍(lán)的代碼是研究人員編程的,知識和經(jīng)驗也是研究人員傳授的,所以可以認(rèn)為與卡斯帕羅夫?qū)?zhàn)的深藍(lán)的背后還是人類,只不過它的運算能力比人類更強,更少失誤。而AlphaGo的代碼是自我更新的,知識和經(jīng)驗是自我訓(xùn)練出來的。與深藍(lán)不一樣的是,AlphaGo擁有兩顆大腦,一顆負(fù)責(zé)預(yù)測落子的最佳概率,一顆做整體的局面判斷,通過兩顆大腦的協(xié)同工作,它能夠判斷出未來幾十步的勝率大小。所以與柯潔對戰(zhàn)的AlphaGo的背后是通過十幾萬盤的海量訓(xùn)練后,擁有自主學(xué)習(xí)能力的人工智能系統(tǒng)。
這時候社會上出現(xiàn)了不同的聲音:“人工智能會思考并解決所有問題”、“人工智能會搶走人類的大部分工作!”“人工智能會取代人類嗎?”那么已來臨的人工智能究竟是什么?
人工智能目前有兩個定義,分別為強人工智能和弱人工智能。
普通群眾所遐想的人工智能屬于強人工智能,它屬于通用型機器人,也就是60年代AI研究人員提出的理念。它能夠和人類一樣對世界進行感知和交互,通過自我學(xué)習(xí)的方式對所有領(lǐng)域進行記憶、推理和解決問題。這樣的強人工智能需要具備以下能力:
- 存在不確定因素時進行推理,使用策略,解決問題,制定決策的能力
- 知識表示的能力,包括常識性知識的表示能力
- 規(guī)劃能力
- 學(xué)習(xí)能力
- 使用自然語言進行交流溝通的能力
- 將上述能力整合起來實現(xiàn)既定目標(biāo)的能力
說明:以上結(jié)論借鑒李開復(fù)所著的《人工智能》一書。
這些能力在常人看來都很簡單,因為自己都具備著;但由于技術(shù)的限制,計算機很難具備以上能力,這也是為什么現(xiàn)階段人工智能很難達到常人思考的水平。
由于技術(shù)未成熟,現(xiàn)階段的人工智能屬于弱人工智能,還達不到大眾所遐想的強人工智能。弱人工智能也稱限制領(lǐng)域人工智能或應(yīng)用型人工智能,指的是專注于且只能解決特定領(lǐng)域問題的人工智能,例如AlphaGo,它自身的數(shù)學(xué)模型只能解決圍棋領(lǐng)域的問題,可以說它是一個非常狹小領(lǐng)域問題的專家系統(tǒng),以及它很難擴展到稍微寬廣一些的知識領(lǐng)域,例如如何通過一盤棋表達出自己的性格和靈魂。
弱人工智能和強人工智能在能力上存在著巨大鴻溝,弱人工智能想要進一步發(fā)展,必須具備以下能力:
- 跨領(lǐng)域推理
- 擁有抽象能力
- “知其然,也知其所以然”
- 擁有常識
- 擁有審美能力
- 擁有自我意識和情感
說明:以上結(jié)論借鑒李開復(fù)所著的《人工智能》一書。
在計算機理念來說,人工智能是用來處理不確定性以及管理決策中的不確定性。意思是通過一些不確定的數(shù)據(jù)輸入來進行一些具有不確定性的決策。從目前的技術(shù)實現(xiàn)來說,人工智能就是深度學(xué)習(xí),它是06年由Geoffrey Hinton所提出的機器學(xué)習(xí)算法,該算法可以使程序擁有自我學(xué)習(xí)和演變的能力。
機器學(xué)習(xí)和深度學(xué)習(xí)是什么?
機器學(xué)習(xí)簡單點說就是通過一個數(shù)學(xué)模型將大量數(shù)據(jù)中有用的數(shù)據(jù)和關(guān)系挖掘出來。機器學(xué)習(xí)建模采用了以下四種方法:
- 監(jiān)督學(xué)習(xí)與數(shù)學(xué)中的函數(shù)有關(guān)。它需要研究學(xué)者不斷地標(biāo)注數(shù)據(jù)從而提高模型的準(zhǔn)確性,挖掘出數(shù)據(jù)間的關(guān)系并給出結(jié)果。
- 非監(jiān)督學(xué)習(xí)與現(xiàn)實中的描述(例如哪些動物有四條腿)有關(guān)。它可以在沒有額外信息的情況下,從原始數(shù)據(jù)中提取模式和結(jié)構(gòu)的任務(wù),它與需要標(biāo)簽的監(jiān)督學(xué)習(xí)相互對立。
- 半監(jiān)督學(xué)習(xí),它可以理解為監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的結(jié)合。
- 增強學(xué)習(xí),它的大概意思是通過聯(lián)想并對比未來幾步所帶來的好處而決定下一步是什么。
目前機器學(xué)習(xí)以監(jiān)督學(xué)習(xí)為主。
深度學(xué)習(xí)屬于機器學(xué)習(xí)下面的一條分支。它能夠通過多層神經(jīng)網(wǎng)絡(luò)以及使用以上四種方法,不斷對自身模型進行自我優(yōu)化,從而發(fā)現(xiàn)出更多優(yōu)質(zhì)的數(shù)據(jù)以及聯(lián)系。
目前的AlphaGo正是采用了深度學(xué)習(xí)算法擊敗了人類世界冠軍,更重要的是,深度學(xué)習(xí)促進了人工智能其他領(lǐng)域如自然語言和機器視覺的發(fā)展。目前的人工智能的發(fā)展依賴深度學(xué)習(xí),這句話沒有任何問題。
人工智能基礎(chǔ)能力
在了解人工智能基礎(chǔ)能力前,我們先聊聊更底層的東西——數(shù)據(jù)。計算機數(shù)據(jù)分為兩種,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指具有預(yù)定義的數(shù)據(jù)模型的數(shù)據(jù),它的本質(zhì)是將所有數(shù)據(jù)標(biāo)簽化、結(jié)構(gòu)化,后續(xù)只要確定標(biāo)簽,數(shù)據(jù)就能讀取出來,這種方式容易被計算機理解。非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或者不完整,沒有預(yù)定義的數(shù)據(jù)模型的數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)格式多樣化,包括了圖片、音頻、視頻、文本、網(wǎng)頁等等,它比結(jié)構(gòu)化信息更難標(biāo)準(zhǔn)化和理解。
音頻、圖片、文本、視頻這四種載體可以承載著來自世界萬物的信息,人類在理解這些內(nèi)容時毫不費勁;對于只懂結(jié)構(gòu)化數(shù)據(jù)的計算機來說,理解這些非結(jié)構(gòu)化內(nèi)容比登天還難,這也就是為什么人與計算機交流時非常費勁。
全世界有80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),人工智能想要達到看懂、聽懂的狀態(tài),必須要把非結(jié)構(gòu)化數(shù)據(jù)這塊硬骨頭啃下來。學(xué)者在深度學(xué)習(xí)的幫助下在這領(lǐng)域取得了突破性成就,這成就為人工智能其他各種能力奠定了基礎(chǔ)。
如果將人工智能比作一個人,那么人工智能應(yīng)該具有記憶思考能力,輸入能力如視覺、聽覺、嗅覺、味覺以及觸覺,以及輸出能力如語言交流、軀體活動。以上能力對相應(yīng)的術(shù)語為:深度學(xué)習(xí)、知識圖譜、遷移學(xué)習(xí)、自然語言處理、機器視覺、語音識別、語音合成(觸覺、嗅覺、味覺在技術(shù)研究上暫無商業(yè)成果,軀體活動更多屬于機器人領(lǐng)域,不在文章中過多介紹)
簡單點說,知識圖譜就是一張地圖。它從不同來源收集信息并加以整理,每個信息都是一個節(jié)點,當(dāng)信息之間有關(guān)系時,相關(guān)節(jié)點會建立起聯(lián)系,眾多信息節(jié)點逐漸形成了圖。知識圖譜有助于信息存儲,更重要的是提高了搜索信息的速度和質(zhì)量。
遷移學(xué)習(xí)把已學(xué)訓(xùn)練好的模型參數(shù)遷移到新的模型來幫助新模型訓(xùn)練數(shù)據(jù)集。由于大部分領(lǐng)域都沒有足夠的數(shù)據(jù)量進行模型訓(xùn)練,遷移學(xué)習(xí)可以將大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上,實現(xiàn)個性化遷移,如同人類思考時使用的類比推理。遷移學(xué)習(xí)有助于人工智能掌握更多知識。
自然語言處理是一門融語言學(xué)、計算機科學(xué)、數(shù)學(xué)于一體的學(xué)科,它是人工智能的耳朵-語音識別和嘴巴-語音合成的基礎(chǔ)。計算機能否理解人類的思想,首先要理解自然語言,其次擁有廣泛的知識,以及運用這些知識的能力。自然語言處理的主要范疇非常廣,包括了語音合成、語音識別、語句分詞、詞性標(biāo)注、語法分析、語句分析、機器翻譯、自動摘要等等、問答系統(tǒng)等等。
機器視覺通過攝影機和計算機代替人的眼睛對目標(biāo)進行識別、跟蹤和測量,并進一步對圖像進行處理。這是一門研究如何使機器“看懂”的技術(shù),是人工智能最重要的輸入方式之一。如何通過攝像頭就能做到實時、準(zhǔn)確識別外界狀況,這是人工智能的瓶頸之一,深度學(xué)習(xí)在這方面幫了大忙。現(xiàn)在熱門的人臉識別、無人駕駛等技術(shù)都依賴于機器視覺技術(shù)。
語音識別的目的是將人類的語音內(nèi)容轉(zhuǎn)換為相應(yīng)的文字。機器能否與人類自然交流的前提是機器能聽懂人類講什么,語音識別也是人工智能的最重要輸入方式之一。由于不同地區(qū)有著不同方言和口音,這對于語音識別來說都是巨大的挑戰(zhàn)。目前百度、科大訊飛等公司的語音識別技術(shù)在普通話上的準(zhǔn)確率已達到97%,但方言準(zhǔn)確率還有待提高。
目前大部分的語音合成技術(shù)是利用在數(shù)據(jù)庫內(nèi)的許多已錄好的語音連接起來,但由于缺乏對上下文的理解以及情感的表達,朗讀效果很差。現(xiàn)在百度和科大訊飛等公司在語音合成上有新的成果:16年3月百度語音合成了張國榮聲音與粉絲互動;17年3月本邦科技利用科大訊飛的語音合成技術(shù),成功幫助小米手機實現(xiàn)了一款內(nèi)含“黑科技”的營銷活動H5。它們的主要技術(shù)是通過對張國榮、馬東的語音資料進行語音識別,提取該人的聲紋和說話特征,再通過自然語言處理對講述的內(nèi)容進行情緒識別,合成出來的語音就像本人在和你對話。新的語音合成技術(shù)不再被數(shù)據(jù)庫內(nèi)的錄音所限制語言和情感的表達。
經(jīng)過多年的人工智能研究,人工智能的主要發(fā)展方向分為:計算智能、感知智能、認(rèn)知智能,這一觀點也得到業(yè)界的廣泛認(rèn)可。
計算智能是以生物進化的觀點認(rèn)識和模擬智能。有學(xué)者認(rèn)為,智能是在生物的遺傳、變異、生長以及外部環(huán)境的自然選擇中產(chǎn)生的。在用進廢退、優(yōu)勝劣汰的過程中,適應(yīng)度高的(頭腦)結(jié)構(gòu)被保存下來,智能水平也隨之提高。機器借助大自然規(guī)律的啟示設(shè)計出具有結(jié)構(gòu)演化能力和自適應(yīng)學(xué)習(xí)能力的智能。計算智能算法主要包括神經(jīng)計算、模糊計算和進化計算三大部分,神經(jīng)網(wǎng)絡(luò)和遺傳算法的出現(xiàn),使得機器的運算能力大幅度提升,能夠更高效、快速處理海量的數(shù)據(jù)。計算智能是人工智能的基礎(chǔ),AlphaGo是計算智能的代表。
感知智能是以視覺、聽覺、觸覺等感知能力輔助機器,讓機器能聽懂我們的語言、看懂世界萬物。相比起人類的感知能力,機器可以通過傳感器獲取更多信息,例如溫度傳感器、濕度傳感器、紅外雷達、激光雷達等等。感知智能也是人工智能的基礎(chǔ),機器人、自動駕駛汽車是感知智能的代表。
認(rèn)知智能是指機器具有主動思考和理解的能力,不用人類事先編程就可以實現(xiàn)自我學(xué)習(xí),有目的推理并與人類自然交互。人類有語言,才有概念、推理,所以概念、意識、觀念等都是人類認(rèn)知智能的表現(xiàn),機器實現(xiàn)以上能力還有漫長的路需要探索。
在認(rèn)知智能的幫助下,人工智能通過發(fā)現(xiàn)世界和歷史上海量的有用信息,并洞察信息間的關(guān)系,不斷優(yōu)化自己的決策能力,從而擁有專家級別的實力,輔助人類做出決策。認(rèn)知智能將加強人和人工智能之間的互動,這種互動是以每個人的偏好為基礎(chǔ)的。認(rèn)知智能通過搜集到的數(shù)據(jù),例如地理位置、瀏覽歷史、可穿戴設(shè)備數(shù)據(jù)和醫(yī)療記錄等等,為不同個體創(chuàng)造不同的場景。認(rèn)知系統(tǒng)也會根據(jù)當(dāng)前場景以及人和機器的關(guān)系,采取不同的語氣和情感進行交流。
假如能像設(shè)想的一樣實現(xiàn)認(rèn)知智能,那么底層平臺必須足夠?qū)拸V和靈活,以便在各領(lǐng)域甚至跨領(lǐng)域得到應(yīng)用。因此研發(fā)人員需要從全局性出發(fā),打造這個健壯的底層平臺,它應(yīng)該包括機器學(xué)習(xí)、自然語言處理、語音和圖像識別、人機交互等技術(shù),便于上層應(yīng)用開發(fā)者的開發(fā)和使用。
下一篇文章會從設(shè)計底層平臺的角度來闡述個人的思考。
閱讀資料:
1、人工智能史
- https://zh.wikipedia.org/wiki/人工智能史
- Alan Turing
- https://zh.wikipedia.org/wiki/艾倫·圖靈
- 科普AI之60年前的達特茅斯會議與AI緣起
- https://tech.163.com/16/0313/12/BI1P1CLI00094P0U.html
2、人工神經(jīng)網(wǎng)絡(luò)
https://baike.baidu.com/item/人工神經(jīng)網(wǎng)絡(luò)
3、深度學(xué)習(xí)
https://baike.baidu.com/item/深度學(xué)習(xí)
4、自然語言
https://baike.baidu.com/item/自然語言
5、TensorFlow
https://baike.baidu.com/link?url=dO_lFqvg6FQLYVaQKcwnlol1noc-EgdfIGbG6pQUo481iBQQkXSC8ZtFdAZ7II2SXyvG-mrTu34UuRFGdb0xvu2gmiZL02Sm6X4zOKiJrJ_
6、知識圖譜
https://www.jiqizhixin.com/articles/2017-03-20
7、《人工智能》-李開復(fù)、王詠剛著
https://item.jd.com/12169266.html
8、小米《奇葩說》花式廣告大賽
http://w.benbun.com/xiaomi/koubo/?state=d81c977eeb74e8d8783dc94e39fe1972&code=1abbb176039771a76583804409fb3354
以上就是第一章的內(nèi)容。
相關(guān)閱讀
人工智能與設(shè)計(2):面向用戶的人工智能系統(tǒng)底層設(shè)計
人工智能與設(shè)計(3):人工智能時代下交互設(shè)計的改變
人工智能與設(shè)計(4):人工智能對設(shè)計的影響
作者:薛志榮(微信公眾號:薛志榮),百度交互設(shè)計師,二年級生
本文由 @薛志榮 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
作者:薛志榮(微信公眾號:薛志榮),百度交互設(shè)計師,二年級生
本文由 @薛志榮 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
來學(xué)習(xí)
第三篇顯示內(nèi)容已丟失
感覺通篇都像是書里的文章搬移,沒看到作者自己有價值的思考
贊同樓上意見
這一篇都是介紹基礎(chǔ)知識和歷史,思考的在后面幾篇
這一篇都是介紹基礎(chǔ)知識和歷史,思考的在后面幾篇