論人工智能的泡沫、價(jià)值與應(yīng)用困境

1 評(píng)論 11430 瀏覽 59 收藏 40 分鐘

“我準(zhǔn)備考慮一個(gè)問題:‘機(jī)器能思維嗎?’”—阿蘭.圖靈,1950,《Computing Machinery and Intelligence》

前段時(shí)間在忙著煉丹(Deep Learning),還有幾場(chǎng)大數(shù)據(jù)培訓(xùn),很久沒有動(dòng)筆了。今天想和大家談?wù)勅斯ぶ悄埽ˋrtificial Intelligence, AI),2017可謂人工智能元年,AI領(lǐng)域風(fēng)投和創(chuàng)新、創(chuàng)業(yè)風(fēng)起云涌,深度學(xué)習(xí)研究和應(yīng)用持續(xù)火爆,以Facebook小扎和Tesla鋼鐵俠為代表的大佬們站隊(duì)互掐,AlphaGo的成功營銷與Watson的失敗應(yīng)用,國內(nèi)BAT紛紛推出人工智能戰(zhàn)略等等…這一波大數(shù)據(jù)驅(qū)動(dòng)的AI熱潮,發(fā)展勢(shì)頭強(qiáng)勁。下圖是從我培訓(xùn)課件里截的,稱之為四位一體看數(shù)據(jù)技術(shù)(Data Technology, DT),可以說AI高燒是大數(shù)據(jù)發(fā)展的必然。

圖1 四位一體看DT

從上圖可以看出,這些年從物聯(lián)網(wǎng),云計(jì)算,大數(shù)據(jù)到現(xiàn)在的人工智能,一個(gè)比一個(gè)熱,這是DT前沿信息技術(shù)發(fā)展的大勢(shì),其內(nèi)在的邏輯聯(lián)系和發(fā)展趨勢(shì)使然,終極目標(biāo)直指人工智能。這就好比我們?nèi)梭w一樣,物聯(lián)網(wǎng)(移動(dòng)互聯(lián)網(wǎng))構(gòu)造了眼耳鼻舌身等感官,大數(shù)據(jù)是各種感官獲取的感受信息,云計(jì)算是記憶存儲(chǔ),人工智能就是我們的認(rèn)知決策。IT和DT技術(shù)發(fā)展本質(zhì)是在擬人化、智能化,智能時(shí)代一定會(huì)到來是毫無疑問的,但是,發(fā)展過程也不要太樂觀。

一、人工智能源起:圖靈的智能之問

我在之前的文章里有講到:

“大數(shù)據(jù)時(shí)代,我們周圍充斥著各種不同的理論、知識(shí)、信息和噪音,數(shù)據(jù)爆炸式增長和科技高速發(fā)展所帶來的沖擊,加大了未來的不確定性。當(dāng)我們接收的數(shù)據(jù)和信息越多,面臨的選擇就越多,如若不善于過濾、挖掘和處理,對(duì)各種決策就可能會(huì)造成負(fù)面影響,當(dāng)然也會(huì)放大我們對(duì)未來不確定性的恐懼。如何從混沌中發(fā)現(xiàn)規(guī)律,成為預(yù)測(cè)未來的“先知”,抑或是少出幾只黑天鵝?是歷代人類的夢(mèng)想,不管是古人的占卜、算命還是現(xiàn)在的專家系統(tǒng)、商業(yè)智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能、智慧地球、智慧城市等技術(shù)和應(yīng)用,都源于我們對(duì)未來不確定性的恐懼。”

如何降低決策過程中的不確定性,通過智能技術(shù)進(jìn)行前瞻預(yù)測(cè)是關(guān)鍵,不管是物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算還是DT偌大的技術(shù)生態(tài)體系,其核心都是為這一目標(biāo)服務(wù)。從這個(gè)角度講,傳統(tǒng)商業(yè)智能應(yīng)用90%失敗這一論斷是有道理的,因?yàn)榛A(chǔ)的數(shù)據(jù)管理和常規(guī)的統(tǒng)計(jì)分析,不能稱之為智能,換句話說沒有成熟機(jī)器學(xué)習(xí)技術(shù)的支撐和成功應(yīng)用,要說多智能那就是忽悠(后面我會(huì)講IBM Watson的問題)。

機(jī)器如何智能,系統(tǒng)如何智能,可謂仁者見仁智者見智。我們先來看圖靈是如何定義這一問題的。作為計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域的先驅(qū),圖靈在1950年發(fā)表的著名論文《Computing Machinery and Intelligence》中,詳細(xì)討論了機(jī)器能否擁有智能這一問題,但也只是個(gè)開放性的討論,其實(shí)圖靈也未能定義什么是智能(但提出了著名的“圖靈測(cè)試”)。

在1956年的DARTMOUTH學(xué)術(shù)會(huì)議上,AI被正式提出,定義為:

“研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門技術(shù)科學(xué)。通過了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,人工智能可以對(duì)人的意識(shí)、思維的信息過程進(jìn)行模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過人的智能。智能涉及到諸如意識(shí)、自我、思維、心理、記憶等等問題?!?/p>

由于我們對(duì)人類智能本身還知之甚少,所以人工智能的發(fā)展比預(yù)想的要慢很多。圖靈當(dāng)時(shí)也做了個(gè)比較樂觀的預(yù)測(cè),他預(yù)測(cè)在2000年左右,機(jī)器極有可能會(huì)通過“圖靈測(cè)試”,擁有初步的智能行為,現(xiàn)在看來這一時(shí)間是延后了,從當(dāng)前自然語言處理領(lǐng)域的發(fā)展現(xiàn)狀及問題來看,要解答圖靈的智能之問,還需要AI研究人員多年的努力。

二、人工智能泡沫:神經(jīng)網(wǎng)絡(luò)“三起三落”的啟示

從歷史來看,重大科學(xué)的研究往往呈螺旋形上升的過程,不可能一蹴而就,每一次基礎(chǔ)科學(xué)研究的重大進(jìn)步,科技應(yīng)用的重大突破,往往先由一兩個(gè)領(lǐng)軍人物偶然點(diǎn)破,而后大家蜂擁而至,在很短的時(shí)間內(nèi)做出大量更具突破性的成果,同時(shí)帶來相關(guān)產(chǎn)業(yè)界的革命性增長。

經(jīng)歷過“三起三落”的人工神經(jīng)網(wǎng)絡(luò),能夠在換馬甲為深度學(xué)習(xí)后成功逆襲,正是機(jī)器學(xué)習(xí)領(lǐng)域幾十年來積累誕生的重大科學(xué)研究和工程應(yīng)用成果,當(dāng)前深度學(xué)習(xí)被看作是通向人工智能的關(guān)鍵技術(shù),被寄予厚望。

圖2 神經(jīng)網(wǎng)絡(luò)的“三起三落”

我在10多年前對(duì)神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)兩個(gè)機(jī)器學(xué)習(xí)方向都有過粗淺的學(xué)習(xí)和了解,見證了神經(jīng)網(wǎng)絡(luò)研究三起三落其中的一段時(shí)光,見證了以支持向量機(jī)為代表的淺層學(xué)習(xí)技術(shù)的火爆,但卻始終少有看到機(jī)器學(xué)習(xí)技術(shù)真正走出實(shí)驗(yàn)室,直到最近幾年,神經(jīng)網(wǎng)絡(luò)換馬甲為深度學(xué)習(xí)后成功逆襲,使得機(jī)器學(xué)習(xí)領(lǐng)域這幾十年來積累的成果,得以逐漸走出實(shí)驗(yàn)室,在學(xué)術(shù)界研究和產(chǎn)業(yè)界應(yīng)用都一鳴驚人,并有望引領(lǐng)人工智能關(guān)鍵技術(shù)的跨越式發(fā)展。

圖3 人工智能的泡沫

但從另一方面看,神經(jīng)網(wǎng)絡(luò)的三起三落也就代表了人工智能的三個(gè)泡沫期,這給過分熱衷深度學(xué)習(xí)技術(shù)與人工智能研究應(yīng)用的人來講,也是該降降溫的,期望越大,失望越大,畢竟深度學(xué)習(xí)技術(shù)沒有想象中的那么強(qiáng)大,至少在智能算法層面的突破很有限(主要靠的還是大數(shù)據(jù)和計(jì)算力)。

換個(gè)角度看,深度煉丹術(shù)的興起,會(huì)不會(huì)是因?yàn)闄C(jī)器學(xué)習(xí)算法研究幾十年遲遲無重大進(jìn)展,神經(jīng)網(wǎng)絡(luò)算法的一點(diǎn)小改進(jìn)(正好遇到了大數(shù)據(jù)與GPU)就被當(dāng)做了救命稻草? 或者說即使神經(jīng)網(wǎng)絡(luò)的深度架構(gòu)碰巧撞到了類腦學(xué)習(xí)機(jī)制,但我們能全面解碼它嗎?不太了解神經(jīng)科學(xué)的研究水平,這個(gè)需要大家去悟了。

三、人工智能價(jià)值:弱AI不弱,強(qiáng)AI難強(qiáng)

AI目前的發(fā)展還處于弱AI(Artificial Narrow Intelligence ,ANI)階段,但弱AI并不弱,如阿爾法狗一樣,雖然只擅長某一方面的智能,但在這方面已然超過人類了。近年來,弱AI已經(jīng)極大促進(jìn)了信息化與智能化的發(fā)展,在很多領(lǐng)域提高了生產(chǎn)效率。如工業(yè)機(jī)器人、醫(yī)療機(jī)器人、智能問答、自動(dòng)駕駛、疾病診斷、自動(dòng)交易等系統(tǒng)工具,極大提高了生產(chǎn)力。

弱AI不能像人類一樣靠理性或感性進(jìn)行推理和解決各方面(哪怕很簡(jiǎn)單)問題,機(jī)器只不過看起來像是智能的,其實(shí)只是既定程序的執(zhí)行而已,只能解決某一方面的問題(就像下圍棋不能代表會(huì)下象棋),不會(huì)有自主意識(shí),不會(huì)有創(chuàng)造性。而強(qiáng)AI(Artificial General Intelligence ,AGI)的定位是在各方面相當(dāng)于人類或者超過人類,也稱為通用人工智能。

現(xiàn)階段的人工智能研究和應(yīng)用主要聚焦在弱AI,強(qiáng)AI的研究可以說還是停滯不前,難有進(jìn)展。

強(qiáng)AI能否實(shí)現(xiàn)還是未知,但要論人工智能的價(jià)值,我認(rèn)為很有必要對(duì)兩者進(jìn)行對(duì)比,首先我個(gè)人是不支持發(fā)展強(qiáng)AI的,除非對(duì)其有絕對(duì)的控制能力,除非人類遇到了全球性災(zāi)難或需要星際移民,不然強(qiáng)AI出世就很可能是另外一種原子彈,絕對(duì)是弊大于利。

弱AI幫助人類,是我們的好助手,能提高我們的生產(chǎn)效率和生活水平,強(qiáng)AI超過或代替人類,將是大部分人類的“終結(jié)者”,至少是勞動(dòng)終結(jié)者,總不可能幾十億人都去從事藝術(shù)職業(yè)吧?當(dāng)然弱AI發(fā)展也會(huì)面臨這一挑戰(zhàn),但更可控和緩和很多。

四、人工智能應(yīng)用困境:先要搞清楚幾個(gè)關(guān)鍵問題

隨著機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和人工智能相關(guān)技術(shù)(強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)、對(duì)抗學(xué)習(xí)等)的高速發(fā)展。阿爾法狗與人類頂尖棋手的人機(jī)大戰(zhàn),也注定成為人工智能的里程碑事件,當(dāng)AI變得越來越復(fù)雜,越來越聰明,以至于在多個(gè)領(lǐng)域全面超越人類的時(shí)候,那時(shí)的AI會(huì)是提高人類生產(chǎn)力和生活質(zhì)量的好助手?抑或是徹底控制奴役人類的天網(wǎng)?現(xiàn)在還難以下結(jié)論,但可以肯定的是接下來數(shù)十年里AI對(duì)人類生活造成的沖擊將是巨大的。不管是技術(shù)層面還是產(chǎn)業(yè)應(yīng)用層面,要對(duì)人工智能領(lǐng)域有個(gè)全面準(zhǔn)確的理解和把握,可以說十分困難。下面提幾點(diǎn)個(gè)人認(rèn)為比較關(guān)鍵的問題供大家探討。

(1)現(xiàn)在是人工智能的“黃金”時(shí)代嗎?

這個(gè)問題乍看是廢話,現(xiàn)在AI這么火,當(dāng)然是黃金時(shí)代啦。從人工智能的三起三落來看,現(xiàn)在是處于技術(shù)和產(chǎn)業(yè)發(fā)展的波峰。而這一熱潮的興起一是得益于深度神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,二是通過物聯(lián)網(wǎng)和移動(dòng)物聯(lián)網(wǎng)等技術(shù),大數(shù)據(jù)的爆炸式增長成為常態(tài)。三是大數(shù)據(jù)分析預(yù)測(cè)是解決不確定性問題的必然,大數(shù)據(jù)條件下的復(fù)雜性問題,越來越難以應(yīng)用傳統(tǒng)建模技術(shù)加以解決,而客觀世界的復(fù)雜性,傳統(tǒng)的機(jī)械模型更是難以分析和預(yù)測(cè)。

圖4 農(nóng)業(yè)時(shí)代到智能時(shí)代

工業(yè)時(shí)代通過機(jī)械動(dòng)力優(yōu)化,放大了我們的體力,我們得以改造物理世界;智能時(shí)代通過算法優(yōu)化,放大了我們的腦力,將極大改造我們的腦力世界。從人類社會(huì)發(fā)展大趨勢(shì)來看,現(xiàn)在稱之為AI黃金時(shí)代并不為過。

但這里有個(gè)不確定性,那就是AI技術(shù)發(fā)展的瓶頸問題,深度學(xué)習(xí)技術(shù)能否擔(dān)當(dāng)重任,能否一鼓作氣有更大的突破,或者幾年后又得停滯不前幾十年,都有可能。

但可以肯定的是,對(duì)弱AI來講,現(xiàn)在是再好不過的黃金時(shí)代,興起的投資熱潮也是看到了各個(gè)垂直領(lǐng)域應(yīng)用弱AI的極大潛力;對(duì)強(qiáng)AI來講,面臨的技術(shù)瓶頸短期內(nèi)難以突破,不過有沒有可能多年后冒出個(gè)終極算法,全面解決類腦學(xué)習(xí)問題?不是沒有可能,只是幾率很小。

(2)人工智能的應(yīng)用成熟度?

盡管人工智能的發(fā)展已經(jīng)超過50年,但仍然還處于一個(gè)比較早期的發(fā)展階段,其應(yīng)用主要集中在弱AI和垂直行業(yè)相結(jié)合的領(lǐng)域。

從產(chǎn)業(yè)鏈上看,人工智能產(chǎn)業(yè)鏈包括基礎(chǔ)支撐技術(shù)(如大數(shù)據(jù)、云計(jì)算等)、人工智能技術(shù)(機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等)及人工智能應(yīng)用(語音、對(duì)話、識(shí)別等)三個(gè)層面,其中基礎(chǔ)技術(shù)支撐由數(shù)據(jù)中心及運(yùn)算平臺(tái)構(gòu)成,即計(jì)算智能階段,包括數(shù)據(jù)傳輸、運(yùn)算、存儲(chǔ)等;

人工智能技術(shù)是基于基礎(chǔ)層提供的存儲(chǔ)資源和大數(shù)據(jù),通過機(jī)器學(xué)習(xí)建模,開發(fā)面向不同領(lǐng)域的應(yīng)用技術(shù),包含感知智能及認(rèn)知智能兩個(gè)階段,感知智能如語音識(shí)別、圖像識(shí)別、自然語音處理和生物識(shí)別等,認(rèn)知智能如機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、對(duì)抗學(xué)習(xí)、自然語言理解等;

人工智能應(yīng)用主要為人工智能與傳統(tǒng)產(chǎn)業(yè)相結(jié)合,以實(shí)現(xiàn)不同場(chǎng)景的應(yīng)用,如機(jī)器人、無人駕駛、智能家居、智能醫(yī)療、智能問答等領(lǐng)域。

從上述幾個(gè)方面可以看出,AI產(chǎn)業(yè)鏈的應(yīng)用成熟度取決于關(guān)鍵技術(shù)在垂直領(lǐng)域的突破,如果想靠大規(guī)模投資來快速推進(jìn)AI技術(shù)的突破是不現(xiàn)實(shí)的,而是要反推,技術(shù)成熟一個(gè)再應(yīng)用一個(gè),這樣比較穩(wěn)妥。

圖5 谷歌產(chǎn)品線應(yīng)用深度學(xué)習(xí)技術(shù)

(3)人工智能的技術(shù)成熟度?

這一波人工智能的發(fā)展,大數(shù)據(jù)處理、深度學(xué)習(xí)和GPU計(jì)算三個(gè)方面的技術(shù)起到了關(guān)鍵的推動(dòng)作用。大數(shù)據(jù)的采集、基礎(chǔ)管理和云計(jì)算、GPU計(jì)算等技術(shù)應(yīng)該說比較成熟了。突破智能的難點(diǎn)還是在機(jī)器學(xué)習(xí)。

我在前文反復(fù)提到過,不談機(jī)器學(xué)習(xí)的智能技術(shù)多是在耍流氓。作為機(jī)器學(xué)習(xí)的子領(lǐng)域,深度學(xué)習(xí)雖然很牛,但它還是神經(jīng)網(wǎng)絡(luò)那套算法理論,幾十年前就提出來了,換句話說還是在啃老本啊。不管是支持向量機(jī)、貝葉斯、決策樹等淺層學(xué)習(xí)算法,還是深度網(wǎng)絡(luò)衍生出來的深度強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)、對(duì)抗學(xué)習(xí)等,大部分理論、算法在幾十年前的人工智能教材上都能找到,唯一不同的加了個(gè)深度,有強(qiáng)大的計(jì)算力支持,能處理大數(shù)據(jù)了。

圖6 人工智能與機(jī)器學(xué)習(xí)

近年來的人工智能開源框架更是基本等同于深度學(xué)習(xí),雖然TensorFlow、Keras、MXNet等深度學(xué)習(xí)框架備受開發(fā)人員推崇,但還是缺乏完整的人工智能技術(shù)鏈,深度學(xué)習(xí)被捧得太高不是好現(xiàn)象,傳統(tǒng)的知識(shí)庫、專家系統(tǒng)和規(guī)則式AI與深度強(qiáng)化、遷移、對(duì)抗等學(xué)習(xí)的融合才是AI發(fā)展的正途,另外從芯片、算法、平臺(tái)、架構(gòu)到應(yīng)用等方面來看,弱AI要全面開花落地都還有較長的路要走。

再就是浮夸風(fēng)問題,一些科技媒體抱著Arxiv的某篇論文,就能說解決了某重大應(yīng)用問題,十分不嚴(yán)謹(jǐn)。如果要給AI技術(shù)成熟度打個(gè)分的話,個(gè)人認(rèn)為總分100分的話最多算70分,而且還是抱了深度學(xué)習(xí)的大腿。至于深度學(xué)習(xí)技術(shù)發(fā)展的后勁如何,短時(shí)間內(nèi)是否發(fā)展成為Musk所說的那樣可怕,那要看IT巨頭們機(jī)器農(nóng)場(chǎng)中深度網(wǎng)絡(luò)的工程能力和“進(jìn)化”速度了,沒有大數(shù)據(jù)資源和大規(guī)模計(jì)算資源的一般研究機(jī)構(gòu)和人員是很難知曉的。

(4)大數(shù)據(jù)如何助力人工智能?

在提這個(gè)問題之前,大家可以思考一下,有沒有非數(shù)據(jù)驅(qū)動(dòng)的智能?換句話說,如果沒有大數(shù)據(jù),除了專家系統(tǒng)和規(guī)則式AI,人工智能怎么發(fā)展?能否在智能學(xué)習(xí)方面有所突破?現(xiàn)階段的AI多是數(shù)據(jù)驅(qū)動(dòng)的AI,因?yàn)闆]有數(shù)據(jù)的喂養(yǎng),就沒有深度學(xué)習(xí)的成功。

數(shù)據(jù)驅(qū)動(dòng)的AI離不開大數(shù)據(jù),大數(shù)據(jù)與AI是一種共生關(guān)系:

  • 一方面,AI基礎(chǔ)理論技術(shù)的發(fā)展為大數(shù)據(jù)機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘提供了更豐富的模型和算法,如深度神經(jīng)網(wǎng)絡(luò)衍生出的一系列技術(shù)(深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)、對(duì)抗學(xué)習(xí)等)和方法;
  • 另一方面,大數(shù)據(jù)為AI的發(fā)展提供了新的動(dòng)力和燃料,數(shù)據(jù)規(guī)模大了之后,傳統(tǒng)機(jī)器學(xué)習(xí)算法面臨挑戰(zhàn),要做并行化、要加速要改進(jìn)。當(dāng)前的弱AI應(yīng)用都遵從這一技術(shù)路線,繞不開大數(shù)據(jù)。

那么怎么做非數(shù)據(jù)驅(qū)動(dòng)的AI呢?傳統(tǒng)的規(guī)則式AI可以說是非數(shù)據(jù)驅(qū)動(dòng)的,更多靠人工內(nèi)置的經(jīng)驗(yàn)和知識(shí)驅(qū)動(dòng),不過它最大的問題也是要人工介入,而且很難具有學(xué)習(xí)能力,靠的知識(shí)、記憶和經(jīng)驗(yàn)建立的規(guī)則體系。強(qiáng)AI的目標(biāo)是機(jī)器智能化、擬人化,機(jī)器要完成和人一樣的工作,那就離不開知識(shí)、記憶和經(jīng)驗(yàn),也離不開通過知識(shí)、經(jīng)驗(yàn)和記憶建立起來的認(rèn)知體系(經(jīng)驗(yàn)規(guī)則、知識(shí)本體)。

從這個(gè)角度講,強(qiáng)AI要實(shí)現(xiàn)只靠深度學(xué)習(xí)還不夠,但也不能繞過深度學(xué)習(xí),通過深度學(xué)習(xí)進(jìn)行物理世界基礎(chǔ)知識(shí)的初步監(jiān)督式或半監(jiān)督學(xué)習(xí)(幼兒要人教),深度學(xué)習(xí)掌握的知識(shí)必須要能存儲(chǔ)記憶并形成經(jīng)驗(yàn)規(guī)則,只有這樣遇到新的問題之后,才能智能響應(yīng)(小孩通過知識(shí)經(jīng)驗(yàn)的積累,不再需要人教而能自我學(xué)習(xí))。這需要學(xué)習(xí)、存儲(chǔ)、記憶、推理和構(gòu)建知識(shí)體系,所以說強(qiáng)AI短期要實(shí)現(xiàn)很困難。

(5)深度學(xué)習(xí)的“深”與“淺”?

首先我們來看深度學(xué)習(xí)的“淺”,深度學(xué)習(xí)的核心理論還是基于淺層神經(jīng)網(wǎng)絡(luò)的堆疊,核心技術(shù)本身并無新意,Hinton也只是做了有限的改造和提升。另外,偉大的東西往往很簡(jiǎn)單,好比愛因斯坦的EMC方程,深度學(xué)習(xí)是一種樸素、簡(jiǎn)單、優(yōu)美而有效的方法:像小孩搭積木一樣簡(jiǎn)單地構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu);性能不夠,加層來湊的樸素思想,這種標(biāo)準(zhǔn)化、易用性的處理架構(gòu),極大降低了機(jī)器學(xué)習(xí)的難度,當(dāng)然最關(guān)鍵還是應(yīng)用效果。從這個(gè)角度理解,深度學(xué)習(xí)并無深意,只是對(duì)傳統(tǒng)淺層神經(jīng)網(wǎng)絡(luò)做了少量改造。

再來看深度學(xué)習(xí)的“深”,在我看來,深度學(xué)習(xí)絕不只是幾個(gè)具體算法、模型那么簡(jiǎn)單,而是一種仿人腦多層異構(gòu)神經(jīng)元連接網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)思想、方法論和技術(shù)框架(可能會(huì)從傳統(tǒng)機(jī)器學(xué)習(xí)學(xué)科中分離出來,傳統(tǒng)淺層學(xué)習(xí)模型的深度化是一大研究趨勢(shì))。各類深度學(xué)習(xí)網(wǎng)絡(luò)的變異、進(jìn)化、融合,結(jié)合GPU超級(jí)計(jì)算將是未來現(xiàn)實(shí)大數(shù)據(jù)條件下大規(guī)模機(jī)器學(xué)習(xí)的重要方向,特別是海量多模態(tài)大數(shù)據(jù)條件下的機(jī)器學(xué)習(xí),沒有深度架構(gòu)只靠淺層學(xué)習(xí),將無法支撐大數(shù)據(jù)條件下自動(dòng)特征學(xué)習(xí)、模型的有效表達(dá)和記憶存儲(chǔ)。

當(dāng)然,深度學(xué)習(xí)在當(dāng)前看來是通向現(xiàn)實(shí)人工智能的一條有效途徑,但不應(yīng)該是一種包羅萬象的解決方案。盡管深度學(xué)習(xí)的能力相比傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)很強(qiáng),但和真正的人工智能目標(biāo)相比,仍然缺乏諸多重要的能力,如復(fù)雜的邏輯推理、知識(shí)抽象、情感經(jīng)驗(yàn)、記憶和表達(dá)等。不過深度學(xué)習(xí)發(fā)展現(xiàn)在還處于初級(jí)階段,能否真正實(shí)現(xiàn)類腦計(jì)算解碼還需要時(shí)日加以驗(yàn)證;另外,隨著深度學(xué)習(xí)的網(wǎng)絡(luò)形式和深度架構(gòu)的逐步演進(jìn), 與基于經(jīng)驗(yàn)知識(shí)庫的規(guī)則式AI相結(jié)合,能否形成終極的類腦學(xué)習(xí)框架,讓我們拭目以待。

(6)Tesla鋼鐵俠和Facebook小扎到底在爭(zhēng)個(gè)什么?

前段時(shí)間,Tesla鋼鐵俠Musk與Facebook小扎進(jìn)行了一場(chǎng)誰不懂AI的嘴炮對(duì)決,大佬們紛紛站隊(duì),貌似支持小扎的大佬要多一些?他倆到底爭(zhēng)個(gè)啥,在我看來絕不是單純的AI技術(shù)問題,而是在討論強(qiáng)AI的可能性和強(qiáng)AI的覺醒時(shí)間。

李嘉誠邀請(qǐng)阿爾法狗創(chuàng)始人戴密斯·哈薩比斯(Demis Hassabis)給他講課,日本軟銀孫正義計(jì)劃幾百億只投資人工智能相關(guān)項(xiàng)目,都是在押寶這一問題。

其實(shí)弱AI與強(qiáng)AI的二元?jiǎng)澐植皇翘侠?,我們都知道技術(shù)的發(fā)展是個(gè)量變到質(zhì)變的過程,弱到強(qiáng)之間難有技術(shù)分水嶺,就像神經(jīng)網(wǎng)絡(luò)的三起三落,十年前沒有大數(shù)據(jù)支持,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)效果不佳就說他弱嗎?現(xiàn)在換了個(gè)馬甲,因?yàn)橛写髷?shù)據(jù)了,學(xué)習(xí)效果好太多了就說它強(qiáng)嗎?某一方面的技術(shù)不能說明問題,一個(gè)領(lǐng)域的突破性發(fā)展往往是一系列關(guān)鍵技術(shù)的改進(jìn)在推動(dòng),缺一不可。

圖7 人類發(fā)展進(jìn)程曲線

那么大佬們當(dāng)下關(guān)注的關(guān)鍵問題-強(qiáng)AI何時(shí)到來?這也是小扎和鋼鐵俠爭(zhēng)論的焦點(diǎn),這個(gè)時(shí)間節(jié)點(diǎn)能否預(yù)測(cè)呢?首先看下上圖的人類發(fā)展進(jìn)程曲線,這個(gè)曲線表達(dá)的是核心意思是,我們的發(fā)展進(jìn)程是經(jīng)歷突變還是漸變多一些?這個(gè)還真不好說,原子彈發(fā)明之前,大部分科學(xué)家預(yù)測(cè)短期不可能,至少要幾十年,也有科學(xué)家預(yù)測(cè)只需要幾年,人工智能的三起三落也是,前幾十年的樂觀預(yù)測(cè)都失敗了,未來幾年會(huì)不會(huì)產(chǎn)生突變呢?誰也說不準(zhǔn),首先我們不能以深度學(xué)習(xí)技術(shù)現(xiàn)有的局限來推斷其未來的發(fā)展?jié)摿Γ拖裎覀儾荒茴A(yù)測(cè)Hinton是在2006年提出DBN,而不是1996或是2026?另外強(qiáng)AI能否覺醒,這得看未來數(shù)年里,是否有Arxiv上的某篇論文提出了機(jī)器學(xué)習(xí)的終極算法?或是Facebook機(jī)器農(nóng)場(chǎng)中的某個(gè)深度網(wǎng)絡(luò)全面解碼了人腦的學(xué)習(xí)機(jī)制,抑或是谷歌機(jī)器農(nóng)場(chǎng)中的某個(gè)深度網(wǎng)絡(luò)通過本體學(xué)習(xí)和記憶產(chǎn)生了初級(jí)意識(shí)。

五、人工智能五大門派對(duì)決:Watson vs. AlphaGo

上文說到,強(qiáng)AI的可能性,強(qiáng)AI何時(shí)能實(shí)現(xiàn)?是以小扎和鋼鐵俠為代表的大佬們,關(guān)于誰更懂AI展開嘴炮的焦點(diǎn)。要回答這一問題,首先得搞清楚AI技術(shù)發(fā)展的現(xiàn)狀和瓶頸,下面就通過當(dāng)今世界最頂級(jí)的兩個(gè)AI系統(tǒng),阿爾法狗(Alphago)和沃森(Watson)的對(duì)比分析,來深入探討這一問題。

AlphaGo采用的核心技術(shù)我在前文《阿爾法狗(AlphaGo)徹底戰(zhàn)勝人類意味著什么》中有深入分析,簡(jiǎn)單來講,其基于深度學(xué)習(xí)+強(qiáng)化學(xué)習(xí)+蒙特卡洛樹決策的組合式學(xué)習(xí)方法(或者說學(xué)習(xí)框架)應(yīng)用說摸到了類腦學(xué)習(xí)的邊,其學(xué)習(xí)下棋分為三個(gè)階段:

  1. 通過對(duì)棋譜的深度學(xué)習(xí)完成策略網(wǎng)絡(luò)的構(gòu)建,采用深度學(xué)習(xí)技術(shù)訓(xùn)練一種有監(jiān)督學(xué)習(xí)型走棋策略網(wǎng)絡(luò),類似于我們的觀察學(xué)習(xí)獲得的第一反應(yīng)。
  2. 通過自我對(duì)戰(zhàn)強(qiáng)化學(xué)習(xí)來提高博弈水平,采用強(qiáng)化學(xué)習(xí)技術(shù)來優(yōu)化先前的走棋策略網(wǎng)絡(luò),通過自我博弈的強(qiáng)化學(xué)習(xí)迭代結(jié)果,來提升前面的策略網(wǎng)絡(luò)。即與之前的“自己”不間斷訓(xùn)練以提高下棋的水平,這個(gè)過程有點(diǎn)類似于人類的鞏固學(xué)習(xí)和理解貫通階段。
  3. 通過深度回歸學(xué)習(xí)構(gòu)建估值網(wǎng)絡(luò),用來預(yù)測(cè)自我博弈強(qiáng)化學(xué)習(xí)數(shù)據(jù)集里局面的預(yù)期結(jié)果,即預(yù)測(cè)那個(gè)策略網(wǎng)絡(luò)的局面會(huì)成為贏家。結(jié)合蒙特卡洛樹(MCTS)搜索壓縮搜索空間,降低了搜索時(shí)間復(fù)雜度, MCTS決策有效結(jié)合了策略網(wǎng)絡(luò)和估值網(wǎng)絡(luò),類似于人類的判斷決策過程。

Watson的系統(tǒng)架構(gòu)如下圖,IBM 關(guān)于 Watson的宣傳資料提到,Watson原來只有1個(gè) “深度問答”的API,現(xiàn)在已經(jīng)有42個(gè)API應(yīng)用于36個(gè)國家的幾十個(gè)行業(yè),內(nèi)容涵蓋文字圖像識(shí)別、自然語言理解、專業(yè)知識(shí)學(xué)習(xí)、人類情緒分析等各個(gè)領(lǐng)域。通過其技術(shù)架構(gòu)分析,可知Watson 的核心功能是文本挖掘和知識(shí)問答,核心技術(shù)采用了基于統(tǒng)計(jì)學(xué)習(xí)算法和規(guī)則式自然語言處理(NLP)技術(shù)。

從這個(gè)角度講,IBM Watson的學(xué)習(xí)能力是十分有限的,依靠的海量非結(jié)構(gòu)化大數(shù)據(jù),加知識(shí)規(guī)則匹配,其重點(diǎn)宣傳的認(rèn)知智能是基于自然語言的情感分析和語義理解,是否采用了更為先進(jìn)的深度學(xué)習(xí)算法不得而知。

可以肯定的是網(wǎng)上關(guān)于Watson系統(tǒng)的負(fù)面評(píng)價(jià)卻不少,醫(yī)療智能診斷AI的失敗,暴露出了不少問題,比如需要幾個(gè)月時(shí)間進(jìn)行繁重的訓(xùn)練,專家們需要給系統(tǒng)喂養(yǎng)海量條理清楚的數(shù)據(jù)(未經(jīng)整理過的數(shù)據(jù)一般不能用,這是淺層學(xué)習(xí)模型的硬傷,而深度自動(dòng)特征學(xué)習(xí)在一定程度上改善了這一問題,但還有相當(dāng)大的技術(shù)瓶頸需要突破),而且不能在不同的數(shù)據(jù)集之間建立聯(lián)系(這點(diǎn)是Palantir大數(shù)據(jù)系統(tǒng)的強(qiáng)項(xiàng),詳見前文《大數(shù)據(jù)獨(dú)角獸Palantir之核心技術(shù)探秘》)。

圖8 IBM Watson架構(gòu)

幾十年來,人工智能技術(shù)研究的五大門派(如下圖)一直以來都在彼此爭(zhēng)奪主導(dǎo)權(quán)。

  • 符號(hào)派:使用符號(hào)、規(guī)則和邏輯來表征知識(shí)和進(jìn)行邏輯推理,最喜歡的算法是:規(guī)則和決策樹。
  • 貝葉斯派:獲取發(fā)生的可能性來進(jìn)行概率推理,最喜歡的算法是:樸素貝葉斯或馬爾可夫。
  • 進(jìn)化派:生成變化,然后為特定目標(biāo)獲取其中最優(yōu)的,最喜歡的算法是:遺傳算法。
  • 類推派:根據(jù)約束條件來優(yōu)化函數(shù)(盡可能走到更高,但同時(shí)不要離開道路),最喜歡的算法是:支持向量。
  • 聯(lián)結(jié)派:使用概率矩陣和加權(quán)神經(jīng)元來動(dòng)態(tài)地識(shí)別和歸納模式,最喜歡的算法是:神經(jīng)網(wǎng)絡(luò)。

圖9 人工智能五大門派

通過上述比較分析,可以看出AlphaGo與Watson的優(yōu)劣。AlphaGo的技術(shù)框架通用性更好,深度學(xué)習(xí)能力更強(qiáng),而Watson更多采用的傳統(tǒng)規(guī)則式AI技術(shù),雖然有自然語言文本等非結(jié)構(gòu)化大數(shù)據(jù)優(yōu)勢(shì),但沒有關(guān)聯(lián)挖掘和深度學(xué)習(xí)能力,其智能化水平有待提高。

另外,通過AlphaGo與Watson核心技術(shù)架構(gòu)的對(duì)比,在大數(shù)據(jù)條件下,聯(lián)結(jié)派和符號(hào)派AI誰更牛高下立見,但都有各自的優(yōu)點(diǎn)和缺點(diǎn)。根據(jù)Domingos的觀點(diǎn),機(jī)器學(xué)習(xí)五大門派有望交叉融合產(chǎn)生終極算法,但是時(shí)間上卻難以推測(cè)。

個(gè)人認(rèn)為,未來聯(lián)結(jié)派和符號(hào)派的融合會(huì)是大勢(shì)所趨,基于自動(dòng)特征抽取和規(guī)則關(guān)聯(lián)推理的深度學(xué)習(xí),與基于知識(shí)經(jīng)驗(yàn)的終身學(xué)習(xí)相結(jié)合,是AI進(jìn)一步發(fā)展的關(guān)鍵技術(shù)方向。

六、如果強(qiáng)AI覺醒,我們將走向何方?

最后做點(diǎn)展望,人工智能技術(shù)毫無疑問會(huì)改變我們的世界,越是強(qiáng)大的技術(shù),其自身發(fā)展的速度(指數(shù)級(jí))也是難以想象和預(yù)測(cè)的,當(dāng)谷歌的自動(dòng)駕駛狗(已行駛超200萬公里)、醫(yī)療狗(DeepMind各種疾病診斷AI已初現(xiàn)身手)、翻譯狗(谷歌幾十種語言的自動(dòng)翻譯)、軍事狗(Boston Dynamic機(jī)器人)、金融狗…等各種狗連成一片的時(shí)候,工業(yè)機(jī)器人很可能會(huì)走出牢籠,變身各種機(jī)器助手進(jìn)入到我們家里和辦公室里,而AI的服務(wù)端則會(huì)像電力一樣提供源源不斷的智能信息服務(wù),到時(shí)我們的社會(huì)究竟會(huì)變成怎樣,這不是一個(gè)單純的技術(shù)問題,特別是面對(duì)強(qiáng)AI技術(shù)的研發(fā)和應(yīng)用,我們應(yīng)該重視其對(duì)社會(huì)、經(jīng)濟(jì)、政治產(chǎn)生的深遠(yuǎn)影響。假如有一天強(qiáng)AI真的覺醒,對(duì)于人類的未來,可以說是吉兇難測(cè),這取決于我們的技術(shù)管控和團(tuán)隊(duì)協(xié)作等能力,還取決于更重要的一點(diǎn),那就是人性。

最后列幾則關(guān)于AI發(fā)展的正反方觀點(diǎn),難說誰對(duì)誰錯(cuò),具有代表性,供大家思考。

李開復(fù):

“類人機(jī)器人只是科幻,人形機(jī)器人將馬上進(jìn)入千家萬戶的說法,簡(jiǎn)直是無稽之談。人工智能擅長對(duì)目標(biāo)明確的工作進(jìn)行優(yōu)化(但是不能創(chuàng)造,沒有感情);機(jī)械控制的發(fā)展速度較人工智能軟件的發(fā)展要緩慢得多;傳感器雖然得到迅猛發(fā)展,但價(jià)格昂貴、體積偏大且太耗電。機(jī)器人的開發(fā)要牢記實(shí)用性這一原則:機(jī)器人或能創(chuàng)造效益,或能節(jié)省成本,或能提高生產(chǎn),或可以提供娛樂。過度擔(dān)憂可能導(dǎo)致大眾忽視AI正在帶來的巨大機(jī)遇,也會(huì)讓更多更緊迫的AI問題沒有得到關(guān)注,這只會(huì)撿了芝麻丟了西瓜。未來十年,AI將大規(guī)模地取代那些依靠人力的、重復(fù)性的、分析性的崗位。因此,我們要肩負(fù)起創(chuàng)造更多社會(huì)服務(wù)性崗位的職責(zé),而不是空想或謀劃一個(gè)充斥著“不適用于人類”職位的社會(huì)…”

扎克伯格:

“人工智能威脅人類的觀點(diǎn)“相當(dāng)不負(fù)責(zé)任”,未來五到十年,人工智能會(huì)大為改善人類生活質(zhì)量。人工智能已經(jīng)在診斷疾病方面提供幫助,自動(dòng)駕駛汽車也是人工智能改善人們生活的一種表現(xiàn)??萍紤?yīng)用一直都利弊兼有,創(chuàng)造技術(shù)的時(shí)候需要小心,但有人主張要放慢人工智能的研究步伐,其動(dòng)機(jī)確實(shí)值得懷疑?!?/p>

Elon Musk:

“我認(rèn)為,我們對(duì)待人工智能應(yīng)當(dāng)非常謹(jǐn)慎。如果讓我猜測(cè),人類最大的威脅是什么,那么就是人工智能。因此我們需要非常謹(jǐn)慎。我越來越感覺到,這里應(yīng)當(dāng)有一定的監(jiān)管,或許是在全國層面,或許是國際層面,這只是為了確保我們不會(huì)去做一些蠢事?!?/p>

比爾蓋茨:

“我和那些擔(dān)心超級(jí)智能的人同處一個(gè)陣營。起先,機(jī)器將幫我們做許多工作,更不用說超級(jí)智能。如果控制得好,人工智能應(yīng)該會(huì)非常有利。不過,幾十年后人工智能會(huì)強(qiáng)大到足以令人擔(dān)憂的地步。在這一點(diǎn)上我贊同Elon Musk等人的看法,而且我不明白為什么一些人會(huì)對(duì)此仿佛若無其事。”

馬云:

“我認(rèn)為人工智能,你是改變不了的,這是一個(gè)巨大的趨勢(shì),你只能改變自己。為未來來講,三十年也好、五十年也好,人類的沖擊一定會(huì)非常之大,而且一定會(huì)非常疼痛的,任何高科技帶來的問題,帶來好處也會(huì)帶來壞處。有一點(diǎn)是肯定的,未來的機(jī)器一定比你更了解自己,人類最后了解自己,是有可能通過機(jī)器來了解的,因?yàn)槲覀兊难劬κ峭饪吹模琁T往外看的,但是DT是往內(nèi)看的,往內(nèi)走才是有很大的一個(gè)差異。至于前段時(shí)間比較熱門的AIphaGo,人跟圍棋下,我在深圳互聯(lián)網(wǎng)大會(huì)上講了一下,我認(rèn)為這是一個(gè)悲劇,圍棋是人類自己研究出來,自己玩的東西,人要跟機(jī)器去比圍棋誰下得好,我第一天就不會(huì)比,就跟人要跟汽車比誰跑步跑得快,那不是自己找沒趣嗎,它一定比你算得快?!?/p>

王垠:

“很多人喜歡鼓吹人工智能,自動(dòng)車,機(jī)器人等技術(shù),然而如果你仔細(xì)觀察,就會(huì)發(fā)現(xiàn)這些人不但不理解人類智能是什么,不理解人工智能有什么局限性,而且這些“AI 狂人”們的心,已經(jīng)嚴(yán)重的機(jī)械化了。他們或多或少的失去了人性,仿佛忘記了自己是一個(gè)人,忘記了人最需要的是什么,忘記了人的價(jià)值。這些人就像卓別林在『大獨(dú)裁者』最后的演講里指出的:“機(jī)器一樣的人,機(jī)器一樣的心。”每當(dāng)提到 AI,這些人必然野心勃勃地號(hào)稱要“取代人類的工作”,“節(jié)省勞動(dòng)力開銷”。暫且不討論這些目標(biāo)能否實(shí)現(xiàn),它們與我的價(jià)值觀,從一開頭就是完全矛盾的。一個(gè)偉大的公司,應(yīng)該為社會(huì)創(chuàng)造實(shí)在的,新的價(jià)值,而不是想方設(shè)法“節(jié)省”什么勞動(dòng)力開銷,讓人失業(yè)!想一下都覺得可怕,我創(chuàng)造一個(gè)公司,它最大的貢獻(xiàn)就是讓成千上萬的人失業(yè),為貪得無厭的人節(jié)省“勞動(dòng)力開銷”,讓貧富分化加劇,讓權(quán)力集中到極少數(shù)人手里,最后導(dǎo)致民不聊生,導(dǎo)致社會(huì)的荒蕪甚至崩潰……”

參考資料:

  1. 什么是人工智能?《NEWTON科學(xué)世界》2014年第3期
  2. 論大數(shù)據(jù)的泡沫、價(jià)值與應(yīng)用陷阱。http://www.datagold.com.cn/archives/7052.html
  3. 阿爾法狗(AlphaGo)徹底戰(zhàn)勝人類意味著什么?http://www.datagold.com.cn/archives/7591.html
  4. 我為什么不在乎人工智能。http://www.yinwang.org/blog-cn/2017/04/23/ai

 

作者:杜圣東

來源:點(diǎn)金大數(shù)據(jù)?

本文由 @點(diǎn)金大數(shù)據(jù)?授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

部分內(nèi)容和圖片選自網(wǎng)絡(luò);題圖來自PEXELS,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 感覺像是《人工智能》的讀后感

    來自天津 回復(fù)