你們把AI吹上了天,但它卻依然沒4歲的小孩聰明
四歲的孩子能快速識別出貓和理解單詞的意思,他們也能做出創(chuàng)造性的、令人驚訝的新推斷,這些推斷也遠遠超出他們的經驗范疇,而AI的學習能力和他們比相去甚遠。
有研究表明,人工智能聽上去很厲害,但目前最先進的人工智能還遠遠不能解決人類4歲兒童能夠輕松解決的問題,那么,人工智能會變得比4歲的孩子更聰明嗎?看看孩子們如何處理信息如何學習的,大家或許能獲得啟發(fā)。
每個人都聽說過人工智能的新進展,尤其是機器學習,盡管人工智能的名稱令人印象深刻,但該技術在很大程度上是由檢測大數據集中的統計模式的技術構成的,人類的學習方法可遠不止于此。
一、人類是如何學習的
我們是怎么對我們周圍的世界了解得這么多的呢?即使還是兒童的時候,我們也能學到很多的東西,比如四歲的孩子已經知道植物、動物和機器;欲望、信念和情感;甚至恐龍和宇宙飛船。
科學已經把我們對世界的認識擴展到不可想象的地步,擴展到宇宙的邊緣和時間的開始,我們用這些知識進行新的分類和預測,想象各種新的可能性,并在這個世界促成新的事情的發(fā)生,但觸及這個世界的只是一股觸及我們視網膜的光子流以及干擾耳膜的空氣,當我們擁有的例證如此有限的時候,我們是如何用眼睛后面的幾磅灰色黏液來完成這一切的呢?
到目前為止,最好的答案是,我們的大腦基于觸達我們各種感官的具體特定而又混亂的數據進行運算,然后那些運算產生了對世界的準確描述,表現形式似乎是結構化的、抽象的和層次化的,它們包括對三維物體的感知,構成語言基礎的語法,以及“心智理論”等心智能力。
“心智理論”能讓我們理解他人的想法,這些表現形式使得我們能夠做出各種各樣的新預測,并以人類特有的創(chuàng)造性方式想象出許多新的可能性。
這種學習不是唯一的一種智力形式,但對人類來說尤其重要,這種智力是小孩子的專長,盡管孩子們在計劃和決策方面非常糟糕,但他們是世界上最好的學習者,事實上,很多將數據轉化為理論的過程發(fā)生在我們五歲之前。
二、人類兩種基本的學習方法
自亞里士多德和柏拉圖以來,有兩種基本的方法來解決我們如何知道我們所知道的東西的問題,它們仍然是機器學習的主要方法。
亞里士多德自下而上來解決這個問題:從感覺開始——光子流和空氣振動(或數字圖像或錄音的像素或聲音樣本),這樣看你能否從中發(fā)現學習模式,這種方法被像哲學家大衛(wèi)·休謨(David Hume)和密爾(J. S. Mill)這樣的古典聯想主義者以及后來的像巴甫洛夫(Pavlov)和斯金納(B. F. Skinner)這樣的行為心理學家進一步發(fā)揚。從這個觀點來看,表現形式的抽象性和層次性結構是一種錯覺,或者至少是一種附帶現象,所有的工作都可以通過關聯和模式檢測來完成,特別是如果有足夠數據的話。
這種自下而上的學習方法和柏拉圖的自上而下的學習方法一直共存,誰也無法一直壓過對方。
也許我們從具體的數據中獲得抽象的知識,是因為我們已經知道了很多的東西,特別是由于進化,我們已經有了一系列基本的抽象概念。像科學家一樣,我們可以用這些概念來構建關于世界的假設,然后,如果那些假設是正確的,我們就可以預測數據應該是什么樣的,而不是試圖從原始數據中發(fā)現模式,與柏拉圖一樣,笛卡爾(Descartes)、諾姆喬姆斯基(Noam Chomsky)等“理性主義”哲學家和心理學家也采取了這種方法。
有一個日常例子可說明上述兩種方法之間的差異,它就是解決垃圾郵件泛濫的問題,那些郵件數據由收件箱中長長的未分類的消息列表組成,現實情況是,其中一部分郵件是非垃圾郵件,一部分是垃圾郵件。如何使用數據來區(qū)分它們呢?
先來考慮自下而上的方法,你會注意到,垃圾郵件往往有一些特征:長長的收件人列表,發(fā)送自尼日利亞,內文提及百萬美元獎金或者壯陽藥,問題是,完全有用的非垃圾郵件也可能具有這些特征,如果你看了足夠多的垃圾郵件和非垃圾郵件的例子,你可能會發(fā)現垃圾郵件不僅往往具有這些特征,這些特征還往往以特定的方式出現在一起(尼日利亞來源以及提及100萬美元獎金意味著有問題)。
事實上,可能有某種微妙的更高級的相關性可用來將垃圾郵件與有用的非垃圾郵件區(qū)分開來——例如,拼寫錯誤和IP地址比較特殊,如果檢測到那些特殊的模式,就可以過濾掉垃圾郵件。自下而上的機器學習技術正是這樣做的,學習者會得到數百萬個例子,每個例子都有某些特征,每個例子都被標記為垃圾郵件(或者其他的類別),計算機可以提取出區(qū)分二者的特征的模式,即便那些特征非常微妙。
那么自上而下的方法呢?舉例來說,你收到了一封來自《臨床生物學雜志》編輯的郵件,它談到你寫的其中一篇論文,說他們想要發(fā)表你的一篇文章,郵件來源不是尼日利亞,內文也沒有提及偉哥和百萬美元獎金,該郵件沒有垃圾郵件的任何特征,但通過使用已有的知識,并以一種抽象的方式思考產生垃圾郵件的過程,你可以斷定這封郵件是可疑的:
1. 你知道垃圾郵件發(fā)送者試圖利用人類的貪婪從人們身上榨取錢財。
2. 你還知道,正規(guī)的“開放獲取”期刊已經開始通過向作者而非訂閱者收費來覆蓋它們的成本,你也不從事臨床生物學之類的工作。
綜合所有的這些因素來看,我就可以提出一個關于郵件來源的新假設,它的目的是誘使學者付錢在假期刊上“發(fā)表”一篇文章,這封郵件和其他的垃圾郵件一樣,都源自于可疑的形成過程,盡管它看上去一點也不像垃圾郵件,你可以從一個例子中得出這個結論,你可以跳出郵件本身,通過谷歌搜索發(fā)來郵件的編輯的信息來進一步驗證你的假設。用計算機術語來說,你是從一個“生成式模型”著手,它包括貪婪和欺騙等抽象概念,且描述了垃圾郵件的產生過程,這讓你能夠辨別典型的來自尼日利亞的垃圾郵件,但同時也讓你想象到許多不同種類的潛在的垃圾郵件,當你收到來自《華爾街日報》的郵件時,你可以逆向推斷:“這看起來就像那種從垃圾郵件生成過程中生成的郵件。”
人工智能新的令人興奮之處在于,人工智能研究人員最近開發(fā)出了這兩種強大而有效的學習方法,但評論認為,這些方法本身并沒有什么新的深刻的東西。
三、自下而上的深度學習
在20世紀80年代,計算機科學家發(fā)明了一種巧妙的方法來讓計算機檢測數據中的模式:鏈結式(或稱神經網絡)架構。這種方法在上世紀90年代陷入低潮,但最近隨著谷歌旗下DeepMind等強大的“深度學習”方法的崛起,它又重新煥發(fā)了生機。
例如,你可以為一個深度學習程序提供一組標記為“cat”(貓)、“house”(房子)等等的網絡圖像。該程序能夠檢測區(qū)分這兩組圖像的模式,并使用這些信息正確地標記新的圖像。
被稱為非監(jiān)督式學習的機器學習技術能夠從沒有標記的數據中檢測出模式;它們就是去尋找一組特征——科學家稱之為因素分析。在深度學習機器中,這些過程在不同的層級上重復,有些程序甚至可以從像素或聲音的原始數據中發(fā)現相關的特征,例如計算機可能首先檢測原始圖像中對應于邊和線的的模式,然后在這些模式中找到對應于臉的模式,諸如此類。
另一種歷史悠久的自下而上的技術是強化學習。在20世紀50年代,斯金納(B. F. Skinner)在約翰·沃森(John Watson)的研究基礎上,通過給鴿子安排特定的獎懲活動,控制鴿子去執(zhí)行復雜的動作——甚至指示空射導彈射向目標。其基本理念是,鴿子得到獎勵的行為會重復,而受到懲罰的行為不會重復,直到想要鴿子去做的行為做成了。即便是在斯金納的時代,這個簡單的過程,一遍又一遍地重復,也可能會導致復雜的行為,計算機被設定成一次又一次地執(zhí)行簡單的操作,操作規(guī)模之大超出了人類的想象,計算系統可以通過這種方式學習非常復雜的技能。
強化學習(來源于網絡)
例如,谷歌的DeepMind研究人員將深度學習和強化學習結合起來,教計算機玩雅達利(Atari)的電子游戲,計算機根本不知道這些游戲是怎么玩的,一開始,它的行為是隨機的,它也僅僅得到屏幕在每個時刻的樣子以及它的得分情況方面的信息,深度學習幫助它解釋屏幕上的特征,強化學習則激勵系統獲得更高的分數,這臺計算機很擅長玩其中的幾個游戲,但它也完全玩不好其他的對人類而言易如反掌的游戲。
通過以類似的方式結合使用深度學習和強化學習,DeepMind的AlphaZero程序取得了成功,先后在國際象棋和圍棋比賽中擊敗人類棋手,盡管它只具備基本的游戲規(guī)則知識和一些謀劃能力。AlphaZero還有一個有趣的特點:它可以與自己進行數億次的對弈,在此過程中,它會清除導致落敗的錯誤,同時重復和闡明帶來勝利的策略,這種系統,以及其他涉及到生成對抗網絡技術的系統,會在生成數據的同時也在觀察數據。
當你有計算能力將這些技術應用于非常龐大的數據集、數以百萬計的電子郵件或Instagram圖片或者語音記錄時,你就得以解決以前看起來非常困難的問題,這就是計算機科學中令人興奮的地方。
但是值得記住的是,這些問題——比如識別圖片里的貓或者像“Siri”這樣的口頭詞——對于一個蹣跚學步的人類來說是輕而易舉的,計算機科學最有趣的發(fā)現之一是,對我們來說十分容易的問題(如識別貓)對計算機來說卻很難——比下國際象棋或圍棋困難得多。
計算機需要數以百萬計的例子來對對象進行分類,而我們只需用幾個例子就可以對這些對象進行分類。
四、自上而下的貝葉斯模型
自上而下的方法在早期的人工智能發(fā)展中扮演了重要角色,在2000年,它也經歷了一次復興,以概率模型或貝葉斯生成模型的形式出現。
使用這種方法的早期嘗試面臨兩種問題。首先,大多數的例證模式一般可以用許多不同的假設來解釋:你來自期刊編輯的電子郵件可能是非垃圾郵件,只是看起來不太可能。其次,生成式模型所使用的概念從何而來?柏拉圖和喬姆斯基說,你生來就有這些東西,但是我們如何解釋我們是如何學習最新的科學概念的呢?小孩子又是如何理解恐龍和宇宙飛船的呢?
貝葉斯模型將生成式模型和假設檢驗與概率論相結合,旨在解決這兩個問題。貝葉斯模型讓你計算出在給定的數據下,某一特定假設成立的可能性,通過對我們已經擁有的模型進行小的系統性調整,并根據數據對其進行檢驗,我們有時可以從舊的概念和模型中創(chuàng)建新的概念和模型,但是這些優(yōu)勢被其他的問題所抵消,貝葉斯技術可以幫助你選擇兩個假設中哪個更有可能,但幾乎總是有大量的潛在假設,沒有一個系統可以有效地全盤考慮它們。
貝葉斯模型(來源于網絡)
紐約大學的布倫登·萊克(Brenden Lake)和他的同事們用這種自上而下的方法解決了另一個對人類而言很簡單,但對計算機非常困難的問題:識別不熟悉的手寫字符??纯慈毡井嬀砩系囊粋€字,即使你以前從未見過它,你也可以分辨出它是否與其他日本畫卷上的字符相似或不同,你可能能夠畫出它來,甚至可以根據你看到的這個字符設計出一個虛假的日本字符。
用于識別手寫字符的自上而下方法是,給計算機就每個字符提供數千個例子,并讓計算機提取出顯著的特征,而萊克團隊則是給這個程序提供一個字符書寫過程的通用模型:筆畫要么向右,要么向左,完成一個筆畫以后,開始寫另一個,等等,當程序看到一個特定的字符時,它可以推斷出最可能導致這個字符生成的筆畫順序——就像你基于垃圾郵件形成過程推斷出你的郵件可能是垃圾郵件一樣,然后它就可以判斷一個新字符是來自于這個筆畫順序還是來自于另一個不同的筆畫順序,它自己也可以產生一組類似的筆畫。
這個程序比應用于完全相同的數據的深度學習程序要有效得多,而且它切實反映了人類的行動過程。
這兩種機器學習方法各有優(yōu)缺點,在自下而上的方法中,程序一開始并不需要太多的知識,但是它需要大量的數據,并且只能以限定的方式進行歸納,在自上而下的方法中,程序可以從幾個示例中學習,并做出更廣泛、更多樣的歸納,但是你需要在開始時為其灌輸更多的東西,許多研究人員目前正試圖將這兩種方法結合起來,利用深度學習來實現貝葉斯推理。
人工智能最近的成功在一定程度上是源于那些舊思想的延伸,但更重要的是,多虧了互聯網,我們有了更多的數據,多虧了摩爾定律,我們有了更多的計算能力來應用那些數據。
此外,一個未被重視的事實是,我們所擁有的數據已經被人類整理和處理過了,發(fā)布到網上的貓圖是典型的貓的圖片——人類已經選擇的“好”圖片,谷歌翻譯之所以好用,是因為它利用了數以百萬計的人工翻譯,將其歸納應用到新的文本上,而不是真正理解句子本身。
五、兒童的學習方法與機器有何不同?
然而,關于兒童,真正值得注意的是,他們在某種程度上結合了每一種機器學習方法的最佳特征,并對它們完成巨大的超越。
在過去的15年里,發(fā)展主義者一直在探究孩子們從數據中學習結構的方式,四歲的孩子只需要像自上而下的系統那樣從一兩個數據例子中歸納出非常不同的概念,就可以學習,但是他們也可以從數據本身學習新的概念和模型,就像自下而上的系統一樣。
例如,在實驗室里,研究人員給孩子們一個“布利克特探測器”——一種他們從未見過的新機器,它是一個盒子,當你把特定的物體放在上面時,它就會發(fā)光并播放音樂,研究人員只給孩子們舉了一兩個例子來說明這個機器是如何運轉的,告訴他們,放兩個紅色的方塊在上面就可以讓它運轉,放一個綠色方塊和一個黃色方塊則不行。
即使是18個月大的嬰兒也能立刻明白使得它運轉的基本原理:兩個方塊必須是相同的。他們將這一原理推廣到新的例子中:例如,他們會選擇兩個形狀相同的物體來使得機器運轉。在其他的實驗中,研究人員已經證明,孩子們甚至可以弄明白,是某種隱藏的無形屬性讓機器得以運轉,或者是機器是基于某種抽象的邏輯原理運轉的。
你也可以在孩子們的日常學習中看出這一點。即使數據相對較少,幼兒也能像成人科學家那樣迅速地學習抽象而直觀的生物學、物理學和心理學理論。
近年來,無論是自下而上還是自上而下方法,人工智能系統在機器學習方面所取得的顯著成就,都發(fā)生在一個由假設和概念構成的有限而明確的空間中——一組精確的游戲片段和動作,一組預先確定的圖像。相比之下,兒童和科學家則有時會以激進的方式改變他們的概念,進行范式轉變,而不是簡單地調整他們已有的概念。
四歲的孩子能快速識別出貓和理解單詞的意思,但他們也能做出創(chuàng)造性的、令人驚訝的新推斷,這些推斷也遠遠超出他們的經驗范疇。例如,筆者自己的孫子最近解釋說,如果一個成年人想再次成為一個孩子,他應該嘗試不吃任何健康的蔬菜,因為健康的蔬菜可以讓一個孩子成長為一個成年人,這種看似合理的假設是任何成年人都不會接受的,小孩子才會做出這樣的假設。事實上,筆者和同事已經系統地證明,學齡前兒童比大一點的兒童和成年人更善于提出不太可能的假設,我們幾乎不知道他們怎么會有這種創(chuàng)造性的學習和創(chuàng)新。
不過,看看孩子們都做些什么,可能會給程序員帶來一些有用的關于計算機學習方向的提示,兒童學習的兩個特點尤其引人注目,兒童是積極的學習者,它們不像人工智能那樣被動地吸收數據。就像科學家做實驗一樣,孩子們的內在動機是,通過他們無休止的玩耍和探索,從他們周圍的世界中獲取信息。
最近的研究表明,這種探索比表面上看起來更有系統性,并且能夠很好地找到有說服力的證據來支持假設的形成和理論選擇,所以,如果將“好奇心”植入機器,并讓它們與世界積極互動,可能是讓它們的學習變得更真實、更廣泛的一條路徑。
其次,不同于現有的人工智能,兒童是社會和文化的學習者,人類不是在封閉的狀態(tài)下學習,而是利用過去幾代人所積累下來的智慧,最近的研究表明,甚至學齡前兒童也是通過模仿和聆聽他人來學習的,但是他們并不只是被動地服從他們的老師,相反,他們以一種非常微妙和敏感的方式從他人那里獲取信息,對信息的來源和可信度做出復雜的推斷,并系統地將自己的經歷與所聽到的內容整合起來。
“人工智能”和“機器學習”聽起來很可怕,在某些方面確實如此,例如,這些系統被用來控制武器,我們真的應該對此感到害怕。
然而,人的愚蠢比人工智能造成的破壞要大得多,我們需要變得比過去聰明得多,才能恰當地駕馭這些新技術,但對于人工智能取代人類,還有無論是世界末日預言還是烏托邦式愿景,都沒有多少依據。
在我們解決學習的基本悖論之前,再好的人工智能也不如普通的四歲兒童。
選自:史密森學會雜志
作者:Alison Gopnik
翻譯:網易智能,公眾號:網易智能(ID:smartman163)
參與:樂邦
編輯:定西
來源:https://mp.weixin.qq.com/s/wx8YCyhGxi97VjNqZZmfkQ
本文由 @網易智能 授權發(fā)布于人人都是產品經理,未經作者許可,禁止轉載
- 目前還沒評論,等你發(fā)揮!