用圖像控制猴子大腦,哈佛大學(xué)是如何用算法“造夢(mèng)”的?

0 評(píng)論 2457 瀏覽 2 收藏 14 分鐘

我們看見(jiàn)某些圖像之所以感到快感,因?yàn)槲覀円贿呍诳?,一邊在求知。善于摹仿,是人?lèi)的“本能”,也是AI的宿命。

還記得電影《盜夢(mèng)空間》中的“造夢(mèng)師”嗎?

他們可以制造出多層夢(mèng)境,把某種意念植入人的大腦,還能從人的夢(mèng)中竊取情報(bào)。

前不久,就有人發(fā)明出了一個(gè)名叫“XDREAM”的算法,可以通過(guò)圖像刺激大腦神經(jīng)活動(dòng),從而控制某些特定神經(jīng)元。這一次他們的對(duì)象,只是猴子。

AI造夢(mèng):還原猴子眼中的世界

5月2日,頂級(jí)學(xué)術(shù)期刊《CELL》(《細(xì)胞》)發(fā)表了一篇論文,哈佛大學(xué)的科學(xué)家把猴子的大腦與傳感器和神經(jīng)網(wǎng)絡(luò)連接起來(lái),向猴子播放AI系統(tǒng)生成的圖像,采集并分析猴子看到不同圖像時(shí)的神經(jīng)元活動(dòng),并根據(jù)猴子的反應(yīng)強(qiáng)度來(lái)實(shí)時(shí)調(diào)整和生成新的圖像。

最終的實(shí)驗(yàn)成果顯示,AI系統(tǒng)已經(jīng)能夠自動(dòng)生成激活單個(gè)腦區(qū)的圖像,刺激到猴子大腦的特定神經(jīng)元(實(shí)驗(yàn)中是識(shí)別面部)。

用圖像控制猴子大腦,哈佛大學(xué)是如何用算法“造夢(mèng)”的?

這項(xiàng)研究的特別之處在于,算法生成的圖像,比起對(duì)照組中的自然圖像,對(duì)腦補(bǔ)神經(jīng)元的刺激程序更好。

換句話(huà)說(shuō),這些看起來(lái)像是真實(shí)世界扭曲版本的圖片,可能才是猴子最興奮的畫(huà)面。論文的第一作者卡洛斯·龐斯,在項(xiàng)目中時(shí)是哈佛醫(yī)學(xué)院瑪格麗特·利文斯通實(shí)驗(yàn)室的博士后研究員,現(xiàn)在則是圣路易斯華盛頓大學(xué)的一名教師。他表示,使用這個(gè)算法工具生成的圖片時(shí),“(猴子大腦的)細(xì)胞活躍度提高到了我們前所未見(jiàn)的水平?!?/p>

用圖像控制猴子大腦,哈佛大學(xué)是如何用算法“造夢(mèng)”的?

這個(gè)圖顯示了自然圖像(右)和猴子神經(jīng)元進(jìn)化的圖像(左)

被命名為XDREAM的算法,是由威爾·肖在兒童醫(yī)院加布里埃爾·克賴(lài)曼實(shí)驗(yàn)室開(kāi)發(fā)的,并得到了美國(guó)國(guó)立衛(wèi)生研究院和國(guó)家科學(xué)基金會(huì)的資助,這是第一次在真實(shí)的神經(jīng)元上進(jìn)行測(cè)試。

它對(duì)一系列圖像進(jìn)行變異與重新組合,變成了一堆奇怪的東西,比如穿著外科手術(shù)服的熟人、動(dòng)物房間里的漏斗……和人類(lèi)夢(mèng)境中奇怪的事物有點(diǎn)異曲同工之妙。

XDREAM生成的圖片更像是神經(jīng)元之間相互溝通所使用的語(yǔ)言,有的東西甚至根本不存在。難怪作者龐斯說(shuō):“如果細(xì)胞會(huì)做夢(mèng),那么這些可能就是細(xì)胞夢(mèng)見(jiàn)的景象?!?/p>

GAN再立新功,繪制夢(mèng)境有何難?

系統(tǒng)生成的圖像比真實(shí)的事物更讓猴子感到興奮,這項(xiàng)發(fā)現(xiàn)能夠帶來(lái)哪些想象空間?想要回答這個(gè)問(wèn)題,我們可能需要再往前一步,先探尋視覺(jué)神經(jīng)元的底層機(jī)理。

腦科學(xué)領(lǐng)域的研究者們已經(jīng)通過(guò)無(wú)數(shù)神經(jīng)元測(cè)試實(shí)驗(yàn)證明了,大腦視覺(jué)神經(jīng)元會(huì)對(duì)某些圖像反應(yīng)更強(qiáng)烈,這種“不均衡響應(yīng)”使我們能夠在茫茫人海中被某些特定形狀、顏色或輪廓所吸引,從而快速識(shí)別出那些特別的事物,比如在火車(chē)站找到熟人,高速路旁的廣告牌文字等等。

但是,視覺(jué)神經(jīng)元究竟是如何對(duì)這些特定事物產(chǎn)生反應(yīng)的,至今仍然是一個(gè)謎。

以往,在研究視覺(jué)神經(jīng)元偏好的研究中,人們往往會(huì)使用真實(shí)存在的圖像,這就帶來(lái)了兩個(gè)問(wèn)題:

一是只能研究那些現(xiàn)實(shí)世界中存在的刺激源。但實(shí)際上,人在快速眼動(dòng)(REM)睡眠期間還保持著高頻的腦部活動(dòng)。美國(guó)威斯康辛大學(xué)麥迪遜分校的Giulio Tononi及同事記錄了32個(gè)被試對(duì)象睡著時(shí)的腦電圖,證明參與真實(shí)感官刺激(比如面部和語(yǔ)言)處理的腦區(qū)的高頻活動(dòng)增加了,而且只在夢(mèng)境中出現(xiàn)這些元素時(shí)增加。

但做過(guò)夢(mèng)的人都知道,夢(mèng)境是很難完整回憶和復(fù)現(xiàn)的,也并不與現(xiàn)實(shí)世界完全一致。無(wú)法得知夢(mèng)境的樣子,就使得腦神經(jīng)研究丟失了一塊重要陣地。

二是令腦神經(jīng)研究帶有上了研究人員的主觀(guān)選擇,有一定的片面性。舉個(gè)例子,大家都知道卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展從大腦神經(jīng)中得到了很多啟發(fā),也因此產(chǎn)生了很多模擬人類(lèi)腦活動(dòng)的算法,比如基于注意力的標(biāo)注模型,它會(huì)關(guān)注圖片中的一些重點(diǎn)并對(duì)其進(jìn)行文字描述,比如對(duì)下面這張圖片:

用圖像控制猴子大腦,哈佛大學(xué)是如何用算法“造夢(mèng)”的?

對(duì)圖案中的特征進(jìn)行有選擇的提取,于是我們得到了一個(gè)帶有“海上沖浪者”標(biāo)簽的圖片。

用圖像控制猴子大腦,哈佛大學(xué)是如何用算法“造夢(mèng)”的?

在模型預(yù)訓(xùn)練時(shí),設(shè)計(jì)人員都會(huì)根據(jù)自己的理解和大多數(shù)人類(lèi)的偏好,對(duì)圖片特征賦予一定的權(quán)重進(jìn)行預(yù)訓(xùn)練,讓系統(tǒng)優(yōu)先注意到那些希望它注意到的地方。

但這種選擇真的萬(wàn)無(wú)一失嗎?

從科學(xué)的角度講,我們無(wú)法肯定地回答這個(gè)問(wèn)題,但以前我們也沒(méi)有證據(jù)能夠證明,有的大腦可能不是這么想的,有的大腦比起面孔就是更容易對(duì)文字產(chǎn)生興奮?,F(xiàn)在有了。

深度生成對(duì)抗網(wǎng)絡(luò)(GAN)與遺傳算法的結(jié)合,開(kāi)始讓我們得以看到視覺(jué)神經(jīng)元的真實(shí)“想法”。

研究團(tuán)隊(duì)將微電極陣列植入六只猴子的下顳葉皮質(zhì)(耳朵上方稍微靠后的區(qū)域),向它展示圖像,并測(cè)量猴子在觀(guān)看圖像時(shí)單個(gè)視覺(jué)神經(jīng)元的放電率。GAN每次隨機(jī)生成40個(gè)圖像,其中有10張是令給定神經(jīng)元或神經(jīng)元群中最活躍的圖像,另外30張是由遺傳算法根據(jù)神經(jīng)元的不同反應(yīng),對(duì)這10張圖片中的元素進(jìn)行重新排列組合生成的類(lèi)似圖像。

這樣的循環(huán)測(cè)試會(huì)在1-3 小時(shí)內(nèi)重復(fù)多達(dá)250代,并不斷優(yōu)化“XDREAM”系統(tǒng)的圖像代碼。最終才讓我們看到了會(huì)對(duì)猴子大腦產(chǎn)生超級(jí)刺激的照片,顯然,它與現(xiàn)實(shí)世界和人類(lèi)的理解都完全不同。

用圖像控制猴子大腦,哈佛大學(xué)是如何用算法“造夢(mèng)”的?

單個(gè)神經(jīng)元的最大化響應(yīng)所合成的圖像

有一些神經(jīng)元響應(yīng)符合人們的預(yù)期,比如說(shuō)普遍認(rèn)為視覺(jué)神經(jīng)元喜歡“看臉”,對(duì)面部的反應(yīng)最為敏感。結(jié)果證明果然如此,最后的偏好結(jié)果就進(jìn)化了圓形的粉紅色圖像,有兩個(gè)類(lèi)似眼睛的黑點(diǎn),看上去像一張?jiān)幃惖哪槨?/p>

也有令人不解的地方,比如從真實(shí)圖像進(jìn)化出了一些詭異的黑色小方塊,莫名其妙的顏色混合體等等,這些特別的圖像到底是怎么在神經(jīng)元中作用、映射、成形的,目前還不得而知。這下科學(xué)家們又有新課題可以挑戰(zhàn)咯~

解碼神經(jīng)元,對(duì)人和AI有何價(jià)值?

說(shuō)了這么多,可能大家還是搞不明白,研究猴子的視覺(jué)神經(jīng)元偏好到底有什么用,或者說(shuō),到底能不能創(chuàng)造實(shí)際價(jià)值。

為了解答這個(gè)疑惑,我們就來(lái)捋捋這個(gè)實(shí)驗(yàn)成果的一些獨(dú)到之處:

首先,這項(xiàng)實(shí)驗(yàn)的最大特點(diǎn)是嘗試了一種新的方式,即深度神經(jīng)網(wǎng)絡(luò),來(lái)進(jìn)行腦科學(xué)實(shí)驗(yàn)。XDREAM可以創(chuàng)造任何物體,包括那些不存在的東西。 這使得讓神經(jīng)元可以不受物理世界的限制,從頭開(kāi)始構(gòu)建自己喜歡的圖像。

這使得人類(lèi)對(duì)視覺(jué)神經(jīng)元的運(yùn)動(dòng)機(jī)制能夠以一種完全不帶主觀(guān)偏見(jiàn)的方式展開(kāi),讓神經(jīng)元自己決定并告知研究人員,它想要什么。

另外,從這項(xiàng)研究中,我們可以從圖像進(jìn)化的過(guò)程看到大腦是如何學(xué)會(huì)抽象化真實(shí)事物的相關(guān)特征。

如第一作者龐斯說(shuō):“我們看到大腦正在分析視覺(jué)場(chǎng)景,并由經(jīng)驗(yàn)驅(qū)動(dòng),提取對(duì)個(gè)人重要的信息?!薄按竽X正在適應(yīng)環(huán)境,以不可預(yù)測(cè)的方式編碼具有生態(tài)意義的信息?!?/p>

因此,這項(xiàng)技術(shù)可以應(yīng)用于大腦中任何對(duì)感官信息作出反應(yīng)的神經(jīng)元,如聽(tīng)覺(jué)神經(jīng)元、海馬神經(jīng)元和前額葉皮層神經(jīng)元。

進(jìn)一步了解大腦的工作方式,一方面可以對(duì)醫(yī)學(xué)、健康等領(lǐng)域提供有效的依據(jù),比如:幫助了解學(xué)習(xí)障礙、自閉癥等相關(guān)疾病。

通過(guò)研究患者的視覺(jué)系統(tǒng)變化,了解他們眼中和腦海里真實(shí)的世界景象,研究那些他們會(huì)做出優(yōu)先反應(yīng)的事物,也能夠讓醫(yī)護(hù)人員和家庭成員找到更有效的治療機(jī)制。畢竟見(jiàn)其所見(jiàn),想其所想,是達(dá)成溝通和理解的第一步。

另外,還能促使人工智能開(kāi)發(fā)出與大腦一樣有效、甚至更好的模型。

用圖像控制猴子大腦,哈佛大學(xué)是如何用算法“造夢(mèng)”的?

卷積神經(jīng)網(wǎng)絡(luò)與大腦區(qū)域的關(guān)聯(lián)

2014年左右就有少數(shù)研究開(kāi)始涉及神經(jīng)網(wǎng)絡(luò)與神經(jīng)元的交叉研究,比如:研究人員通過(guò)從人類(lèi)和獼猴身上記錄到的神經(jīng)活動(dòng)與神經(jīng)網(wǎng)絡(luò)中的人工活動(dòng)相比較,最終了解了不同系統(tǒng)看到的圖像。

論文Khaligh-Razavi and Kriegeskorte (2014)使用了表征相似度分析,將37種不同的模型與人類(lèi)和猴子IT進(jìn)行了比較,發(fā)現(xiàn)更擅長(zhǎng)目標(biāo)識(shí)別的模型也能更好地匹配IT表征,而且,通過(guò)監(jiān)督學(xué)習(xí)訓(xùn)練的深度CNN(AlexNet)是表現(xiàn)最好的。這為深度學(xué)習(xí)的進(jìn)展打下了堅(jiān)實(shí)的基礎(chǔ)。

總體而言,機(jī)器神經(jīng)網(wǎng)絡(luò)可以算作是對(duì)為腦神經(jīng)科學(xué)家建模道路的延續(xù)。腦科學(xué)貢獻(xiàn)了路徑,計(jì)算機(jī)領(lǐng)域貢獻(xiàn)了算力和訓(xùn)練方法,以及數(shù)據(jù)。二者的結(jié)合,才讓這些模型錘煉出了令人驚喜的能力。

不過(guò),大腦的神經(jīng)網(wǎng)絡(luò)要比人工的復(fù)雜N倍。直到今天,還有一些特性是今天大多數(shù)神經(jīng)網(wǎng)絡(luò)所沒(méi)有的,比如:尖峰、橫向連接、中央凹、可以跳過(guò)某些層的前饋連接等等。

了解這些大腦細(xì)節(jié)會(huì)不會(huì)對(duì)人工智能帶來(lái)突破性的影響呢?

坦率地說(shuō),沒(méi)有人知道答案,因?yàn)樯疃壬窠?jīng)網(wǎng)絡(luò)并不是(也不可能是)大腦神經(jīng)系統(tǒng)的完整復(fù)現(xiàn),但這卻是AI不得不走的路。

生物學(xué)家,同時(shí)也是哲學(xué)家的亞里士多德曾經(jīng)這樣形容圖像之于大腦的意義:我們看見(jiàn)某些圖像之所以感到快感,因?yàn)槲覀円贿呍诳?,一邊在求知。善于摹仿,是人?lèi)的“本能”,也是AI的宿命。

 

作者:腦極體,微信公眾號(hào):腦極體

本文由 @腦極體 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash, 基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!