AI時(shí)代不得不提的恐怖谷
AI人工智能的到來的確給人類生活帶來了許多便利,但是當(dāng)機(jī)器被賦予人格,開始有情緒會(huì)思考,并且與人類越來越相像,這時(shí),人類還能夠很冷靜地面對(duì)AI人工智能嗎?
隨著AI時(shí)代的到來,越來越多的智能設(shè)備進(jìn)入了我們的生活。它們?cè)诮o我們帶來更多功能和便利的同時(shí),也被賦予了更多“人性化”的特征,比如能說會(huì)動(dòng),有人格,有情緒,甚至?xí)伎肌?/p>
面對(duì)這么多越來越“像人”、越來越“智能”的設(shè)備,人們會(huì)產(chǎn)生什么樣的感受呢?是喜歡還是反感,是接受還是擔(dān)憂?這就涉及到我們今天要介紹的理論“恐怖谷”。
一、什么是“恐怖谷”?
大家有沒有過這樣的經(jīng)歷?當(dāng)你在看一些動(dòng)畫電影中的角色,比如《冰雪奇緣》中的Elsa公主,你會(huì)覺得她很美麗,很吸引人;而當(dāng)你看一些科幻電影中的角色,比如《最終幻想:靈魂深處》的女主角Aki,你會(huì)覺得乍一看人物形象還挺逼真的,但總覺得動(dòng)作表情有些僵硬,給人怪怪的,不太舒服的感覺。
這是為什么呢?其實(shí)可以通過“恐怖谷”的理論來進(jìn)行解釋。
“恐怖谷”理論最早是1970年由日本機(jī)器人專家森政弘提出的,當(dāng)機(jī)器人與人類的相似度極低(如圖,工業(yè)機(jī)器人)時(shí),人們對(duì)它沒有太多的情感反應(yīng);當(dāng)這些非人的物體開始被賦予一些人類的特征,在外形和動(dòng)作上同人類逐漸接近時(shí)(如圖,人形機(jī)器人),人們對(duì)它的親近感和好感度會(huì)逐漸增加;但當(dāng)它與人類相像超過一定程度,人們對(duì)它的好感反而會(huì)下降,呈現(xiàn)一個(gè)情感反應(yīng)的低谷,即“恐怖谷”;當(dāng)它與人類的相似度繼續(xù)上升,人們對(duì)它的好感會(huì)再次回到正面。
二、“恐怖谷”效應(yīng)是如何產(chǎn)生的呢?
解釋“恐怖谷”效應(yīng)成因的角度很多,這里主要介紹最核心的三種:
一種解釋是“認(rèn)知失調(diào)”,簡(jiǎn)單來講,就是“預(yù)期”和“真實(shí)”情況不一致導(dǎo)致認(rèn)知沖突。
當(dāng)類人物體和人類的相似度很高時(shí),我們潛意識(shí)里會(huì)把它視為我們的一員,而對(duì)于我們?nèi)祟悂碇v,每天接觸各種各樣的人,人是什么樣子的,能長(zhǎng)成什么樣子,應(yīng)該有怎樣的動(dòng)作表情,我們都很清楚;當(dāng)它有任何不像人的地方時(shí),我們很容易就能察覺,并和我們本來的預(yù)期產(chǎn)生了矛盾,我們無(wú)法馬上解決這種矛盾時(shí),內(nèi)心的不舒適甚至不安和恐懼就發(fā)生了。
2011年,加州大學(xué)圣地亞哥分校的認(rèn)知科學(xué)家艾斯?塞金(Ayse Saygin)通過腦成像實(shí)驗(yàn)發(fā)現(xiàn),人們?cè)谟^看仿真機(jī)器人的活動(dòng)影像時(shí),大腦與運(yùn)動(dòng)感知相關(guān)的區(qū)域活動(dòng)會(huì)比觀看人類和普通機(jī)器人更加活躍(如圖)。
因?yàn)楫?dāng)我們看普通機(jī)器人和人類活動(dòng)時(shí),他們的外觀會(huì)幫助我們提前預(yù)測(cè)他們的運(yùn)動(dòng)方式,而實(shí)際看到的結(jié)果就如我們預(yù)期的一樣。
仿真機(jī)器人卻不同,他們外觀酷似人類,動(dòng)作卻和機(jī)器人相同,這在我們頭腦中造成了與預(yù)期不符的矛盾,從而要調(diào)動(dòng)更多的大腦區(qū)域來協(xié)調(diào)這些矛盾。這一結(jié)果正好可以佐證“認(rèn)知失調(diào)”這一解釋。
還有一種解釋是“共情抑制”,即當(dāng)我們看到一個(gè)既像人又不像人的個(gè)體時(shí),無(wú)法很好地感受和理解對(duì)方的情緒和情感狀態(tài),我們的“共情”能力出現(xiàn)了障礙,這讓我們感覺很不舒服。
2007年,在日本京都國(guó)際電氣通信基礎(chǔ)技術(shù)研究所工作的蒂埃里?查米納德(Thierry Chaminade)和他的同事做了一項(xiàng)研究,他們給參與研究的志愿者播放了一組擬人度不同的電腦合成角色,同時(shí)對(duì)這些志愿者的腦部進(jìn)行核磁共振掃描。
結(jié)果顯示,當(dāng)志愿者看到擬人程度很高的角色時(shí),腦中負(fù)責(zé)心理化(Mentalizing)的區(qū)域活動(dòng)會(huì)明顯增強(qiáng)。所謂心理化,包含理解他人情感的能力。
這一區(qū)域活動(dòng)增強(qiáng)說明人們?cè)诶斫饽切└邤M人程度角色的情緒/情感時(shí)出現(xiàn)了困難,這在一定程度上支持了“共情抑制”的解釋。
也有一些研究人員會(huì)從“進(jìn)化選擇”的角度進(jìn)行解釋,指出人類會(huì)從本能上排斥那些看起來不太正常的、病態(tài)的個(gè)體,以此來保護(hù)自己,而這些不正常、病態(tài)的特征通常都是由面部和肢體表現(xiàn)出來的。
所以當(dāng)我們看到那些看似逼真,卻面色慘白、表情僵硬、動(dòng)作機(jī)械的仿真機(jī)器人時(shí),會(huì)不自覺地聯(lián)想到“不健康”、甚至“死亡”,這時(shí)候就會(huì)產(chǎn)生不適、反感甚至恐懼的感覺。
我們前面說的“恐怖谷”理論基本都是圍繞著外表和動(dòng)作的視覺感知層面,而隨著AI時(shí)代的到來,人們?cè)絹碓蕉嗟厥褂谜Z(yǔ)言直接和一些智能設(shè)備進(jìn)行對(duì)話。
三、對(duì)于“機(jī)器的語(yǔ)言”,是否也存在“恐怖谷”效應(yīng)呢?
有研究者嘗試探索過在聲音的自然度方面是否存在“恐怖谷”效應(yīng),發(fā)現(xiàn)在當(dāng)時(shí)的實(shí)驗(yàn)條件下,聲音的自然度方面,并不存在“恐怖谷”效應(yīng)。
2014年,捷克皮爾森西波西米亞大學(xué)應(yīng)用科學(xué)系的研究人員,曾探討過在語(yǔ)音對(duì)話系統(tǒng)中TTS(通過技術(shù)的手段把文本轉(zhuǎn)成語(yǔ)音)和“恐怖谷”之間的關(guān)系。
他們讓30名受試者(大學(xué)生,覆蓋技術(shù)和人文學(xué)科背景)分別同AI語(yǔ)音交互系統(tǒng)進(jìn)行兩段對(duì)話,分別對(duì)應(yīng)TTS合成的兩種聲音,機(jī)器化的聲音(聲音A)和自然度高的聲音(聲音B),然后讓受試者評(píng)價(jià)對(duì)兩種聲音及兩段對(duì)話的喜好度。
結(jié)果發(fā)現(xiàn),近3/4的用戶更喜歡自然度高的聲音(聲音B),且技術(shù)學(xué)科背景的學(xué)生喜歡聲音B的比例更高。
除了聲音的自然度,如果人們還能從“機(jī)器的語(yǔ)言”中感受到類人的情緒/情感,性格特征,邏輯思考及解決問題等能力時(shí),是否會(huì)產(chǎn)生“恐怖谷”效應(yīng)呢?下面這個(gè)研究,可以從一定程度上給我們一些啟示。
2017年,德國(guó)開姆尼茨工業(yè)大學(xué)的心理學(xué)家斯坦(Jan-Philipp Stein)和奧勒(Peter Ohler)做過一個(gè)實(shí)驗(yàn),他們讓被試通過VR觀看一支3D影片,里面是一對(duì)男女正在進(jìn)行一小段對(duì)話,整段對(duì)話包含多種情緒/情感狀態(tài),兩人先是提到燥熱的天氣讓人昏昏欲睡,接著女人開始抱怨她擁有的自由時(shí)間太少,而且那個(gè)還不出現(xiàn)的遲到朋友讓她覺得很困擾,與此同時(shí),男人在對(duì)話中會(huì)對(duì)女人的處境展現(xiàn)同情。
受試者分為4組,每組看的內(nèi)容一模一樣,不同的是被告知對(duì)話產(chǎn)生的方式不一樣。研究者告訴組1和組2的受試者,這段對(duì)話是兩個(gè)真實(shí)的人在說話,其中組1的對(duì)話內(nèi)容是提前設(shè)計(jì)好的,而組2則是現(xiàn)場(chǎng)自主產(chǎn)生的;而組3和組4的受試者,則被告知其實(shí)是電腦在后臺(tái)控制著屏幕上兩個(gè)人的對(duì)話,只不過組3的對(duì)話內(nèi)容是提前設(shè)計(jì)好的,而組4是自發(fā)產(chǎn)生的。
結(jié)果發(fā)現(xiàn),組4(被告知對(duì)話是由電腦操控且自主產(chǎn)生)的受試者表示他們?cè)谟^看影片時(shí)會(huì)有特別怪異的感受。
研究人員認(rèn)為,這可能是因?yàn)楫?dāng)他們覺得電腦是主動(dòng)表現(xiàn)出同情、困擾等情緒/情感時(shí),會(huì)覺得不安,甚至恐懼,擔(dān)心人類的獨(dú)特性和掌控權(quán)會(huì)受到威脅。
從以上可以看出,對(duì)于“機(jī)器的語(yǔ)言”,在聲音的自然度方面并不存在“恐怖谷”效應(yīng);而當(dāng)聲音帶有情緒/情感時(shí),則會(huì)觸發(fā)“恐怖谷”效應(yīng)。
目前“恐怖谷”理論比較多地被應(yīng)用于影視、動(dòng)畫、游戲制作領(lǐng)域,也出現(xiàn)了不少跌入“恐怖谷”的失敗案例。如開篇提到的《最終幻想:靈魂深處》中的女主角Aki;還有好萊塢電影《極地特快》,全球第一部全部使用數(shù)字捕捉技術(shù)的高仿真動(dòng)畫電影,其人物角色逼近真人,卻招致不少批評(píng)聲,有人說它給人一種毛骨悚然的感覺,有人覺得人物形象有點(diǎn)像僵尸,甚至有人認(rèn)為這部片子應(yīng)該起名為“活死人之夜”……
四、如何避免跌入“恐怖谷”呢?
目前來看,比較有效的方式是不挑戰(zhàn)“恐怖谷”,止于谷前,消除 “似是而非”的狀態(tài),明確非人的特征。
其中,最常見的手段是風(fēng)格化,通過藝術(shù)處理來告訴玩家,眼前的事物是虛擬的或者是非人類的。一旦玩家接受了這個(gè)設(shè)定,他們身上所具有的人的特征就會(huì)特別迷人。
風(fēng)格化的具體表現(xiàn)形式可以有很多:比如說卡通渲染風(fēng)格(如《冰雪奇緣》、《超人總動(dòng)員》),哥特陰郁風(fēng)格(如《僵尸新娘》、《尋夢(mèng)環(huán)游記》),面部藝術(shù)化處理(如《最終幻想15》)等。
其中值得一提的是《阿凡達(dá)》,它首先給予納威人一個(gè)“外星人”的設(shè)定,使觀眾從心理上就不會(huì)把他們當(dāng)作人來看待,同時(shí)通過非常態(tài)的表現(xiàn),重新設(shè)計(jì)了納威人的表情、動(dòng)作和語(yǔ)言文化表現(xiàn),讓納威人“外星人”的特點(diǎn)更加突出逼真。
對(duì)于目前已經(jīng)在我們生活中出現(xiàn)以及未來還會(huì)大量出現(xiàn)的各種智能設(shè)備,我們?cè)谠O(shè)計(jì)它們的時(shí)候,在希望它們變得越來越“像人”、越來越“智能”的時(shí)候,應(yīng)該也要同時(shí)考慮到這樣會(huì)不會(huì)引發(fā) “恐怖谷”效應(yīng),要有意識(shí)地去規(guī)避這種效應(yīng)。這是我們每個(gè)關(guān)心人工智能,關(guān)心這個(gè)行業(yè)發(fā)展的人都需要去注意的一個(gè)問題。
本文由 @?AIID(百度) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
會(huì)不會(huì)有一種可能…寵物狗看見玩具狗有時(shí)會(huì)汪汪大叫,也是由于動(dòng)物的“恐怖谷”效應(yīng)呢?