人與機(jī)器人的漸進(jìn)式交互研究
百度人工智能交互設(shè)計(jì)院以“機(jī)器人”為研究對象,對人-機(jī)器人的交互體驗(yàn)進(jìn)行了系列研究。本次我們將擷取“在公共場合,人與服務(wù)機(jī)器人的自然交互”這個(gè)主題分享我們的研究和思考。
從古至今,機(jī)器人一直承載著人類巨大的夢想。隨著各類傳感器、語音交互、機(jī)器識(shí)別、SLAM等技術(shù)的蓬勃發(fā)展,機(jī)器人開始從科幻作品中走出,走進(jìn)人們的生活。
8月16日,在世界機(jī)器人大會(huì)上發(fā)布的《中國機(jī)器人產(chǎn)業(yè)發(fā)展報(bào)告(2018)》顯示:2018年,全球機(jī)器人市場規(guī)模將達(dá)到298.2億美元,2013至2018年平均增長率約為15.1%。機(jī)器人市場持續(xù)升溫,機(jī)器人的時(shí)代正在來臨。
百度人工智能交互設(shè)計(jì)院以“機(jī)器人”為研究對象,對人-機(jī)器人的交互體驗(yàn)進(jìn)行了系列研究。本次我們將擷取“在公共場合,人與服務(wù)機(jī)器人的自然交互”這個(gè)主題向業(yè)界分享我們的研究和思考。
導(dǎo)讀:
- 人-機(jī)器人交互的目標(biāo):自然,貼近人的認(rèn)知習(xí)慣;
- 人-機(jī)器人交互的研究方法:自然觀察、參與式設(shè)計(jì)和實(shí)驗(yàn)法;
- 人-機(jī)器人交互的設(shè)計(jì)建議:漸進(jìn)式交互。
前言
在公共場合,人們與機(jī)器(如ATM機(jī))交互時(shí),更傾向于將機(jī)器視為工具,有交互需求,但無交流期待。而當(dāng)面對機(jī)器人,尤其是人形機(jī)器人時(shí),人們更傾向于將其視為類人體,有交流的期待,更渴望自然的互動(dòng)。
目前人-機(jī)器人交互的研究主要聚焦在“對話階段”,如:語音識(shí)別、語義理解、需求滿足等等,而對“對話前階段”涉獵很少。對話前階段同樣至關(guān)重要,它關(guān)系到人對機(jī)器人的“第一印象”,更是對話能否順利開啟的前提與基礎(chǔ)。
那么,在人由遠(yuǎn)到近走向機(jī)器人的過程中,機(jī)器人:
- 是否需要與人交互?被動(dòng)等待還是主動(dòng)出擊,抑或做些什么吸引用戶的注意?
- 如何與人交互?微笑還是眨眼,揮手還是打聲招呼,抑或使用各類傳感器和AI能力尋找合適的交互時(shí)機(jī)?
這些問題是我們本次將重點(diǎn)展開探討的內(nèi)容。
人-機(jī)器人交互的目標(biāo):自然,貼近人的認(rèn)知習(xí)慣
比爾蓋茨曾說“人類自然形成的與自然界溝通的認(rèn)知習(xí)慣和形式必定是人機(jī)交互的發(fā)展方向”,我們終將以自然的方式與機(jī)器人交流。
研究之初,我們梳理了心理學(xué)、社會(huì)學(xué)的相關(guān)研究成果,以及服務(wù)行業(yè)的實(shí)踐成果?;诖?,我們對公共場合中,人與服務(wù)人員的互動(dòng)方式進(jìn)行了溯源,并提煉了人際互動(dòng)的基本規(guī)則。
在了解規(guī)則之前,大家不妨回憶下自己在公共場合和各類服務(wù)人員的交往經(jīng)驗(yàn),哪些讓你感覺不錯(cuò),哪些讓你覺得不爽甚至惱怒?我們調(diào)研發(fā)現(xiàn),大家感受不好的服務(wù)體驗(yàn)主要有兩類:
類型1:熱情過度,服務(wù)過度
一直盯著/亦步亦趨地跟著/時(shí)不時(shí)的各種介紹/……
類型2:冷冰冰,愛搭不理
基本不看我/冷冷地掃我一眼/對我的問題愛搭不理/……
而大家普遍感受較好的服務(wù)體驗(yàn)也表現(xiàn)出了共性:主動(dòng)、熱情,有分寸。
剛看到我會(huì)點(diǎn)頭微笑/主動(dòng)打招呼/有需要主動(dòng)上前/無需要不會(huì)打擾/……
如何讓人們感受到主動(dòng)、熱情,又在心理上營造恰如其分的分寸感呢?作為公共場合的服務(wù)人員至少需要遵循以下2大規(guī)則:
(1)維持恰當(dāng)?shù)目臻g距離很重要
心理學(xué)家發(fā)現(xiàn),每個(gè)人都有保護(hù)個(gè)人空間的本能,在公共場合這種本能尤其強(qiáng)烈。一旦個(gè)人空間受到侵犯,人就會(huì)感到不舒服、甚至憤怒起來。
愛德華·霍爾在其經(jīng)典著作《無聲的語言》(1959年)一書中,將日常生活中人與人的空間距離劃分為四類:親密距離、個(gè)人距離、社交距離和公眾距離。每種距離又有“近端”和“遠(yuǎn)端”之分。
- 親密距離是人際交往的最小間隔,通常只限家中等個(gè)人情境,只限情感上聯(lián)系高度密切的人之間使用。尤其是近端,通常只允許情侶或孩子進(jìn)入。
- 個(gè)人距離是朋友間溝通的恰當(dāng)距離。通常陌生人進(jìn)入近端會(huì)構(gòu)成侵犯;而遠(yuǎn)端,熟人和陌生人都可以進(jìn)入。不過熟人更靠近遠(yuǎn)端近點(diǎn)(75cm)一側(cè),而陌生人則更建議靠近遠(yuǎn)端遠(yuǎn)點(diǎn)(1.2m)一側(cè)。
- 社交距離又稱禮貌距離,體現(xiàn)出一種社交性或禮節(jié)上的正式關(guān)系。通常的社交活動(dòng)一般都保持在社交距離的近端;遠(yuǎn)端適用于更正式的場景,如:面試、談判。
- 公眾距離是公開演講中演講者與聽眾保持的距離,并不適合人際溝通。在7.5m以外,幾乎是容納任何人的空間。人們在這個(gè)空間內(nèi),完全可以對其他人視而不見。
(2)禮儀很重要,表情動(dòng)作是精髓
孔子曰“不學(xué)禮,無以立”。在所有行業(yè)中,服務(wù)業(yè)對禮儀的重視程度尤其高。服務(wù)人員遵循的禮儀分為:儀容儀態(tài)、表情動(dòng)作、語言、常見禮節(jié)四大模塊。
在這些服務(wù)禮儀中,表情動(dòng)作起著至關(guān)重要的作用。微笑是社交中最受歡迎、最具吸引力、最有價(jià)值的表情,真誠、溫暖、自然的微笑能有效的拉近人與人之間的距離。眼神是最生動(dòng)、最善于傳情達(dá)意的表情,眼神注視接觸時(shí)長不同、停留部位不同、眼神變化均會(huì)帶來不同的感受。
常見禮節(jié)則明確了在不同場景下(如見面、打招呼、介紹),表現(xiàn)尊重的慣用形式和具體要求,非常具有可操作性。
服務(wù)業(yè)有許多基于交往距離和禮儀來定義交互方式的成功案例,比如:
- 沃爾瑪?shù)摹叭孜⑿υ瓌t”:每當(dāng)你在3米內(nèi)遇到一位顧客時(shí),要微笑,要看著他的眼睛與他打招呼,同時(shí)詢問你能為他做些什么。
- 萬豪國際酒店的“15/5規(guī)則”:與客人相距15步時(shí),主動(dòng)向客人微笑并進(jìn)行注目禮;與客人相距5步時(shí),盡可能停下來,靠邊站,點(diǎn)頭及主動(dòng)問好。
那么,人際交往中的距離和禮儀規(guī)則是否適合人-機(jī)器人交互?如何將這些規(guī)則提取轉(zhuǎn)化,形成適合機(jī)器人表達(dá)的方式?這是需要深入思考的問題,為此我們做了研究和驗(yàn)證。
人-機(jī)器人交互的研究方法:自然觀察、參與式設(shè)計(jì)和實(shí)驗(yàn)法
為了探索在公眾場合,用戶走向機(jī)器人的過程中對機(jī)器人的真實(shí)期待,我們使用了自然觀察、參與式設(shè)計(jì)、深度訪談和實(shí)驗(yàn)法來開展研究。
本次研究中,以小度機(jī)器人為研究載體。小度機(jī)器人依托百度的人工智能,集成了自然語言處理、對話系統(tǒng)、語音視覺等技術(shù),能夠流暢的與用戶進(jìn)行信息、服務(wù)、情感等多方面的交流。并且,小度機(jī)器人作為百度的“正式員工”,在百度公司的大廳擔(dān)任迎賓的重要角色。
- 首先,我們在真實(shí)的公共場合(百度科技園K2),觀察在無人為干擾的情況下,不同用戶走向小度機(jī)器人時(shí),他們與小度互動(dòng)行為和方式,并對這些行為進(jìn)行提取、編碼和分析。
- 隨后,我們邀請若干用戶進(jìn)行了深度訪談和參與式設(shè)計(jì)。在引導(dǎo)用戶走向小度機(jī)器人的過程中,要求他們自我報(bào)告對小度的需求和期待,共同探討小度更為理想的表達(dá)方式。
- 最后,我們綜合用戶的需求和期待以及人際交往中的各類規(guī)則,將其轉(zhuǎn)化成小度的“行為語言”,并且進(jìn)行了實(shí)驗(yàn)驗(yàn)證。我們設(shè)置了各種實(shí)驗(yàn)場景,用戶在走向小度機(jī)器人的過程中,會(huì)體驗(yàn)到不同的人機(jī)交互方式。
實(shí)驗(yàn)過程中,我們追蹤了用戶的面部表情、肢體動(dòng)作、言語行為等。實(shí)驗(yàn)結(jié)束后,要求用戶對各類交互方式進(jìn)行評估,包括情緒體驗(yàn)、認(rèn)知評價(jià)、主觀滿意度等等。最終獲得了本次研究的結(jié)果。
人-機(jī)器人交互的設(shè)計(jì)建議:漸進(jìn)式交互
我們發(fā)現(xiàn),在與小度機(jī)器人的互動(dòng)中,用戶更期待小度主動(dòng)釋放交互信號(hào),并且這種交互信號(hào)的釋放是一個(gè)漸進(jìn)的、不斷增強(qiáng)的過程,我們將此過程稱之為“漸進(jìn)式交互”。
特別說明的是,這種“漸進(jìn)”并不僅僅是物理距離上由遠(yuǎn)及近的變化,而是用戶“心理場”的漸進(jìn)變化。用戶“心理場”的變化主要分為以下三個(gè)階段,按其在“心理世界”出現(xiàn)的先后順序?qū)⑵涿麨檫h(yuǎn)場、中場和近場。
- 遠(yuǎn)場階段:機(jī)器人需要吸引到用戶的注意力,讓用戶清晰地意識(shí)到“Ta看到我啦”。這是至關(guān)重要的一步。如果無法吸引到用戶的注意力,接下來的人-機(jī)交流將變得突兀甚至無法進(jìn)行。
- 中場階段:機(jī)器人需要進(jìn)一步“發(fā)起互動(dòng)需求”,讓用戶明確意識(shí)到“Ta眼中只有我”,Ta有進(jìn)一步和我互動(dòng)的需求。這也會(huì)促使用戶下意識(shí)的進(jìn)一步走向機(jī)器人。
- 近場階段:如果機(jī)器人“開啟對話”,則會(huì)讓用戶深刻感受機(jī)器人的主動(dòng)和友好,“Ta來撩我啦”,人和機(jī)器人之間的對話自然而然的開展起來。
心理場在物理世界的表征:距離上的漸進(jìn)
同時(shí),我們發(fā)現(xiàn),用戶的心理場在物理世界的表征也體現(xiàn)了距離上的漸進(jìn)。其中,遠(yuǎn)場對應(yīng)的距離約為2.7-4.2米,這個(gè)距離內(nèi),用戶希望小度機(jī)器人傳遞吸引注意力的信號(hào)。
中場對應(yīng)的距離約為1.2-2.7米,這個(gè)距離內(nèi),小度機(jī)器人最好讓用戶意識(shí)到小度想和他/她進(jìn)行進(jìn)一步互動(dòng)。而近場對應(yīng)的距離則在1.2米左右,這個(gè)時(shí)候用戶已到達(dá)和小度開啟對話的恰當(dāng)距離。
人和機(jī)器人交互的距離要求和人際交往距離略有不同,遠(yuǎn)場距離(2.7m-4.2m)超過了社交距離的遠(yuǎn)端(3.6m),落在了公眾距離的近端。之所以如此,推測與小度機(jī)器人本身的特點(diǎn)有關(guān),比如小度身寬1.1m,較之一般人要寬大很多。
心理場在物理世界的表征:期待的交互形式體現(xiàn)了對禮儀的訴求
在不同的心理場,用戶期待小度機(jī)器人做出的交互形式也有所不同。而這些交互形式帶有明顯的禮儀要求。
在遠(yuǎn)場,用戶更期望小度使用“表情”和“肢體動(dòng)作”來吸引注意力。比如微笑、友好的眼神的對接;揮手、歪頭、點(diǎn)頭等等。
在中場,用戶期待小度可以以多種形式組合發(fā)出互動(dòng)信號(hào),讓用戶明確意識(shí)到小度的互動(dòng)對象是自己。比如,使用語言打招呼(如早上好、您好);微笑、揮手等表情和動(dòng)作期待繼續(xù)保留。
而在近場,語言的作用更為突顯。這個(gè)時(shí)候,用戶期待小度先“開啟對話”,如介紹自己,詢問是否需要幫助等。此時(shí)用戶期待小度有更熱情的微笑和肢體動(dòng)作(比如握手、擁抱等)。
對于不同的交互方案,我們進(jìn)行了實(shí)驗(yàn)驗(yàn)證,包括但不限如下問題:
- 不同距離下使用何種表情更佳,表情設(shè)計(jì)時(shí)需要遵循的普適性原則;
- 語言在哪個(gè)心理場出現(xiàn)更佳,語音通道對用戶體驗(yàn)的影響;
- 各類傳感器和AI能力的應(yīng)用(如人臉識(shí)別)能否帶來用戶體驗(yàn)的增益。
以上問題的研究成果和交互建議,百度人工智能交互設(shè)計(jì)院將在未來的文章中或者適當(dāng)?shù)膱龊现杏枰愿嗟姆窒砗团丁?/p>
小結(jié)
本次研究,我們聚焦公共場合,以小度機(jī)器人為載體,探索了人-機(jī)器人對話前的自然交互模態(tài),并提出了一種新的交互理念——漸進(jìn)式交互。我們認(rèn)為,這種交互理念的核心是對用戶心理場的解讀,以及心理場在物理世界的各類表征的探索。
本文TIPS :
(1)人-機(jī)器人交互的目標(biāo)是自然、貼近人的認(rèn)知習(xí)慣。在公共場合,人們很看重維持適當(dāng)?shù)目臻g距離和遵守禮儀。
(2)與機(jī)器人的交互中,用戶更期待“漸進(jìn)式交互”,即機(jī)器人主動(dòng)釋放交互信號(hào),且交互信號(hào)是漸進(jìn)的、不斷增強(qiáng)的過程。
(3)漸進(jìn)式交互核心滿足用戶“心理場的變化”,按照其在心理世界出現(xiàn)的先后順序分為:
- 遠(yuǎn)場:機(jī)器人需要“吸引注意力”,與人之間的物理距離約為2.7-4.2m,更適合使用表情和肢體動(dòng)作。
- 中場:機(jī)器人需要“發(fā)起互動(dòng)需求”,與人之間的物理距離約為1.2-2.7m,更適合使用肢體動(dòng)作、表情和語言等多種方式。
- 近場:機(jī)器人需要“開啟對話”,與人之間的物理距離在1.2m左右,此時(shí)語言的作用更為突顯。
人-機(jī)器人交互研究的內(nèi)涵深厚,外延也在不斷擴(kuò)展中。本次研究主要聚焦在公共場合,小度機(jī)器人本身的外形和產(chǎn)品也會(huì)對用戶產(chǎn)生一定影響。后續(xù)我們將進(jìn)行更多擴(kuò)展研究,如探索家庭場景下的人機(jī)交互、不同形態(tài)機(jī)器人對用戶體驗(yàn)的影響,等等。
在剛剛過去的2018年世界機(jī)器人大會(huì)論壇上,意大利比薩圣安娜大學(xué)教授Paolo Dario表示:“下一個(gè)時(shí)代不再是互聯(lián)網(wǎng),而是機(jī)器人”,未來機(jī)器人領(lǐng)域?qū)?huì)有巨大的潛力和發(fā)展空間。我們也將在人-機(jī)器人交互這個(gè)領(lǐng)域持續(xù)探索,用心去雕琢人機(jī)交互中的每個(gè)細(xì)節(jié)。
本文由 @?AIID(百度) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
提幾個(gè)問題:
1.本文只是簡單的分析了單個(gè)人的人機(jī)交互,既然是公共場合,為何不談?wù)摱鄠€(gè)人的場景呢?多個(gè)人在小度身邊豈不是更復(fù)雜,更好玩,那么我也相信提出的解決方案會(huì)更加有趣;
2.本文的漸進(jìn)式交互更多的是想憑借人們的經(jīng)驗(yàn)試圖讓機(jī)器理解人的行為,心理活動(dòng),類似于打標(biāo)簽的監(jiān)督學(xué)習(xí)去訓(xùn)練小度;(這樣的話,想要達(dá)到好的效果,必須有大量的樣本,本文并沒有在這方面做更多的闡述,所以得出的結(jié)果未免片面了些?。?br /> 綜上兩點(diǎn),期待作者的下篇?。ㄎ蚁脒@樣的話,文章會(huì)更加飽滿,更具有深度?。? ??
不像是大廠的研究結(jié)果,更像一個(gè)本科生的開題報(bào)告。百度加油