6個(gè)方面對(duì)比分析:手勢(shì)、觸控和語(yǔ)音三大交互方式

0 評(píng)論 11925 瀏覽 55 收藏 17 分鐘

手勢(shì)交互、觸控交互和語(yǔ)音交互是當(dāng)下主要的3種交互方式,本文筆者結(jié)合可用性評(píng)估指標(biāo)和自己調(diào)研使用中的發(fā)現(xiàn),從6個(gè)角度對(duì)這3種交互方式進(jìn)行了分析和對(duì)比,供大家參考。

吃小龍蝦的時(shí)候,最怕需要用手機(jī),脫完手套還得擦手。遇上重要來(lái)電,也管不了那么多了,油乎乎的手直接往屏幕上按,按了半天,才發(fā)現(xiàn)手機(jī)根本識(shí)別不到被層層辣油浸染過(guò)的手指頭。(ノ=Д=)ノ┻━┻

隨著技術(shù)發(fā)展,這種煩惱可以消失了。近日華為發(fā)布了Mate30,其中出現(xiàn)了一種相對(duì)新穎的交互形式——隔空手勢(shì)操作。

當(dāng)你在吃螃蟹滿手腥味時(shí),當(dāng)你在剝小龍蝦滿手都是油時(shí),都依然可以無(wú)障礙地使用手機(jī)。

圖片來(lái)源:華為官方宣傳片截圖

其實(shí),這種交互方式并非首次出現(xiàn)在手機(jī)終端里。在今年年初的MWC上,LG已推出了同樣性質(zhì)的Air Motion。

這些產(chǎn)品能夠落地,說(shuō)明手勢(shì)識(shí)別技術(shù)在不斷發(fā)展,當(dāng)前已達(dá)到投入實(shí)際應(yīng)用的標(biāo)準(zhǔn)。

圖片來(lái)源:LG官網(wǎng)

逐漸進(jìn)入大眾視野的手勢(shì)交互,經(jīng)典高效的觸控交互,還有在IOT領(lǐng)域表現(xiàn)亮眼的語(yǔ)音交互,構(gòu)成了當(dāng)下主要幾種交互方式。

我將結(jié)合可用性的評(píng)估指標(biāo)和自己在調(diào)研、使用中的發(fā)現(xiàn),從以下幾個(gè)角度對(duì)這三種交互方式進(jìn)行對(duì)比:

  1. 適用場(chǎng)景
  2. 交互效率
  3. 準(zhǔn)確性與容錯(cuò)性
  4. 學(xué)習(xí)成本
  5. 情感互動(dòng)
  6. 隱私性

需要說(shuō)明一點(diǎn),本文中的手勢(shì)交互是指通過(guò)計(jì)算機(jī)視覺識(shí)別出的手勢(shì)動(dòng)作,無(wú)需和實(shí)體進(jìn)行接觸,類似于Mate 30的隔空手勢(shì)操作或者HoloLens的手勢(shì)操作。而我們?nèi)粘J褂玫膶?duì)ios等進(jìn)行控制的手勢(shì)動(dòng)作,在此文中和按鈕按鍵一起,統(tǒng)一歸入觸控操作內(nèi)。

一、適用場(chǎng)景

我們應(yīng)針對(duì)不同場(chǎng)景的特征去選擇相應(yīng)的交互方式。對(duì)適用場(chǎng)景理解可以從以下三方面入手:

1. 物理層面

語(yǔ)音交互需要用戶能進(jìn)行聽和說(shuō);觸控交互需要用戶能和設(shè)備進(jìn)行接觸;手勢(shì)交互需要用戶的手能自由移動(dòng)。但在一些場(chǎng)景下,用戶并沒(méi)有條件進(jìn)行上述交互行為。

以醫(yī)生為例,可能在他已經(jīng)對(duì)雙手進(jìn)行嚴(yán)格消毒后,仍需要查看病人的相關(guān)資料。但是他無(wú)法確保,所有的屏幕、X光片、檔案等都是干凈的。這時(shí)如果能通過(guò)非接觸的手勢(shì)或語(yǔ)音進(jìn)行操作,就不會(huì)有被污染的風(fēng)險(xiǎn)。

還有像開車的過(guò)程中,有些路段是非常嘈雜的,語(yǔ)音交互可能無(wú)法很好地識(shí)別對(duì)話內(nèi)容;低頭使用觸控屏又有些危險(xiǎn)。這時(shí)采用手勢(shì)交互,就能在相對(duì)安全的基礎(chǔ)上完成用戶的指令。

選擇交互形式的關(guān)鍵,是要回歸到使用場(chǎng)景中,采用各場(chǎng)景內(nèi)的最優(yōu)解。

2. 心理層面

進(jìn)行語(yǔ)音交互時(shí),用戶需要把指令說(shuō)出來(lái)。當(dāng)只有自己一人時(shí),說(shuō)些什么可能都沒(méi)有關(guān)系。但當(dāng)人多起來(lái)時(shí),尤其是不熟悉的人多起來(lái)時(shí),當(dāng)眾說(shuō)一些東西會(huì)讓用戶覺得自己很傻。

此外,公共空間內(nèi),涉及到相對(duì)私密的內(nèi)容時(shí),用戶也不想這樣公之于眾。就像蜘蛛俠在得到語(yǔ)音控制的智能眼鏡Edith后,也只能躲在車的角落里小心翼翼地說(shuō)話。

此外,當(dāng)人正在與他人進(jìn)行交流時(shí),使用語(yǔ)音進(jìn)行交互是一件打斷性非常強(qiáng)的事情。例如幾個(gè)人聊天聊得正嗨,想要播放音樂(lè)或調(diào)解燈光來(lái)營(yíng)造氣氛,突然來(lái)一句“小張同學(xué),播放音樂(lè)”會(huì)顯得很突兀。這種時(shí)候,如果打個(gè)響指就能達(dá)到目的,會(huì)方便自然許多。

大家可能都有在電視內(nèi)進(jìn)行搜索的經(jīng)歷,電視上的鍵盤操作起來(lái)非常麻煩,用著用著就有想摔遙控器的沖動(dòng)?,F(xiàn)在很多電視支持語(yǔ)音檢索,在精細(xì)搜索方面,比之前方便了許多。

以上的這些尷尬、緊張、煩躁等情感,都與選擇了錯(cuò)誤的交互形式相關(guān)。

3. 文化層面

不論你是上??谝暨€是廣東口音,啟動(dòng)iPhone時(shí)按的都是開機(jī)鍵。但在進(jìn)行語(yǔ)音交互時(shí),可能就會(huì)遇到一些麻煩,因?yàn)槎鄶?shù)都是以普通話為基準(zhǔn)。

在這種地方口音非?;祀s的情況下(例如面向老年群體或是口音重的地區(qū)),語(yǔ)音交互的實(shí)用性就會(huì)大幅降低。

此外,在不同國(guó)家,手勢(shì)的含義也可能截然不同。例如最近被惡搞出種族歧視含義的ok手勢(shì),在大部分地區(qū)還是代表著相對(duì)正面的含義。因此在進(jìn)行設(shè)計(jì)時(shí),也需要考慮到不同的文化背景。

二、交互效率

交互效率可以從空間和時(shí)間兩個(gè)維度進(jìn)行考慮。

1. 空間

觸控交互是需要某種實(shí)體承載的,用戶必須要接觸到設(shè)備才能發(fā)出指令。當(dāng)設(shè)備離用戶有一定距離時(shí),則必須要先靠近才能進(jìn)行操作。

例如當(dāng)遙控器不在手邊時(shí),就必須過(guò)去拿到它才可以進(jìn)行操作。而且懶惰是人的天性,躺在沙發(fā)上時(shí)就會(huì)覺得走幾步去拿遙控器也是件麻煩事。

手勢(shì)交互和語(yǔ)音交互則在空間上更為自由,只要在有效交互區(qū)域內(nèi)就可以(即攝像頭能“看清”,麥克風(fēng)能“聽清”),不需要用戶親身接觸到設(shè)備。

當(dāng)用戶離實(shí)體設(shè)備有一定距離時(shí),這兩種方式是更為高效的。

2. 時(shí)間

當(dāng)觸控產(chǎn)品就在手邊時(shí),觸控操作需要的時(shí)間可能是三種交互方式中最短的。而且像蘋果還開發(fā)了“捷徑”功能,人為地進(jìn)一步精簡(jiǎn)操作路徑,縮短交互時(shí)間。

目前的語(yǔ)音交互都需要一些喚醒詞。相較于其他交互形式,喚醒設(shè)備+清楚表達(dá)指令的過(guò)程通常會(huì)花費(fèi)更多的時(shí)間。

有團(tuán)隊(duì)將喚醒詞更短作為產(chǎn)品賣點(diǎn),個(gè)人感覺這也從側(cè)面反映了喚醒這段較長(zhǎng)的交互流程可能是智能音箱的痛點(diǎn)之一。之前有科技新聞報(bào)道,已有團(tuán)隊(duì)能做到無(wú)需喚醒詞,只通過(guò)分析說(shuō)話人的語(yǔ)音語(yǔ)調(diào)語(yǔ)氣,來(lái)判斷是否喚起設(shè)備。

但是就目前的技術(shù)而言,尤其在稍復(fù)雜的場(chǎng)景下,無(wú)喚醒詞的做法可能風(fēng)險(xiǎn)比較大。

手勢(shì)交互中,指令性的內(nèi)容可以分為組合型動(dòng)作和獨(dú)立動(dòng)作(我自己定義的(? ??灬??)?)。我們可以將操控對(duì)象和指令合在一個(gè)手勢(shì)動(dòng)作中,也可以拆分用兩個(gè)動(dòng)作表示。

例如想要音量升高時(shí),可以定義動(dòng)作為“音量”+“升高”或者“音量升高”。組合型動(dòng)作花費(fèi)的時(shí)間更長(zhǎng),獨(dú)立動(dòng)作花費(fèi)的時(shí)間更短。

三、準(zhǔn)確性

1. 指令識(shí)別的準(zhǔn)確性

在識(shí)別指令方面,觸控交互的準(zhǔn)確率是最高的。不論我們是要開關(guān)燈,還是要點(diǎn)擊屏幕上的某個(gè)按鈕,只要用戶在對(duì)的地方用對(duì)的方式進(jìn)行操作,指令幾乎都能及時(shí)被設(shè)備接收并執(zhí)行。

手勢(shì)交互的觸點(diǎn)是全部預(yù)設(shè)好的,這一點(diǎn)與觸控相似,只要用戶執(zhí)行了對(duì)的動(dòng)作,就可以得到相應(yīng)的結(jié)果。

而在語(yǔ)音交互時(shí),用戶表達(dá)的內(nèi)容是沒(méi)有限制的,這也意味著是不可控的。

由于大家在日常生活中說(shuō)的話并不是特別嚴(yán)謹(jǐn),從語(yǔ)義分析的角度,一句話可能可以被解讀為多重意思。因此,在自然語(yǔ)言處理中常常會(huì)面臨二義性的問(wèn)題。

處理這種問(wèn)題時(shí),必須要進(jìn)一步明確用戶意圖,否則設(shè)備可能會(huì)做出與用戶意愿大相徑庭的行為。

2. 喚醒設(shè)備的準(zhǔn)確性

除了以上對(duì)于指令識(shí)別、執(zhí)行的準(zhǔn)確性外,語(yǔ)音和手勢(shì)交互還涉及到設(shè)備喚醒的準(zhǔn)確性。

以我家的小愛同學(xué)為例,偶爾也會(huì)出現(xiàn)明明沒(méi)有有說(shuō)到任何和喚醒詞相關(guān)的內(nèi)容,就突然聽到一聲“我在”。雖說(shuō)我們?nèi)祟愒谌粘I钪?,也常有聽錯(cuò)看錯(cuò)的情況出現(xiàn),但如果設(shè)備經(jīng)常誤觸發(fā)的話會(huì)很影響用戶體驗(yàn)。

這種誤識(shí)別其實(shí)在手勢(shì)交互中也是存在的。為了減少誤觸發(fā),可以提高識(shí)別的閾值,但這也可能提高漏識(shí)的概率。

當(dāng)然,技術(shù)是不斷進(jìn)步的, 在算法不斷更新、樣本不斷增加的基礎(chǔ)上,識(shí)別的準(zhǔn)確率在未來(lái)肯定會(huì)有提升。

3. 干擾

三種交互形式都可能被相應(yīng)的干擾影響,從而降低操作的準(zhǔn)確性。例如語(yǔ)音交互在嘈雜的環(huán)境中,手勢(shì)交互在強(qiáng)烈的陽(yáng)光下,或者觸控交互在寒冷的雪地里。

四、學(xué)習(xí)成本

語(yǔ)音交互屬于最自然的交互方式之一。它能承載非常豐富的指令,卻不需要用戶專門學(xué)習(xí)如何使用。

不過(guò)不少智能音箱都存在互動(dòng)頻率較低的問(wèn)題,用戶在使用時(shí)可能只是局限于某些已知功能,沒(méi)有進(jìn)一步探索或嘗試。

因此,語(yǔ)音交互的學(xué)習(xí)成本在于,要教會(huì)用戶使用更多的功能。例如Siri會(huì)顯示引導(dǎo)“你可以這樣問(wèn)我”;小愛同學(xué)也會(huì)在完成用戶的日常指令后推薦一些自己的其他功能,比如講個(gè)笑話。

觸控交互已經(jīng)深深地融入我們的生活,從以前拉閘的燈,到現(xiàn)代每天使用的手機(jī)。有很多從各個(gè)角度講如何降低產(chǎn)品學(xué)習(xí)成本的文章,此處就不贅述了。降低學(xué)習(xí)成本的一個(gè)經(jīng)典例子就是擬物化設(shè)計(jì),讓當(dāng)時(shí)的用戶更容易從圖標(biāo)聯(lián)想到對(duì)應(yīng)的實(shí)體按鍵。

手勢(shì)交互的學(xué)習(xí)成本相對(duì)較高。在使用語(yǔ)音或觸控時(shí),即便你隨便說(shuō)點(diǎn)什么,也會(huì)有一定的反饋和結(jié)果。而手勢(shì)觸控,則通常需要用戶比出代表正確含義的手勢(shì)才會(huì)生效。

設(shè)計(jì)師能做的,是在設(shè)計(jì)相應(yīng)手勢(shì)前做好詳細(xì)的用戶調(diào)研,盡量使手勢(shì)符合用戶的潛意識(shí),更易于學(xué)習(xí)和記憶。

五、情感互動(dòng)

而在調(diào)動(dòng)用戶情感方面,語(yǔ)音交互自帶加成。聲音是一種有溫度的介質(zhì),我們會(huì)不自覺地通過(guò)聲音的感覺、說(shuō)話的語(yǔ)音語(yǔ)調(diào)去想象這個(gè)聲音背后的形象。尤其是現(xiàn)在的算法極大地豐富了語(yǔ)音進(jìn)行互動(dòng)的能力后,這種溫度感更加被放大了。

就像電影《Her》中,男主與AI語(yǔ)音陷入了愛情。在《設(shè)計(jì)心理學(xué)3》中,作者將情感設(shè)計(jì)分為三個(gè)層面。語(yǔ)音交互的優(yōu)勢(shì)是容易讓用戶從本能層面就開始產(chǎn)生舒適、親切的感覺。

目前手機(jī)上常見的情感化設(shè)計(jì),很多是對(duì)內(nèi)容進(jìn)行設(shè)計(jì)加工,從而和用戶產(chǎn)生情感互動(dòng),而不是說(shuō)觸控交互這種形式本身承載了情感。

未來(lái)隨著VR的發(fā)展,也可能有一些其他的想象空間。例如通過(guò)手勢(shì)可以和游戲內(nèi)的角色直接互動(dòng),或者有新一代的手套能給大家更真實(shí)的觸感。

六、隱私性

觸控設(shè)備的喚起通常是物理性的,而語(yǔ)音和手勢(shì)的喚起則比較虛幻,設(shè)備需要一直“聽”或者“看”你是否發(fā)出了指令。

這種對(duì)指令的實(shí)時(shí)監(jiān)測(cè)意味著設(shè)備需要一直接受外界的信息。在這個(gè)過(guò)程中,難免會(huì)采集到一些用戶非常私人的信息,尤其是在家居、車載這樣相對(duì)封閉私密的環(huán)境。

前段時(shí)間有新聞報(bào)道,Google Home會(huì)將用戶的對(duì)話錄音賣給承包商,從中獲得一定利潤(rùn)。

同時(shí),彭博社也在報(bào)道過(guò),Alexa的員工在監(jiān)聽用戶與Alexa的私人對(duì)話,目的是為了對(duì)談話內(nèi)容進(jìn)行人工分析,從而在未來(lái)的使用中提供更準(zhǔn)確的回應(yīng)。在監(jiān)聽期間,甚至有審核員聽到性侵現(xiàn)場(chǎng)后警方報(bào)警的事件發(fā)生。

聯(lián)想到之前的一則社會(huì)新聞,一男子對(duì)妻女使用嚴(yán)重的家庭暴力,而這場(chǎng)暴力之所以會(huì)被公之于眾,居然是因?yàn)橛腥朔欠ㄈ肭至诉@些家用攝像頭看到了這個(gè)場(chǎng)景。

這些犯罪事件是絕對(duì)需要嚴(yán)懲的,可是這些也暴露了信息采集的設(shè)備存在不小的風(fēng)險(xiǎn)。對(duì)于更多遵紀(jì)守法的人而言,生活被無(wú)時(shí)無(wú)刻地監(jiān)控,也是一件非常可怕的事情。

觸控的隱私性則相對(duì)好很多。雖然各種廠商會(huì)對(duì)用戶瀏覽搜索關(guān)心的內(nèi)容進(jìn)行分析以便更精準(zhǔn)地推送廣告,但是它對(duì)于私人生活的侵入性,則比另外兩種交互方式小不少。

如何讓公眾產(chǎn)生信任,我認(rèn)為也是需要解決的重要問(wèn)題。不論是通過(guò)規(guī)范各項(xiàng)流程,加強(qiáng)保密手段還是優(yōu)化產(chǎn)品喚醒機(jī)制……打消消費(fèi)者的顧慮,也有助于自己產(chǎn)品的推廣。

以上為個(gè)人觀點(diǎn),歡迎一起討論╰(●’?’●)╮。

 

作者:迷思特圓;公眾號(hào):迷思特圓(ID:mryuan55)

本文由 @迷思特圓 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自 Unsplash ,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!