中文亚洲av片在线观看不卡,亚洲一区二区三区国产精品无码,精品久久亚洲中文无码

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

語音交互中的“等待體驗”研究

Du Design

2018-11-05

7 評論 9736 瀏覽 71 收藏

14 分鐘

“等待體驗”處于整個體驗循環(huán)鏈的中間環(huán)節(jié)，在語音交互體驗中起到了承上啟下的重要作用。但是，關(guān)于語音交互中的“等待體驗”在行業(yè)尚未被系統(tǒng)的研究，依舊處于模糊狀態(tài)。

回顧人機交互發(fā)展史，人類先后經(jīng)歷了基于命令行的CLI 時代，基于鼠標(biāo)鍵盤的GUI時代，基于觸摸的初級NUI時代。后面每一個階段比前一個階段更自然，學(xué)習(xí)成本更低，綜合效率更高。

進入AI時代，人工智能給機器帶來三種能力：感知能力、認(rèn)知能力、自然語言輸出能力。

感知能力使機器能聽得懂人類語言，認(rèn)知能力使機器能思考如何回答人類問題，自然語言輸出能力使機器可以像人類一樣表達(dá)——三種能力的綜合運用將人機交互帶入語音交互階段。語音交互是最自然的人機交互方式，它極大地降低了人們與機器交互時的學(xué)習(xí)成本，將人機交互綜合效率帶上新的臺階，已成為非常重要的人機交互方式。

一、“等待體驗”：語音交互體驗的三分之一

生活中人與人的對話場景，對話是由“向?qū)Ψ秸f出一句話”、“等待對方回復(fù)”、“對方給出回復(fù)”三個階段不斷循環(huán)構(gòu)成。

其中“等待對方回復(fù)”是對話體驗的“三分之一”，會對回復(fù)的滿意度造成直接影響。在等待回復(fù)階段，如果對方處于認(rèn)真思考的狀態(tài)，會讓我們覺得被重視；然而，如果在等待過程中對方的注意力不在對話本身，即便對方給出的回復(fù)再好，我們也會心存疑慮。

對應(yīng)到人機語音交互中的三個部分——“輸入體驗”、“等待體驗”、“回復(fù)體驗”，“等待體驗”同樣處于整個體驗循環(huán)鏈的中間環(huán)節(jié)，在語音交互體驗中起到了承上啟下的重要作用。但是，關(guān)于語音交互中的“等待體驗”在行業(yè)尚未被系統(tǒng)的研究，依舊處于模糊狀態(tài)。

1. 響應(yīng)時間一定是越短越好嗎？

數(shù)字性能管理平臺Dynatrace對用戶瀏覽網(wǎng)頁的行為進行了研究，發(fā)現(xiàn)當(dāng)網(wǎng)頁加載速度提升0.5秒，可促進用戶在網(wǎng)站的行為轉(zhuǎn)化核心數(shù)據(jù)提升10%。因此，在網(wǎng)頁設(shè)計和App設(shè)計中，盡量縮短等待時間是產(chǎn)品設(shè)計的不懈追求。

不同于基于視覺的交互，語音交互天然附帶情感屬性。然而，情感的體驗是復(fù)雜的，它不只受效率這個單一變量的控制。大多數(shù)情況下，在生活中人與人對話時，一個過快的回答會給用戶帶來輕浮感和搶話感，而一個過慢的回答會給用戶帶來遲緩感和愚鈍感。

那么，在語音交互中，究竟什么樣的響應(yīng)時間能有最佳的體驗?zāi)?？響?yīng)時間的體驗趨勢是怎樣的呢？

2. 等待體驗受哪些變量的影響？

在視覺設(shè)計領(lǐng)域，當(dāng)設(shè)計頁面的loading態(tài)時，為降低用戶的跳出率，設(shè)計師時常會通過給出進度條，或采用趣味性的情感化設(shè)計來消除用戶的不安情緒。

但是在語音交互領(lǐng)域，語音的承載體是無形的，或不確定形態(tài)的，我們甚至沒有承載loading態(tài)的界面。在這種情況下等待體驗又受哪些變量影響呢？影響的程度怎樣呢？

綜上，可以說在語音交互領(lǐng)域，等待體驗雖然重要，但目前仍是“一團迷霧”。鑒于此，我們以目前語音交互的主要載體——智能音箱產(chǎn)品為例，對AI產(chǎn)品中的等待體驗問題進行專題研究。

二、智能音箱的等待體驗研究

目前的智能音箱，主要采用先語音喚醒后輸入指令的語音交互流程。鑒于此，我們可以將智能音箱的使用過程分為兩個主要階段：

喚醒階段：用戶通過指定的喚醒詞將音箱從等待態(tài)轉(zhuǎn)換為就緒態(tài)，音箱被喚醒后才可以接收用戶的語音指令。
用戶請求及反饋階段：用戶給出語音指令內(nèi)容以及智能音箱反饋結(jié)果滿足用戶的需求。

針對這兩個階段，我們先后通過以下三個實驗進行研究。

實驗一：喚醒階段的響應(yīng)時間對等待體驗的影響；
實驗二：用戶請求及反饋階段的響應(yīng)時間對等待體驗的影響；
實驗三：視覺、聲音等不同反饋方式對等待體驗的影響。

下面我們對每個實驗的結(jié)論進行逐一詳述：

實驗一：喚醒階段的響應(yīng)時間對等待體驗的影響

為了全面考察喚醒階段各種因素對等待體驗的影響，在實驗中，我們?yōu)橛脩籼峁┝瞬煌瑔拘秧憫?yīng)時間和不同喚醒反饋方式的智能音箱。用戶完成實驗任務(wù)后，需要對音箱的喚醒響應(yīng)速度進行評價（5點量表：太快了，接受不了；有點快，能夠接受；剛剛好；有點慢，能夠接受；太慢了，接受不了）。

實驗一的結(jié)果表明最佳的喚醒響應(yīng)時間與喚醒反饋方式有關(guān)，不同喚醒反饋方式下，最佳響應(yīng)時間不同：

當(dāng)喚醒反饋為”燈光”反饋時，喚醒響應(yīng)速度越快越好，在200ms時，用戶響應(yīng)舒適度最高（對響應(yīng)時間評價為剛剛好的用戶比例），73%的用戶對速度滿意。
當(dāng)喚醒反饋為”燈光+音效”時，喚醒響應(yīng)速度的舒適時間為300ms左右，76%的用戶對速度滿意。
當(dāng)喚醒反饋為”燈光+人聲”時，喚醒響應(yīng)速度的舒適時間為500ms左右，74%的用戶對速度滿意。

（注意：本次實驗設(shè)置了市面上主流的三種喚醒反饋方式：燈光、燈光+音效、燈光+人聲，以給不同反饋情況的響應(yīng)時間感受作參考，但對最優(yōu)反饋方式，除了響應(yīng)時間還受其他因素影響，將另著篇章探討。）

實驗二：用戶請求及反饋階段響應(yīng)時間對等待體驗的影響

由于用戶請求及反饋階段的響應(yīng)在技術(shù)實現(xiàn)和用戶預(yù)期上，與喚醒階段的響應(yīng)存在差異，因此我們通過第二個實驗對用戶請求及反饋階段的最佳響應(yīng)時間范圍進行研究。在實驗中，我們?yōu)橛脩籼峁┝瞬煌憫?yīng)時間設(shè)置的智能音箱。

實驗二的主要研究發(fā)現(xiàn)：

1250ms以內(nèi)是用戶認(rèn)為響應(yīng)速度較優(yōu)的區(qū)間，其中650ms為最佳體驗值。在450ms時，少量用戶覺得響應(yīng)速度太快了，用戶會感覺到緊迫感和壓力，難以接受。
在1450ms時，有53%的用戶開始感覺響應(yīng)有延時，但仍能夠接受。
從2150ms開始，有20%的用戶認(rèn)為音箱響應(yīng)太慢，不能夠接受。我們認(rèn)為20%的用戶不滿意，已經(jīng)不足以被稱為一個優(yōu)秀的產(chǎn)品。

實驗三：視覺、聲音等不同反饋方式對等待體驗的影響

由于目前市場上的智能音箱在請求反饋階段的響應(yīng)時間普遍在1.5秒以上，并沒有達(dá)到實驗二研究的理想響應(yīng)區(qū)間。因此，我們通過實驗三進一步研究反饋方式設(shè)計對用戶響應(yīng)速度感知的影響，我們?yōu)橛脩籼峁┝宋褰M具有不同反饋方式設(shè)計的方案。

在實驗三的五組方案中，每組方案分別進行了不同響應(yīng)時間設(shè)置。

實驗三的主要研究發(fā)現(xiàn)，不同反饋方式設(shè)計會影響人們對音箱響應(yīng)速度的感知：

1）1250ms以內(nèi)，方案D感受較差，人聲反饋會產(chǎn)生搶話的感受，部分用戶認(rèn)為音箱響應(yīng)太快。

2）1350ms到2150ms，方案D、E感知舒適的用戶比例較高，加入人聲/音效后，如方案D的語音應(yīng)答“好的”，有助于緩解用戶延遲感受，提升速度感知體驗。

3）在3150ms及以上的響應(yīng)時間，響應(yīng)方式設(shè)計對緩解延時的作用已經(jīng)不明顯，應(yīng)該盡量避免此類情況發(fā)生。

此外，實驗三還發(fā)現(xiàn)響應(yīng)速度預(yù)期與用戶性別、任務(wù)類型有關(guān)。與男性相比，女性用戶對響應(yīng)時間容忍度更低，她們最長在音箱無反饋時可以容忍的平均響應(yīng)時間長度低于男性，即她們希望在更短的時間內(nèi)得到音箱的響應(yīng)反饋。

與音樂類、問答類等任務(wù)相比，用戶對控制類任務(wù)的響應(yīng)時間容忍度更低，用戶希望在控制類任務(wù)中有更加及時的響應(yīng)反饋。

三、小結(jié)

本文針對語音交互中的等待體驗進行了討論，并以智能音箱為例，重點對喚醒階段和請求反饋階段的響應(yīng)時間和反饋方式進行了人類工效學(xué)實驗研究。

由于實驗設(shè)定的條件和樣本數(shù)量等限制因素，實驗研究結(jié)論可能不能代表所有智能音箱用戶在家居環(huán)境的全部感受，但希望通過我們的研究和探索，可以指導(dǎo)人工智能語音對話產(chǎn)品響應(yīng)時間和反饋方式的設(shè)計，幫助打造自然和極致的語音對話體驗。

本文由 @?AIID（百度）原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載

題圖來自 Pixabay，基于 CC0 協(xié)議

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

Du Design

39篇作品 285081總閱讀量

SRM | 采購業(yè)務(wù)管理之訂單協(xié)同設(shè)計

10-234015 瀏覽

想做好品質(zhì)外賣，抖音不能只靠流量

07-053004 瀏覽

被出售的出海App，將海外公司養(yǎng)到全球非游廠商收入Top10？

07-143312 瀏覽

“蹭老式”消費爆火，讓年輕人少走50年彎路？

11-243315 瀏覽

AI技術(shù)如何為傳統(tǒng)職業(yè)者帶來職業(yè)生涯的第二春？

10-192768 瀏覽

評論

想去鵝城

命令行時代是以計算機為載體，鼠標(biāo)是以電腦為載體，觸摸是以手機為載體，那么語音是以什么為載體呢

最近來自廣東回復(fù)
With ur

只看結(jié)果。 ??

最近來自四川回復(fù)
小森

討論交互模型只能說以什么為主，現(xiàn)在的交互模型幾乎都是感官集合的，例如現(xiàn)在的觸摸

最近回復(fù)
1. 小森回復(fù)小森
  
  好吧沒說完發(fā)表了，找不到地方刪，例如里面提到的觸摸交互，那也是觸覺和視覺集合，在一些游戲里面甚至有聽覺。語音也同樣，即使是沒有屏幕的智能音箱，有指示燈的存在那也是一種視覺交互形式。個人看法，希望作者能表述更精準(zhǔn)，不是語音交互，是語音為主的交互形式
  
  最近回復(fù)
2. 小森回復(fù)小森
  
  ??我覺得我表述的可能不太準(zhǔn)確，不能說視覺交互，畢竟不是眼動儀。但是總的來說語音交互確實不能說是最自然的交互形式，如果從人類的感知方面來說自然的交互真的是一種multi-modality。多感官的輸入和輸出能幫助我們更連貫的感知。最近剛好在做這方面課題，看到作者寫的很詳細(xì)，但是覺得避開其他形式單一探討一種應(yīng)該表述更精準(zhǔn)，但是我自己了解還不夠深入，說的不對多多包涵。
  
  最近回復(fù)
嘉玲小朋友

非常棒，可以看出做了非常充分的準(zhǔn)備！

最近來自江蘇回復(fù)
虞小姐

寫得挺細(xì)的，但可能太細(xì)了，瀏覽者記不住，建議下次可以從一個更廣泛的角度去寫，不同語音設(shè)備的交互干貨，可能更實用 ??

最近來自廣東回復(fù)