語音交互優勢場景產品設計

2 評論 7916 瀏覽 69 收藏 16 分鐘

語音交互逐漸在更多的場景里替代可視化交互,或者賦能可視化交互。上世紀80年代語音交互技術就出現在計算機里了,為什么好像最近幾年才真正走入大眾的生活中?

其實語音交互的發展經歷了三個階段:

  • 第一階段是上世紀80年代,語音交互能夠實現一問一答,但不能理解上下文,不能連續對話。隨著人工智能深度學習算法的發展,計算機語義理解的能力越來越強;
  • 大約在2009年的時候,隨著siri的出現,進入第二階段,能有問有答,能夠理解上下文,但是這種應用場景還不太普及;
  • 第三階段,2014年Amazon Echo的出現,實現了應用的革新,拓展了遠場交互的場景,2017年的時候智能音箱的快速發展才使得語音交互的方式才逐漸走入大眾的視野。

語音交互的技術的實現包括三個環節:聽(ASR)、語義理解(NLP)、和說(TTS)。

  • 聽:把語音識別成文字,用的是ASR技術。
  • 語義理解:把文字輸入轉化為文字輸出。通過語法判斷、上下文理解、關系理解、知識圖譜等技術。就是理解文字的含義后,把想反饋的回答以文字表達出來,使用NLP技術。(把流程和技能歸到這一環節)
  • 說:把文字合成為語音,用的是TTS技術。

相比于成熟的可視化交互,語音交互的場景還有許多可以挖掘的方面。相比于可視化的交互,哪些場景下人們更傾向于語音交互呢?

本文從不同語音交互動機進行分析,探討一下語音交互的產品設計。

首先,語音交互的場景很多,在不同的場景下,人們使用語音交互的動機大致可以歸納為以下四種:

  • 更快:省去信息填寫、省去界面操作等;
  • 更輕便:更輕的硬件攜帶成本;
  • 學習成本更低:相比可視化更貼合用戶使用習慣;
  • 被動信息獲取成本更低:信息觸達用戶的方式更高效。

以下詳細分析一下這四種動機的場景和產品設計。

更快

語音交互主要使用動機之一是快??梢暬换グ言S多復雜的業務縮短到了幾分鐘以內,而語音交互進一步把幾分鐘的流程縮短為秒的級別,因為人說一句話大概也就3-20秒吧。

這也是語音交互在應用中的主要優勢,場景舉例:

小N感覺身體有點不舒服,想去醫院看一下,打算先預約掛號。

方案一:在手機上找到預約的app,按流程進行預約。找到想去的醫院、選擇科室、選擇日期、選擇或輸入自己的醫??ǖ刃畔?,然后確認掛號預約并支付。

方案二:對語?助?說,“?愛同學,幫我預約某某醫院后天上午內科的普通掛號”,語?助?完成任務后,回復“已預約后天上午某某醫院的內科的普通掛號,請在?機上確認?付?!?/p>

在這個場景中,圖形界面流程與語?流程的對?:

很明顯,AI的語義理解能力把“查找和選擇”的行為高效地代勞了,原本界面操作要花去5-10分鐘的事情,語音交互用幾十秒完成了。哪些情況下語音交互能體現出這種高效性?在用戶熟悉、高頻、復雜流程的場景中能體現,比如 點餐、購物、出行等。

語音交互的快速性還會在以下幾個方面中體現出來:

數據存儲

語音的信息錄入門檻高,所以從效率自然發展的角度來說,要么減少錄入次數,要么加速錄入過程。因為“更快”這種動機容易出現在高頻場景,所以比起加速錄入,減少錄入次數是更明智的選擇。

既然要減少錄入次數,那么信息就必須錄入后存儲起來,所以語音交互的用戶信息存儲量有增大的趨勢。而且隨著用戶信息存儲量的增加,語音交互的效率提升會越來越明顯,“快”的優勢就會發揮出來。所以,數據存儲在用戶語音交互“更快”上會發揮重要作用。

聲紋識別無縫登錄

聲紋識別技術的應用也是語音交互“快”的重要環節。聲紋識別就是以聲識人,準確率高達99.7%,已經應用在一些考勤、門禁系統中。這種技術用在登錄上,相比可視化的登錄方式,是比“一鍵登錄”還要快的登錄方式。因為登錄過程,用戶可以完全無感知地完成,一句喚醒詞就能識別出身份,很多的授權流程就直接完成了。

多輪對話

多輪對話也是語音快速性的重要環節。上述醫院預約的場景中雖然流程看起來很短,但一句話完成的交互,在實際中大概率會引起多輪對話。引起多輪對話的原因有可能是信息更改,也有可能是信息補充。比如醫院掛號會需要選擇主治醫師,或者當天的時間約滿了需要改時間等等。

總的來說,多輪對話這種交互方式,在快速性上會從以下幾個方面發揮優勢:

(1)快速修正

語音對話要修正某個信息,可以保證其他信息不改變。比如上面醫院的例子中,用戶選擇了醫院、科室、時間。如果用戶想修改科室,在圖形界面中需要返回到上一步,然后更改科室,重新選擇時間。但語音交互改了科室,不用重新選時間。

流程對比如下:

所以,流程越長語音交互節約的重復操作越多,優勢越明顯。

(2)智能匹配

語音對話中,語音的智能匹配推薦也是幫助用戶節省流程中重復選擇的時間。比如剛才醫院那個場景中,如果用戶要更改醫院,但是另一家醫院沒有相同名字的門診,比如有的醫院沒有呼吸科,只有普通內科。用戶想更換一家醫院的時候,如果沒有直接對應的相同的科室,語音助手可以智能推薦同類的科室,用戶無需重新比對和搜索。就像這樣:

如上所示,語音智能匹配可以省略很多重復的流程。更深一些的智能性,比如智能分診,不僅僅選擇相似的,甚至直接可以根據用戶對病情的描述,分析用戶的病情推薦最匹配的門診。隨著語音技術的發展,智能匹配推薦在語音交互中可以應用地無處不在,會極大加速語音交互的效率。

(3)中斷銜接

智能語音對上下文理解的能力,使得語音交互在對話中斷后,也可以直接地銜接上,避免重復走流程。比如:

?N:”?愛同學,幫我預約某某醫院明天上午內科的普通掛號?!?/p>

語音助手:“某某醫院明天上午內科已約滿,后天上午可預約,要為你預約后天上午嗎?”
小N:“我想聽首歌。(用戶中斷了預約的對話)”
語音助手:“好的,一起來聽音樂?!保ㄒ魳讽懫穑?br /> 小N:“剛剛醫院預約改為上午吧?!保ㄓ脩翥暯由蠈υ挘?br /> 語音助手:(搜索剛才的對話記憶,以及用戶信息)“好的,已預約后天上午某某醫院的內科的普通掛號,請在手機上確認支付?!?/p>

總的來說,語音交互在高頻、復雜業務流程的場景中,相比圖形化交互,在快速性上還是有很多優勢的。

更輕便

第二個語音交互動機是輕便性。在某些場景中,語音交互的方式可以免去許多額外的設備,比如:

小P是AAA公司的員工,今天要給部門開會,開會前將ppt上傳到了云端。公司的語音系統存儲了所有員工的聲紋信息,小P在會議室時,對語音助手說,“小度,打開投影儀,打開人工智能調研PPT”,語音助手打開投影儀,查詢到小P的身份,登錄后訪問其云盤數據,打開了PPT。

在上述場景中,無語音交互流程和有語音交互流程對比:

如上所示,有語音交互時,U盤這類存儲設備、PC和一些遙控設備都不需要了,整個過程是非常輕便的。

學習成本更低

第三個語音交互的動機是學習成本更低,換句話說,比可視化交互更貼合用戶使用習慣。場景舉例:

小A剛開始學視頻軟件,但是總是記不住什么功能什么快捷鍵在什么位置?!霸趺床眉魣D片?”“先點擊上方菜單欄?!庇脩酎c擊后一步步引導?!霸趺葱薷念伾??”“點擊屏幕左邊第四個菜單欄….”

上述場景圖形交互與語音交互流程對比:

如上所示,圖形交互來回切換是比較冗余的,而且隨著步驟越多,冗余性越嚴重。所以,語音交互的這種動機主要出現在學習和引導型的應用場景中,比如老年人協助、兒童學習、步行導航等等。語音交互的這個優勢主要在易用性上體現出來。

易用性(智能理解、眼耳配合)

易用性體現的第一個方面是智能理解。當用戶提出疑問,語音助手通過語義理解能夠智能地為用戶匹配教程,比起搜索,語音助手還可以更加智能地判斷用戶在操作時所處在的處境,比如用戶已經選擇了裁剪工具,但是比起方形裁剪工具,更適合用圓形裁剪工具等等,智能語音可以結合上下文和其他信息更綜合地理解用戶的意圖。

易用性的第二個方面是眼耳配合??次恼轮笇Ы坛虝r只用視覺獲取信息,學和做的過程不連貫,語音教程解放用戶雙眼,視覺專注于圖形化界面操作,聽覺接收指導信息,學習過程更加連貫。

其實聽覺接收文字信息的速度肯定是比不上視覺的,那為什么會更好呢?

因為語音教程和圖形界面教程相比,用戶更加專注于眼前的操作,專注度更高,專注度才是學習效率提升的關鍵。也就是說,語音教程其實是幫助用戶創造了更加沉浸式的學習體驗。

被動信息獲取成本更低

第四種使用語音交互的動機是被動信息成本更低,或者說,信息觸達用戶的方式更加高效。場景舉例:

重要提醒,在家里的時候,比如A想設置一個1小時后的重要提醒事項,比起手機提醒,A選擇了用智能音箱提醒。因為相比Push提醒,語音提醒是一種更強的提醒。除了設置起來更簡便外,A怕錯過提醒信息,而喇叭般的音量確保A不會忘記這件事情。

上述場景中,圖形觸達和語音觸達流程:

相比圖形觸達,語音交互把用戶主動獲取的這一環節省了,交互的成本更低。好比快遞打電話讓你到小區門口取和送到你家門口的區別。但是這種觸達方式對環境的私密性有一定要求,公共的場景中突然收到語音提醒并不太符合人的習慣。

總結

本文總結了四種常見的語音交互動機:更快、更輕便、學習成本更低和觸達用戶更加高效。

  • 更快動機,主要適用于高頻、復雜的場景為主,其中多輪對話能力、聲紋識別能力和數據存儲設計可以把語音交互“更快”的優勢發揮出來。
  • 輕便性動機,語音交互可以替代某些控制設備和存儲設備等。
  • 學習成本更低動機,主要通過發揮語音交互在學習型和引導型場景中的易用性。
  • 觸達用戶高效動機,通過降低人機交互的成本來體現優勢。

以上是對語音交互的一點思考,總的來說,語音交互相比圖形交互的優勢還是很明顯的。

 

本文由 @長青 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 家裝

    回復
  2. 學習了《

    回復