舉例說明語音交互設計的基本原則
本篇文章作者通過舉例的方式,總結了語音交互設計的十二個基本原則,希望對有需要的小伙伴們有所幫助!
在智能音箱的技能制作中,最重要的就是語音交互(voice interactive )模型了,語音交互就是將人的語言轉換成應用的action(面向系統的動作)的模式,也就是VUI(Voice UI),我們之前談論手機APP的UI更多意義上是GUI(Graphic UI),而要做好VUI的交互和GUI一樣,都對于細節提出了更多更高的要求。
亞馬遜的VUI設計師Amdrew ku就說過:“人類對于聲音的敏感是超出很多人的想象的。”
在制作技能中,首先要明確的就是你的技能能做什么,然后根據這個點來預測用戶可能的表述,再把相關的表述對應到意圖(intent)。
基本上,用戶的表述可以分為三類:完整的意圖、不完整的意圖和無意圖。
當用戶明確表達了完整了意圖的時候就應該去完成意圖相應的任務,比如:
用戶:“現在幾點了”
智能音箱:“現在是晚上9點41分”
在這個對話(session)中,意圖是完全明確的,所以只要執行意圖回復信息即可。而遇到的用戶的意圖是完整的,就需要去引導用戶補充,比如:
用戶:“我想查一下明晚的航班”
智能音箱:“請問你想查去什么地方的航班?”
另外,當用戶的表述超出模型的時候,還要提供必要的幫助,比如:
用戶:“這個游戲我不會玩”
智能音箱:“在本游戲中你可以與好友進行成語接龍,只需要對我說一個你想到的成語?!?/p>
只有區分了不同的意圖,音箱才能有區分的進行反饋,把用戶“引到”使用路徑上來。在區分意圖之后,設計者還應該注意在設計語音交互模型時的一些基本原則,這些原則基本來源于alexa平臺上對于skill制作的經驗,也包括一些國內AI平臺在這方面的總結,如下:
原則一:讓用戶明白他是不是需要回答,如需要回答,最好使用疑問句。
【正確示例】
音箱:有三個車,紅車、黃車、綠車,你要選哪個?
【反面示例】
音箱:你可以從下面的三個選項中選一個,分別是紅車、黃車、綠車。
原則二:不要假定用戶知道該怎么做,要引導用戶。
【正確示例】
音箱:歡迎進入滴滴打車,你可以嘗試對我說“打個出租車”。
【反面示例】
音箱:歡迎進入滴滴打車。
原則三:向用戶提問時,不要摸棱兩可。
【正面示例】
音箱:你要沙拉還是漢堡?
用戶:漢堡
【反面示例】
音箱:還要再來點沙拉或者漢堡嗎?
用戶:…….
原則四:簡潔
用戶:我的星座運勢如何?
【正面示例】
音箱:你的星座是什么
【反面示例】
音箱:有12個星座可以選擇,分別是雙子座、金牛座….你要選哪個?
原則五:不要給用戶太多選擇(最好不要超過三個)
用戶:我想點奶昔。
【正面示例】
音箱:巧克力口味,草莓口味,香草口味,你要選哪個?
【反面示例】
音箱:巧克力口味,草莓口味,香草口味,可可口味,抹茶口味,你要選哪個?
原則六:復雜的技能(skill)多提供幫助指引。
一個技能(skill)能超過滿足三個需求就算很復雜了,如果是相對獨立的功能最好拆分成三個技能。如果用戶在技能使用流程中卡住,就需要幫助了,通常的做法是把功能列表讀給他,讓他知道技能可以做什么。
原則七:不問沒必要的問題
用戶:打開可可笑話
【正面示例】
音箱:一條警犬看到馬路上過來一條普通狗,就氣勢兇兇地跑去質問它:我是警犬,你是什么東西?普通狗不屑一顧地看看它說:看清楚點,老子是便衣。
【反面示例】
音箱:你想聽笑話嗎?
原則八:必要時和用戶再次確認
當用戶的命令涉及到某些方面操作,應該通過語音進行二次確認。
比如:用戶公開的動作(分享到社交網絡)、影響他人的命令(給別人發信息)和錢相關的操作(下單)。
原則九:讓用戶明白他的狀態、目前在技能流程中的位置。
【正面示例】
音箱:你成功訂了咖啡,下次再見。
【反面示例】
音箱:你成功的訂了咖啡。
原則十:選項太多的時候需要分幾部分播報。
用戶:附近有什么電影院嗎?
【正面示例】
音箱:最近的是XXX電影院,在山東路,還要聽其他較近的影院信息嗎?
【反面示例】
音箱:最近的是XXX電影院,在山東路,第二近的XXXX電影院在YYYY路,第三近的是…..
原則十一:TTS要口語化。
【正面示例】
音箱:北京國安戰勝了上海申花,比分是2比1。
【反面示例】
音箱:北京國安2:1上海申花
原則十二:用戶卡住的時候可以退出。
用戶:滴滴打車有什么功能?
【正面示例】
音箱:用滴滴打車1 XXX 2 XXX 3 XXXX 如果想退出的話可以說“結束”
【正面示例】
音箱:用滴滴打車1 XXX 2 XXX 3 XXXX
利用這些原則規范化設計后的技能更容易被用戶了解和使用和喜愛。
當然這些原則還應該根據技能和AI平臺的場景、風格進行調整,只有技能可以進行良好的交互,技能才能更快更好的服務用戶。
本文由 @maoChuan 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
最近在做這個汽車語音交互,太難了 ??
嗯?
認真的看完了,有一點感悟可能比較深刻,大致是“替用戶做選擇”,現在的都市人都喜歡簡潔、高效的溝通,且大部分人都有選擇困難癥,而且都極其沒有耐心,在真的需要幫助的場景下,說話的方式確實值得我們深思,如何能有效的傳達、簡明的讓對方獲取信息,反而成了一個難點,文章中舉的例子,有些還挺實用,比如:我想要什么東本西,語音會高效的給出為數不多的選擇項,而不是將所有的備選項都一一列出