語音交互設計(二):設計流程與方法

2 評論 9910 瀏覽 63 收藏 23 分鐘

本文結合筆者參與的語音交互項目,梳理設計經過,對語音交互的設計流程、設計方法和設計產出做了較為詳細的介紹。

“語音交互設計僅靠書本上的知識是不夠的,在實際項目中,除了要了解需求、目標用戶以外,還要了解語音設計所應用的場景、技術水平、設備配置等,從而有的放矢的展開設計。本文結合參與的項目,將語音交互設計的流程、設計關鍵點以及如何通過設計化解技術限制,和大家進行分享。”

日常設計工作中,大家都會按照一定的設計流程開展工作,通用的流程一般有:探索調研 > 分析聚焦 > 設計策略 > 測試驗證。同樣,這個流程可以復用到語音交互設計中,只是設計對象的媒介和我們產出的設計原型發生了改變,但我們發現問題、解決問題的思路應該是類似且可復用的,尤其是在新的設計領域中,不妨借鑒成熟的方法、流程,確保工作順利開展。具體的設計流程與環節如下圖:

圖1 · 語音交互設計流程

1. 探索調研

1.1 明確需求

筆者所參與的項目是“公司機房服務的工業機器人” 的語音設計,這類產品的功能比家用設備的更為強大,除了語音外,它支持:行走、人臉識別、任務解析、數據采集等,同時場景也更為復雜。首先機房環境聲音嘈雜、環境復雜;它的性質又決定對人員的安全要求極高,需要準確的識別與判斷,這些在了解需求階段是必須明確的環節。

機器人的主要功能就是輔助參觀人員、維修人員、駐場工程師更好的完成機房工作,實現機房業務管理智能化,提高運維管理效率和準確率。那么作為體驗設計方,則是通過各場景、各環節的體驗設計,讓人與機器人、與系統的交互高效、自然、流暢,讓智能化的機房日常運維管理更加完善。

1.2?了解業務場景及目標用戶

在上一篇文章中對主要的五種場景(智能家居、車載駕駛、企業應用、醫療、教育)分別進行了介紹。不同的場景,意味著用戶不同的需求和目的,對語音交互的要求也不相同。下面就針對機房環境進行場景分析與設計難點的介紹。

圖2 · 機器人功能及場景特征

1.2.1?工作場景

恒定噪音:作為機房服務場景的語音機器人,使用環境聲音的嘈雜首先會影響語音錄入的準確性。語音交互包含三個重要部分:自然語音識別、自然語音理解、自然語音生成,? 因此解決設備“聽”清楚的問題,關系到后續流程能否順利展開。這里就需要依靠“設備技術”來解決,通過優化聽筒的降噪能力,盡量過濾掉噪音。

環境復雜:機房中機柜眾多,服務器高低不一、設備管線錯綜復雜,如圖3:這給機器人的正常作業帶來挑戰,尤其是這種對安全性和準確性要求很高的場景。首先,機房包間中的環境光線影響機器人對人臉的識別和機柜數據的讀??;其次,機柜中服務器位置高低不同,機器人需要不斷調整攝像頭的角度,以確保采集到完整信息,也可能存在視野死角導致無法全部讀取。這一部分,則需要通過不斷的測試與調整,提高機器人自身性能,使其更好的適應現場環境,具有設備、網絡線纜的識別能力,減少不必要的“人為”破壞,增加人臉、數據識別的準確性。

圖3 · 一般的機房環境

空間局促:在機房中機柜之間的空間不大,過道也比較狹窄,這給機器人行走帶來一定影響。第一:行走速度不能過快,由于機器人自重150斤,走路太快會有慣性,有可能出現不小心撞到機柜的情況;第二:很多時候無法和人并行走路,這導致人機互動體驗不好,再加上機器人本身走的慢,很有可能出現“人走在前面,遮擋住機器人視線”的問題。為此,在設計語音時,只要機器人感應到有遮擋,便會播報:“我好像被擋住了,請保持前方通暢”,以此來友善的提醒用戶,減少這種封閉環境下用戶的不適應。

1.2.2 目標用戶

通過團隊的調研,收集到在整個數據中心有5類用戶,其中會進入機房與機器人直接發生交互的主要有三類:訪客、廠商、數據中心駐場,如圖4。圖中是這三類用戶的工作內容與場景接觸點,確認目標用戶,便于設計對后續用戶調研的聚焦與體驗地圖的梳理。

圖4 · 用戶分析

1.3 技術水平

1.3.1?硬件

硬件來說,目前的語音產品包括:純語音(天貓精靈)和語音及界面結合(iphone的siri)兩種配置。在設計之初,我們需要了解語音產品的基本硬件配置,這其中也包括麥克風、攝像頭、聽筒、設備聯網程度等,因為,產品的配置會影響我們后期的設計策略與體驗。例如問語音產品:“世界十大旅游勝地都是哪些?、中國56個名族都有什么?”,即便語音助手可以準確的告訴我們答案,但無疑是一個沉重的認知與記憶負擔,如果配合屏幕來顯示,情況會好很多。最好的人機交互形式是混合型的,即GUI+VUI(圖像交互+語音交互)如圖echo show,如果你所設計的是純語音產品,那么在設計時則需要考慮更多的引導、容錯、提示等。

圖5 · 亞馬遜Echo Show

本次項目中所涉及的機器人不帶顯示屏幕,并且語音不聯網,這就意味著所有對話都需要提前預設好,設計師需要根據可能出現的情況,將對話內容完善,并且做必要引導,讓用戶按照系統期望的流程進行,確保工作順利、安全的開展。如下圖:

在設計時,對于較長對話,在內容中加入“如果沒聽清楚,請回復我‘重復一遍’〞的提示,避免用戶沒有聽清而錯過信息;同時對于用戶的回答,也給予答案提示,“維修結束時請回復我‘維修結束’ 〞通過設計去盡量規避機器人硬件的缺陷,減少“答非所問”的錯誤發生率和用戶回答的發散,提高語音交互流程的順暢。

圖6 ·?語音交互引導示例

1.3.2?算法

算法方面,則需要通過機器“深度學習”,不斷完善語音識別、語音理解及語音合成的水平。目前,語音識別方面還面臨很多技術挑戰,如:

(1)?噪音

恒定噪音(公路上、機房中)?和突發噪音(突然異常大聲)。

(2)多人講話:

多人講話,設備能否識別其中一條信息;同樣多設備時,如何辨別自己的主人在說話。

(3)兒童:

兒童說話邏輯性較弱,容易出現口吃、長時間停頓等現象。

(4)短句:

“是”、“不”這種短句提供的數據信息較少,會造成識別率低。

(5)多音字:

比如人名,同樣的音會有多種書寫文字“清”“輕”,會影響語音識別的準確性。

更多關于機器人“深度學習”的內容大家可以自行了解,這里不展開討論。

2. 分析聚焦

具體在分析聚焦階段,設計的思路是:用戶調研?>?聚類分析?>?角色建模?>?體驗設計。圍繞與機器人相關的機房工作人員,提升他們在工作中的服務體驗,確保順暢、安全、高效的工作流程。

圖7 ·?用戶分析

2.1 用戶畫像

針對第一章節中定位的三類用戶,我們通過問卷,進?用戶訪談,旨在了解各個不同角?的用戶他們工作的內容、需求,以及有哪些痛點可以抽取出來由機器人替代,從而優化各角色的服務體驗。

圖8 ·?用戶問卷設計

共計訪問10位用戶,包含各個角色。訪問之后,我們對用戶訪談的結果進行整理,整理維度有:日常工作描述、工作中的需求與期望、對機器人工作融入的暢想與擔心。在此基礎上,完成用戶角色建模,通過各類角色的工作內容、痛點、情景設定、工作評分這四個主要方向進行描述與呈現,以駐場工程師為例,具體的用戶角色卡如下圖所示:

圖9 ·?用戶角色信息卡–駐場

最終根據用戶畫像和調研中收集的問題進行聚類分析,集中梳理與歸類,得到用戶訴求,即對機器人應用場景下的機房服務的“服務主張”,圍繞“安全”“規范”“高效”三個方面。這三個機房服務的體驗目標,也是作為后續機器人語音設計所要達到的基本要求。

圖10 · 機房服務主張

2.2 體驗地圖

與機器人交互的環節涉及到線上、線下,從線上任務的提交到線下與機器人真實交互,再到過程中機器人收集信息的回傳,整個閉環鏈路構成機房機器人服務體驗的核心。以其中導覽場景為例,介紹整體流程,線上的主要觸點:任務申請?>?任務生成?>?任務確認?>?任務存檔;線下的主要觸點:任務下發?>?機器人喚醒及用戶身份驗證?>?任務執行?>?任務結束,具體的觸點詳情及語音流程見下圖:

圖11 · 機器人服務體驗流程

經過體驗地圖的梳理與流程規劃,去構建合理、有序的流程,在任務執行過程中保證人機交互“自然、親切、可靠”的體驗,同時配合技術優化,完善機器人語音交互的豐富度,在語音交互設計中也會利用適當的引導與必要的提示,以更自然的方式消除異常時的尷尬,快速做到工作銜接。

3. 設計策略

3.1 定義角色人格

VUI產品是一個虛擬的人與用戶直接溝通,因此,溝通對象的語氣風格、性格等則是用戶接觸的第一感受,為了提升真實性,定義一個符合自己產品調性的角色至關重要,也是著手真正語音設計的第一步。

這里的角色,是通過應用程序的語音及語言選擇,塑造一個符合品牌服務特征,并且具有人格或心理的形象【1】。角色人格包含:

  • 公司所傳達的態度
  • 產品的個性特征
  • 期望別人如何看待它

在本次項目中,筆者在開始設計時,也先對機器人的語音調性和語氣風格做了定義,根據語音交互場景和機器人的功能特性,語氣規范追求的是:篤定、尊重、正式、親切的感受,既讓用戶感受到機器人工作的嚴謹性與安全性,又讓整個服務體驗兼具友善、和諧與溫度。

圖12 · 機器人語音調性與語氣規范

以“篤定”為例,表達語氣的說明和示例,通過語氣規范,統一整個語音交互原型的調性。

圖13 · 語氣規范示例

在設計時,我們可以用“真實的人物”來定義聲音特征與溝通基調,分析、了解真實人物模型的個性特征。例如兒童早教類語音產品,可以以大家熟知的“金龜子”為人格原型進行定義,溝通中模仿她的語氣、用詞,讓兒童感到親切并符合服務對象的特征喜好。同時,我們需要設定“期望人們如何看待我們的語音產品”,傳達怎樣的服務理念。

圖14 · 人物模型

但這里值得注意的是,現在很多語音助手支持語音選擇,如男聲、女聲、少年等。我們要知道,“改變聲音的同時,就意味著換了不同的人格”,他們的語音交互特征、形式等應該發生相應變化。同樣一句很可愛、很活潑的話,小孩說合適,但如果換到“成熟男士”,多少會有些不合時宜。

圖15 · 人物語氣的多種性格

3.2?語音交互設計

語音設計的原型更像是“劇本設計”,需要考慮在哪個場景下,包含什么角色、他們如何對話、如何過度銜接、具體的語言如何等,如下圖就是在此次項目中輸出的語音設計原型,具體內容涉及到信息隱私,這里就不展開了,但是整個語音交互腳本中,對場景、角色、對話腳本備注圖例、腳本正文等都做了明確定義與設計,后面就圍繞如何做好交互引導、反饋、異常處理這四個方面進行介紹。

圖16 · 語音交互腳本原型

3.2.1 語音交互引導

在設計語音腳本內容時,需要特別考慮VUI與人對話過程的語言銜接、對話內容的順暢,并且能夠自然的完成設想的任務。例如當詢問用戶信息時,最好給出一些示例,而不是說明。以下兩句話大家可以明顯感受到體驗的差異,對于用戶來說,參照示例填寫信息,比理解一個通用指令更加容易。

  • “請告訴我你的出生日期,如2017年12月12日”
  • “請告訴我你的出生日期,包括年月日”

3.2.2?語音交互反饋

在GUI界面中,“確認反饋”隨處可見,點擊一個按鈕、進行一個編輯操作,我們會設計不同重要程度的交互反饋;在VUI中,同樣有不同程度的“確認反饋”,本文主要將他們分為三種:顯性確認、隱形確認、視覺確認。

圖17 · 語音交互反饋

3.2.3?語音交互異常處理

語音可能存在的異常情況主要有以下四種:

  • 未檢測到語音 (明確告訴用戶“我沒聽清”)
  • 檢測到語音,但沒有識別(“我不明白你的意思”)
  • 語音被正確識別,但系統無法處理(“出現異?!保?/li>
  • 部分語音識別錯誤(答非所問)

在設計中,我們可以按照不同的異常情況,設計多種播報腳本,提高產品容錯性,緩解異常時候的尷尬,在此例舉些常見的用戶語音輸入錯誤的回答,如圖18。

圖18 · 用戶輸入錯誤時的回答

4. 測試驗證

4.1 語音設計原型測試

以項目中團隊采用的兩種腳本測試方式為例,分別是:劇本朗讀和語音轉換工具。通過劇本朗讀,體驗對話的流暢程度,確認是否存在對話呆板、重復、不自然的情況;通過文字轉語音工具,如QQ語音轉化,可以較真實的感受機器將對話說出來的效果。

圖19 · 語音設計原型測試

4.2 語音及設備測試調優

設計交付后,功能開發完成,進入語音設備可運行階段,這時系統具備測試功能。測試調優的方法同樣給大家列舉兩個:一是可以通過開發、設計人員,進行實際人機測試,了解語音功能是否穩定、任務完成率如何、整個體驗流程是否自然順暢;二是可以通過用戶觀察的方法進行調研,找到符合特征的目標測試用戶,利用機房的監控攝像頭,觀察“自然狀態下”的用戶如何工作,這樣不會干擾用戶,更貼近真實的使用情景。

圖20 · 人機使用測試

5. 總結

以上是筆者首次接觸語音交互設計的設計經過,對VUI設計中的知識點、流程、方法進行的總結,仍有很多不全面之處,后續隨著項目的迭代和設計的深入,逐步去完善體驗,總結沉淀。

【1】參考書籍:《語音用戶界面設計》 Cathy Pearl (著)王一行(譯)

相關閱讀

語音交互設計(一):VUI發展及特征

 

作者:晏菲(史慧婷),阿里巴巴交互設計師

來源:微信公眾號“TXD技術體驗設計(ID:TXD-UED)”

本文由 @TXD技術體驗設計 授權發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來源于網絡

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 我在關注ai,來占個沙發

    回復