亚洲精品综合色区,自拍偷自拍亚洲精品第2页

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

語音交互設計的流程及方法

阿里TXD

2018-07-14

8 評論 30949 瀏覽 169 收藏

20 分鐘

本文結合參與的項目，將語音交互設計的發展、特征、流程、設計方法和大家進行分享。

隨著移動智能終端和云計算的快速發展，人工智能的浪潮正在悄然顛覆著我們生活的點點滴滴，VUI（Voice User Interface，語音用戶界面）作為一個新的領域也在快速發展，并對用戶體驗提出了更多關于語言學、情感塑造、邏輯搭建等方面的新要求。

本文結合參與的項目，將語音交互設計的發展、特征、流程、設計方法和大家進行分享。

一、VUI的發展

那么首先來說一下，在原有 GUI（Graphical User Interface，圖形用戶界面）如此豐富的情況下，為什么要新增加一種交互方式呢？

它們兩者之間最大的差異就是：輸入方式不同。

最顯著特性就是「解放了雙手」，在獲取我們關注的信息時，可以用最自然的語言進行溝通，眼睛和手可以同時處理其他的事情。

1. VUI的第一個時期

20世紀90年代，誕生了第一個可行的、非特定的（每個人都可以對他說話）的語音識別系統，交互式語音應答（Interactive Voice Response，IVR）系統的出現代表了 VUI 的第一個重要時期。

人通過電話線路進行交互并執行任務，如機票預訂、銀行轉帳、業務查詢等。相信大家都用12306電話訂票訂過火車票，我們通過輸入數字命令，與系統進行語音交互。

它的主要特點如下：

優點：擅長識別和播報長字符。
缺點：用戶很少有機會暫停系統，系統占主動地位。

回想一下那個過程，我們必須不斷地與系統進行交互，如果中間出現錯誤，只能掛斷重來，因此整個交互過程會容易讓用戶處在謹慎、局促的狀態下。

2. VUI的第二個時期

我們現在所處第二時期的初期，目前很多像 siri、Google 這類集成了視覺和語音信息的 APP，以及 Amazon Echo 這類純語音的設計產品，逐步發展并成為主流。

二、VUI與GUI相比的優勢與劣勢

以目前我們TXD團隊沉淀的 GUI 設計原則為檢驗標準，進行橫向切割，縱向對比 VUI 的優勢劣勢。

1. 主要的優勢

2. 主要的劣勢

因此，通過對比我們發現：GUI 在清晰、高效、通用方面更具優勢，這也恰恰是人們獲取信息的關鍵，能夠準確給用戶提供幫助，且具有很好的延展性和通用性，相對于「一問一答」點狀獲取信息的方式，更為高效。

VUI 則是設計所要追求的一種最自然、最親切的交互方式，是「帶有情感、溫度的交互體驗」，真正的從用戶角度出發。

從我個人角度來看，在目前技術發展的階段，VUI 更多是一種輔助，至少短時間內不會完全取代 GUI。

三、設計流程

日常設計工作中，大家都會按照一定的設計流程開展工作，通用的流程一般有：探索調研 > 分析聚焦 > 設計策略 > 測試驗證。

同樣，這個流程可以復用到語音交互設計中，只是設計對象的媒介和我們產出的設計原型發生了改變，但我們發現問題、解決問題的思路應該是類似且可復用的。

具體的設計流程與環節如下圖：

1. 探索調研

（1）明確需求

筆者所參與的項目是「公司機房服務的工業機器人」的語音設計，這類產品的功能比家用設備的更為強大，除了語音外，它支持：行走、人臉識別、任務解析、數據采集等，同時場景也更為復雜。

首先機房環境聲音嘈雜、環境復雜；它的性質又決定對人員的安全要求極高，需要準確的識別與判斷，這些在了解需求階段是必須明確的環節。

機器人的主要功能就是輔助參觀人員、維修人員、駐場工程師更好的完成機房工作，實現機房業務管理智能化，提高運維管理效率和準確率。那么作為體驗設計方，則是通過各場景、各環節的體驗設計，讓人與機器人、與系統的交互高效、自然、流暢，讓智能化的機房日常運維管理更加完善。

（2）了解業務場景及目標用戶

不同的場景，意味著用戶不同的需求和目的，對語音交互的要求也不相同。下面就針對機房環境進行場景分析與設計難點的介紹。

通過團隊的調研，收集到在整個數據中心有5類用戶，其中會進入機房與機器人直接發生交互的主要有三類：訪客、廠商、數據中心駐場。

（3）技術水平

硬件。目前的語音產品包括：純語音（天貓精靈）和語音及界面結合（iphone 的 siri）兩種配置。

在設計之初，我們需要了解語音產品的基本硬件配置，這其中也包括麥克風、攝像頭、聽筒、設備聯網程度等，因為，產品的配置會影響我們后期的設計策略與體驗。

例如：問語音產品：「世界十大旅游勝地都是哪些？中國56個名族都有什么？」，即便語音助手可以準確的告訴我們答案，但無疑是一個沉重的認知與記憶負擔，如果配合屏幕來顯示，情況會好很多。

最好的人機交互形式是混合型的，即 GUI+VUI。（圖像交互+語音交互）如圖 echo show，如果你所設計的是純語音產品，那么在設計時則需要考慮更多的引導、容錯、提示等。

本次項目中所涉及的機器人不帶顯示屏幕，并且語音不聯網，這就意味著所有對話都需要提前預設好，設計師需要根據可能出現的情況，將對話內容完善，并且做必要引導，讓用戶按照系統期望的流程進行，確保工作順利、安全的開展。

如下圖：通過設計去盡量規避機器人硬件的缺陷，減少「答非所問」的錯誤發生率和用戶回答的發散，提高語音交互流程的順暢。

算法。算法方面，則需要通過機器「深度學習」，不斷完善語音識別、語音理解及語音合成的水平。

目前，語音識別方面還面臨很多技術挑戰，如：

噪音：恒定噪音（公路上、機房中）和突發噪音（突然異常大聲）。
多人講話：多人講話，設備能否識別其中一條信息；同樣多設備時，如何辨別自己的主人在說話。
兒童：兒童說話邏輯性較弱，容易出現口吃、長時間停頓等現象。
短句：「是」、「不」這種短句提供的數據信息較少，會造成識別率低。
多音字：比如人名，同樣的音會有多種書寫文字「清」「輕」，會影響語音識別的準確性。

更多關于機器人「深度學習」的內容大家可以自行了解，這里不展開討論。

2. 分析聚焦

具體在分析聚焦階段，圍繞與機器人相關的機房工作人員，洞察并提升他們在工作中的服務體驗，確保順暢、安全、高效的工作流程。

（1）用戶畫像

針對定位的三類用戶，我們通過問卷，進?用戶訪談，旨在了解各個不同角?的用戶他們工作的內容、需求，以及有哪些痛點可以抽取出來由機器人替代。

共計訪問10位用戶，包含各個角色。訪問之后，我們對用戶訪談的結果進行整理，在此基礎上，完成用戶角色建模。

以駐場工程師為例，具體的用戶角色卡如下圖所示：

根據用戶畫像和調研中收集的問題進行聚類分析，得到用戶訴求，即對機器人應用場景下的機房服務的「服務主張」，圍繞「安全」、「規范」、「高效」三個方面。這三個機房服務的體驗目標，也是作為后續機器人語音設計所要達到的基本要求。

（2）體驗地圖

與機器人交互的環節涉及到線上、線下，從線上任務的提交到線下與機器人真實交互，再到過程中機器人收集信息的回傳，整個閉環鏈路構成機房機器人服務體驗的核心。

以其中導覽場景為例，介紹整體流程，線上的主要觸點：任務申請 > 任務生成 > 任務確認 > 任務存檔；線下的主要觸點：任務下發 > 機器人喚醒及用戶身份驗證 > 任務執行 > 任務結束。

具體的觸點詳情及語音流程見下圖：

經過體驗地圖的梳理與流程規劃，去構建合理、有序的流程，在任務執行過程中保證人機交互「自然、親切、可靠」的體驗。在語音交互設計中也會利用適當的引導與必要的提示，以更自然的方式消除異常時的尷尬，快速做到工作銜接。

3. 設計策略

（1）定義角色人格

VUI 產品是一個虛擬的人與用戶直接溝通，因此，溝通對象的語氣風格、性格等則是用戶接觸的第一感受，為了提升真實性，定義一個符合自己產品調性的角色至關重要，也是著手真正語音設計的第一步。

這里的角色，是通過應用程序的語音及語言選擇，塑造一個符合品牌服務特征，并且具有人格或心理的形象。

角色人格包含：

公司所傳達的態度；
產品的個性特征；
期望別人如何看待它。

在設計時，我們可以用「真實的人物」來定義聲音特征與溝通基調，分析、了解真實人物模型的個性特征。例如：兒童早教類語音產品，可以以大家熟知的「金龜子」為人格原型進行定義，溝通中模仿她的語氣、用詞，讓兒童感到親切并符合服務對象的特征喜好。

但這里值得注意的是，現在很多語音助手支持語音選擇，如男聲、女聲、少年等。我們要知道，「改變聲音的同時，就意味著換了不同的人格」，他們的語音交互特征、形式等應該發生相應變化。

（2）語音交互設計

語音設計的原型更像是「劇本設計」，需要考慮在哪個場景下，包含什么角色、他們如何對話、如何過度銜接、具體的語言如何等。如下圖：就是在此次項目中輸出的語音設計原型，具體內容涉及到信息隱私，這里就不展開了。但是整個語音交互腳本中，對場景、角色、對話腳本備注圖例、腳本正文等都做了明確定義與設計。

（3）語音交互引導

在設計語音腳本內容時，需要特別考慮 VUI 與人對話過程的語言銜接、對話內容的順暢，并且能夠自然的完成設想的任務。例如：當詢問用戶信息時，最好給出一些示例，而不是說明。

以下兩句話大家可以明顯感受到體驗的差異，對于用戶來說，參照示例填寫信息，比理解一個通用指令更加容易。

「請告訴我你的出生日期，如2017年12月12日」；
「請告訴我你的出生日期，包括年月日」；

（4）語音交互反饋

在 GUI 界面中，「確認反饋」隨處可見，點擊一個按鈕、進行一個編輯操作，設計師會設計不同重要程度的交互反饋；在 VUI 中，同樣有不同程度的「確認反饋」，本文主要將他們分為三種：顯性確認、隱形確認、視覺確認。

（5）語音交互異常處理

語音可能存在的異常情況主要有以下四種：

未檢測到語音（明確告訴用戶「我沒聽清」）；
檢測到語音，但沒有識別（「我不明白你的意思」）；
語音被正確識別，但系統無法處理（「出現異?！梗?；
部分語音識別錯誤（答非所問）。

在設計中，我們可以按照不同的異常情況，設計多種播報腳本，提高產品容錯性，緩解異常時候的尷尬，在此例舉些常見的用戶語音輸入錯誤的回答，如下圖。

4. 測試驗證

（1）語音原型測試

以項目中團隊采用的兩種腳本測試方式為例，分別是：劇本朗讀和語音轉換工具。通過劇本朗讀，體驗對話的流暢程度，確認是否存在對話呆板、重復、不自然的情況；通過文字轉語音工具，如QQ語音轉化，可以較真實的感受機器將對話說出來的效果。

（2）設備測試調優

設計交付后，功能開發完成，進入語音設備可運行階段，這時系統具備測試功能。

測試調優的方法同樣給大家列舉兩個：

一是可以通過開發、設計人員，進行實際人機測試，了解語音功能是否穩定、任務完成率如何、整個體驗流程是否自然順暢；
二是可以通過用戶觀察的方法進行調研，找到符合特征的目標測試用戶，利用機房的監控攝像頭，觀察「自然狀態下」的用戶如何工作，這樣不會干擾用戶，更貼近真實的使用情景。

四、總結

語音交互設計僅靠書本上的知識是不夠的，需要設計師在實際項目中不斷的探索與學習，除了要像 GUI 了解需求、業務場景、目標用戶以外，還要了解語音設備的技術水平、設備配置等，從而有的放矢的展開設計。

以上是筆者首次接觸語音交互設計的設計經過，對 VUI 設計中的知識點、流程、方法進行的總結，仍有很多不全面之處，后續隨著項目的迭代和設計的深入，逐步去完善體驗，總結沉淀。

本文由 @阿里TXD 原創發布于人人都是產品經理。未經許可，禁止轉載

題圖來自Unsplash，基于CC0協議

更多精彩內容，請關注人人都是產品經理微信公眾號或下載App

語音交互設計怎么做？文章被收錄于該專欄

共 26 篇文章39088 人已學習

阿里TXD

阿里巴巴TXD團隊

15篇作品 215776總閱讀量

08-034251 瀏覽

07-036958 瀏覽

01-216991 瀏覽

06-301909 瀏覽

12-123218 瀏覽

評論

Sabrina??湯

特別好；

最近來自江蘇回復
天一生水

作為入門的參考材料，寫得很不錯，UX的工作基本上都是圍繞這些工作。

最近回復
子遷

很棒

最近來自浙江回復
貓叔

幫了我好多，謝謝。

最近來自廣東回復
Dobala

你好，我是微信公眾號的運營者，同問能否授權VUI和GUI比較優劣勢的圖片，微信公眾號ID：LinearCapital

最近來自江蘇回復
1. 阿里TXD 作者回復Dobala
  
  不好意思才看到，想問一下授權會注明出處并提供原文地址嘛？
  
  最近來自北京回復
CaptainPan

感謝分享，最近也在寫一些類似的文章，請問能授權使用其中VUI優劣勢對比的兩張圖么

最近來自浙江回復
朱越洋

厲害??，干貨

最近回復