語音交互實例:從切換播放模式細節想到的

7 評論 7500 瀏覽 34 收藏 14 分鐘

這一段項目時間不是很緊張,比較有時間去探討一些細節的問題,有些東西可以做有些東西可以不做,去探究背后的原因是一件很有趣的事情。

一、簡單介紹VUI

想必大家對于語音交互并不是很了解,而車載方面的語音交互更是陌生。這里我先來科普下大背景,至于對這個方面比較感興趣的可以查找一下資料,想必其他的文章會很詳細的介紹理論。這里我先討論在實際應用當中的需求探索。

首先語音交互是從交互式語音應答系統(Interactive Voice Response,IVR)而來,它是通過電話來執行任務,和10086不同的是,它能夠識別人們說的話,由于擅長處理帶有大量信息的復雜句子,應用場景比較廣泛。

后面智能手機高速發展,于是誕生了VUI(Voice User Interactive ),像Siri、Cortana都是比較典型的應用,語音交互一直被稱作“最為自然的交互入口”,優點和缺點都很明顯。

車載場景的語音交互,有個很明顯的優勢:無需司機分心操作,直接語音指令即可達到想要的目的。所以在車內使用語音交互,任務型需求會占大多數。

二、實際應用中遇到的問題

今天看到之前的產品文檔中有這樣一個設計:

當前的設計都由于技術的限制,不支持的說法不能進行下一輪的對話,所以這里在反饋完畢后直接退出語音。并沒有什么大問題,很多車機語音交互直接提示不支持的說法,后面的說法提示都沒有。但這個方案對于用戶來講,依舊大大打擊了他們使用語音的積極性,這樣的設計至少有下面幾點不是很合適的點:

  1. 在人工智能不是很智能的情況下,盡量理解用戶意圖并允許用戶繼續交談。
  2. 功能點設計要考慮可發現性,對于語音交互,看不到的交互方式更要提高它的可發現性。
  3. 已知的對話原則中有一點:方式準則,即說話需清晰明了,這里可以做簡化,但也需要針對不同的用戶群體。

三、從用戶出發,了解說出這句話的初始意圖

在我看來語音交互是一個比較繁瑣的設計過程,因為不同場景用戶會說什么樣的話很難預測,所以我會選取幾個最常見的使用場景,然后為每個場景按照最優路徑(同樣結合業務流程)寫出示例對話,同時還要加上異常情況。

這個就是在切換播放模式時的一種異常情況:

User:幫我切換到隨機播放/隨機播歌/按照隨機播放歌…

TTS:隨機播放

(TTS:從文本到語音,Text To Speech,一般是由產品、交互設定的內置文本,當用戶說了某句話命中某個說法,那么就播報該說法對應的反饋語。這整個過程就算做是一個完整的對話交互設計了。)


再來看看用戶為什么會這樣說“切換播放模式”吧:

  1. 在手機APP上,切換播放模式,都是點擊切換到自己想要的播放模式,三個播放模式是固定的順序,所以在車機上用戶也會想要延續這樣的操作習慣,才會有這樣的說法。
  2. 知道播放模式有哪些,但是不知道車機上語音對音樂的操控有哪些,所以試探性的嘗試。
  3. 不清楚有哪些播放模式,所以只是想看下有哪些播放模式

不論從哪個出發點,最終的目的導向都是:想要切換播放模式。

四、根據不同意圖,對用戶進行分類,尋找更好的解決方案

根據上面三種情況,其實可以分為:

  1. 對音樂比較熟悉的用戶,對車機端的語音控制探索使用。
  2. 對音樂不怎么熟悉的用戶,對車機端的語音控制探索使用。

再來看看語音切換播放模式的需求想要解決的問題:

  1. 無需關注界面,直接下達語音指令達到目標;
  2. 縮短用戶操作路徑:比方說手機上切換播放模式,有時候需要點擊兩次;而車機上直接下達明確指令,直接完成。

來,先來分析上面兩種用戶群體的更深層的用戶定位。

1.對音樂比較熟悉的用戶

手機上的操作大部分是因為在播放詳情頁的操作按鈕過多,所以把播放模式收入到一個按鈕中去,下面是不同的音樂界面,特意選擇了一些不常用的音樂App,出乎意料酷狗是可以選擇,基本其他的應用都采用點擊切換播放模式的交互;

再深入一點,手機用戶切換播放模式的時候分兩種場景:

  • 第一種,熟悉播放模式的人,在操作之前會有一個心理預期,所以會設定為她想要的播放模式,而播放模式的切換最多點擊三次,用戶成本不會很高,所以這也是大部分手機APP將它收入一個icon當中的原因;
  • 第二種,不是很熟悉的人,他們在操作的時候可能會想了解有什么播放模式,最后再去確定最終的心理預期,所以點擊會超過三次。

綜合上述,不論是熟悉程度如何,都會有一個既定的心理目標,有比較明確的操作意圖。

而對音樂APP比較熟悉的用戶群體基本集中在:18-40歲左右,他們基本上都知道有這三種播放模式,所以可以有以下做法:

  • 做法一:經過刻意引導,讓他們的意圖更為明確,這樣就不會出現這樣的說法;直接下命令切換,也能夠減少用戶的操作路徑,降低用戶的操作成本。
  • 做法二:先完成用戶目標用意:切換播放模式,再提示用戶有什么播放模式可以切換,讓用戶逐漸熟悉
  • 做法三:完成用戶目標用意,不進行提示,三種播放模式可能用戶就是比較懶,不想說出具體的播放模式名稱,這樣只記住一個說法即可達成。

2.對音樂不怎么熟悉的用戶

我專門找了我親愛的爸比,詢問了下他的中老年開車朋友們,年齡分布在40-50歲,大部分在45歲以下。下面是一些聊天記錄。

我的問題:你們在播放音樂的時候,知道能夠切換播放模式么?如果知道,那你們知道有幾種播放模式可以切換么?請說出你們印象中的名字。在這個過程中,不要打開音樂APP查看,靠自己的記憶~

很出乎我的意料,可能調查的目標用戶在一線城市會結果又不一樣。但是生活在一線城市的中老年人人數又有多少呢?很大部分的中老年人都生活在非一線城市,對于他們而言,簡單的播放歌曲就能滿足他們對音樂的需求。

但是,有沒有必要像這一部分的人推送這個功能呢?

再來看會使用智能車機的人群分布:(網上扒來的數據,隨意看下)

有65%的中國消費者愿意接受車聯網功能,高于歐洲國家的40%和北美的32%。中國消費者也更加愿意嘗試娛樂資訊方面的功能,比如社交媒體和車載視頻及音樂。

未來十年間55歲以上族群會增長近1億人,與此同時同時90后替代80后逐步成長為消費市場主力,2015年數量已經接近2億。年輕和老齡人群的消費需求變化將值得深入挖掘,以贏得未來市場進行提前布局。

所以中老年的需求有待挖掘,所以我覺得這里應該要做的是音樂推薦的智能化,讓他們享受到人工智能帶來的好處;而不是引導他們使用新的功能,這樣對他們而言使用、操作成本都大大提升,也增加了他們的記憶負擔,明明車機的語音交互只是想要減少用戶在開車中的干擾因素,這樣和我們想做的事情背道而馳。

五、結合推薦做法、語音交互優化準則,確定最后的方案

好了用戶群體分析、需求深入分析已經告一段落,那么就要按照剛開始覺得做的不到位的點,明確最后的方案。

根據二、四種可優化的點和推薦的做法,我們來對比分析下:

做法一是交互引導,其實在整體方案設計中就有考慮如何引導用戶了解語音交互,已有方案。

做法二、三,都符合理解用戶意圖、能夠提高可發現性,區別是后續的信息有沒有提示用戶。不過這里讓人糾結的點有以下考慮:

  1. 提示用戶,他們能夠明確知道還能夠說什么說法操作,不過說法提示過長,無法再精簡,對用戶來講也有一定的記憶負擔;
  2. 不提示用戶,他們可能不了解直接說播放模式的名稱也可以操作,這樣更簡單有效。

我們再來明確設計目標:簡單、高效、不分散注意力;所以提示是必須的。明確這些,繼續參考資料-《語音界面用戶設計》這本書,根據語音用戶界面基本設計原則中的異常處理中,增強錯誤提示有這樣的實例對話:

天氣APP:我能為您提供天氣信息,請問您所在的州和城市是哪里?

User:恩…我在斯普林菲爾德。

天氣APP:抱歉,我沒聽懂,請說出所在的州和城市。

用戶:哦,我在明尼蘇達州,斯普林菲爾德。

這個異常處理有提示用戶需要明確的信息,那么我們的方案也可以采用這樣的方案:

User:切換播放模式

TTS:好的,請問您想切換為哪種播放模式呢?

User:隨機播放

TTS:已切換,您下次可以直接對我說隨機播放。再見~

這樣的方案是不是看起來不是那么智障呢?

做語音交互方案一直處于這樣的發現提升點、探索、制定方案、糾結、推翻、不斷優化的過程中,關于這方面的教科書般的理論并不是很多,所以這里記錄下一個優化小點從發散到制定優化方案的小過程,可能比較瑣碎,分享下語音交互的日常工作,也希望能幫助想了解的人對此有點認知。

 

作者:青絳,微信公眾號:慕七和大胖

本文由 @青絳 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Pixabay,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 很用心,支持一下

    來自上海 回復
  2. 樓主有微信嗎?一起學習呀!

    回復
    1. 好啊~微信:15521017512,記得備注~

      來自廣東 回復
  3. 多謝支持~

    來自廣東 回復
    1. Hello 欣賞你的作品??梢哉J識一下嗎。 車載相關從業,產品運營。

      來自廣東 回復
    2. 好啊~微信:15521017512,記得備注~

      來自廣東 回復