車載產品的語音交互導航場景

5 評論 14637 瀏覽 113 收藏 15 分鐘

語音是人們日常生活中最常用的交互方式,也被逐漸應用車載產品中,本文將以駕車途中最常見的場景——導航場景,簡單聊聊語音交互。

一、當前手機app語音導航功能如何?

以高德地圖為例,在開啟“駕車模式”和“首頁搖一搖喚醒語音”后,在首頁搖一搖即可語音輸入指令。

1. 語音搜索地名

第一步:語音輸入地名。測試中發現,目前僅支持地名或行車途中常見的服務站點(加油站、洗手間、服務站等),暫不支持“附近的吃飯地點”智能地點推薦功能。

第二步:根據語音提示選擇目的地。測試中發現:目前僅支持“第x個”的固定格式,暫不支持地名或下一頁等指令(圖中地點有多頁)。

第三步:開始導航。

有時,搜索的地名只有一個,便會確認是否開始導航。測試中發現,目前僅支持“是”指令,暫不支持“否”,且多次測試中“是”被高德地圖識別為“超市”。

也支持快捷的語音指令,導航到xxx,即直接開始導航。測試中發現,當出現多個類似地點時,默認導航至該地點名單的第一個地點。

2. 語音導航

語音播報:途徑地點、全程路長、預計所需時長、實時路況、監控提醒、服務站提醒。

測試中發現:語音導航中并不支持語音交互,若是需要在路途中尋找洗手間或更改路線,只能手動操作。然而這無疑增加了行車中的風險。

二、設想中的車載語音交互導航是怎樣的?

設想應當基于需求,對于車載語音交互導航,用戶的需求如下:

  • 基本需求:在搜索目的地時可使用語音輸入地名
  • 期望需求:在導航途中可使用語音修改目的地或增加途經地
  • 興奮需求:在搜索目的地時可提供智能化的地點推薦

1. 基本需求

目前高德地圖和部分車載智能中控臺已經能做的,核心的關鍵在于對語音的識別率,這將極大影響語音交互的效率。

語音的高識別率需要大量的語音訓練,中國人口音五花八門,各家產品皆很難達到較高的識別率??拼笥嶏w有語音開發合作平臺,語音識別率達98%,與他們合作能極大的提高開發效益。

2. 期望需求

目前比較少見,常見的應用場景是滴滴拼車,拼完座后,高德地圖會導航司機用最短的路程接完乘客并送達乘客到目的地,但高德地圖并沒有在C端產品上開放出該功能。

修改目的地和增加途經地只需要重新規劃路線,該需求實現的核心在于對語音的高識別率、降噪和回音消除。行車途中若是對指識別錯誤,可能會導致導航錯誤,影響用戶駕車情緒,增大行車風險。且高速駕駛中噪音較大,可能還會遇到車窗打開、車內喧嘩等場景,降噪和回音消除是導航中保證語音高識別率的基礎。

3. 興奮需求

其實是一個低頻需求,大部分的用戶在開車前便已有了目的地,未有目的地的時候,也會現在美團或大眾點評等平臺上選好目的地,再上車。很少會出現,坐上了車,才想著要去哪里的場景??赡艽嬖诘膱鼍笆牵脩粼谛熊囃局型蝗幌敫淖兡康牡?,或出來玩耍后未盡興想繼續玩,但不知道去哪里。

高德地圖上便有附近地點的搜索,美團與大眾點評等O2O平臺上亦有附近商家推薦,與這兩者合作,便能解決該需求。

三、語音交互導航的流程

如何去達成良好的車載語音交互導航體驗,這里將以獨立車載智能中控臺的初次接入場景和導航場景為例進行說明。

1.?初次接入流程

接通電源:大部分獨立車載智能中控臺都不具備儲電功能,需要在車上接電。然而車內環境狹小,也較為復雜,不同車型內飾也各有差異,需要在說明書上用通用的方式指引用戶給中控臺接通電源。

接通手機或汽車與中控臺:應注意保持行車途中信號的穩定性。

進行新手引導:

  1. 自我介紹:產品角色亮相,支持功能介紹
  2. 基本規則介紹:讓用戶了解語音交互的基本使用方式
  3. 引導用戶完成基本設置:家庭/公司地址設置、聲紋識別等常用功能或隱私設置

需要注意的是:新手引導是極易被用戶跳過或不用心聽的,應該在新手引導后仍有觸達用戶的方式,讓他們了解語音交互的基本使用方式或完成基本設置。

2. 導航場景

喚醒:

  1. 語音喚醒:當用戶需要使用中控臺是喚醒它,為了避免誤喚醒,通常會將喚醒詞設置為3~4個詞,如“小飛魚”,三字詞和四字詞在漢語中是相對較為低頻的,有助于提高喚醒的準確率。可以使用定向語音,即只有固定位置的人說話才會被收錄,只開放給駕駛位和副駕駛位。
  2. 喚醒反饋:中控臺被喚醒后,進行反饋。簡單的反饋可以是“?!币宦暎@樣顯得太冷漠,最好是使用“我在”“你說”等人性化的回應詞或語句。

設置目的地:

(1)語音輸入

這里以導航為例,用戶輸入的語音可能為“導航到會展中心”“會展中心”“去會展中心”“我想去會展中心”,需要對地名、“導航”、“去”的識別較為準確。

與喚醒詞不同,目的地的語音通常為一句話,所包含的字詞會較為復雜。語句的識別可簡單劃分為5個步驟:

  1. 判斷語音結束點:判斷從發聲到結束,截取聲音片段。
  2. 提取有效信息:將聲音片段識別成一個個發音。
  3. 識別:將發音與文字匹配,將發音識別成特定的文字。
  4. 自然語言理解:根據算法理解語意。
  5. 對話管理:根據語意進行回復,引導進行下一輪的對話。

目前對話管理有兩種識別模型,一種是使用人工定義回復的內容,另一種是通過機器學習的算法,提供自然語言的回復。

除開語句識別技術外,還要保障有清晰的聲音獲取。行車途中,難免會遇到較為嘈雜的環境,如車窗大開、高速駕駛、車內喧嘩和空調聲大等,需要進行降噪。目前比較常見的技術手段是使用雙麥克風陣列降噪和回聲消除。

(2)識別反饋

對輸入的語音內容給予反饋。

  • 識別完成反饋:“為你找到深圳會展中心,位于福華三路與金田路交匯處,是否導航”。
  • 識別錯誤反饋:“抱歉,沒有聽清,請再說一遍”,需要注意的是,若是多次識別錯誤,可能是用戶沒有正確遵循語音交互規則,此時可進行基本規則介紹。

開始導航:

(1)確認是否開始導航

若用戶回復“是”或“開始”,則上一步識別正確,開始導航。

若用戶回復“否”或“取消”,則說明上一步識別錯誤,應重新設置目的地,應回復用戶“主人,你想去哪兒呢?”,并進入設置目的地步驟的語音輸入環節。

若用戶回復其他“地名”,則說明上一步識別錯誤,應更改目的地,回復“為你找到深圳大劇院,位于深圳市羅湖區,是否導航”。

若識別錯誤,則回復“抱歉,沒有聽清,請問是否開始導航?”,重復識別錯誤3次,應當退出導航功能,避免用戶不良情緒的積累。

(2)開始導航提示

提示用戶導航已經開始,對行車里程、預計時長、路途車況、途經地點等內容進行播報。

如:“準備出發,路程約為14公里,目前道路通暢,預計需要28分鐘,途經泥崗西路、紅荔路、金田路,祝你一路順風。”

(3)導航中語音交互規則介紹

行車途中,常見的需求有規避擁堵、更改目的地、尋找加油站、尋找服務站、尋找洗手間、尋找充電站等。長期以來,各類手機導航app和車機中控臺在導航中都需要用手操作去更改路線,但這樣會帶來嚴重的行車風險。時速60km/h時,操作手機3s,就相當于盲開50m,發生事故的概率是平時的23倍。

用戶并不知道行車途中可以使用語音交互進行指令,也不知道如何進行語音交互,故在前3次中導航,可進行導航中語音交互規則介紹。
這類語音交互是基于導航場景中的,故該部分的功能也應該在導航中才可有效開啟。如“前方還有多遠到達充電站”。

導航中:

(1)路況播報

常見的如前方擁堵、監控提醒、服務站提醒等。

當前方發生較大擁堵時,用戶會有規避擁堵的需求,可詢問用戶“前方發生擁堵,預計通過時長為40分鐘,是否規避擁堵?”,若用戶在多次遇到擁堵時選擇規避,則可默認幫用戶進行規避擁堵,并提示“前方發生擁堵,預計通過時長為40分鐘,已為你規避擁堵,節省擁堵時間30分鐘?!?/p>

(2)輸入語音指令

常見的如尋找附近的洗手間、增加途經地、更改目的地、規避擁堵等。需要注意的是,增加途經地的指令,在導航到達途經地后需繼續原目的地的導航。

如:用戶在長途行駛時,常會前往服務站休息或加油,會使用語音“去最近的服務站”,導航到最近的服務站后,用戶下車休息一段時間返回車上,僅需一句“繼續剛才的導航”,即可繼續導航至原目的地。

有時,用戶可能會聽不清路況播報的內容,而輸入語音“重復剛來的內容”、“我沒有聽清”。

這些語音指令都需要結合導航途中的不同場景來做具體的流程設計。

(3)識別反饋

需根據具體場景來提供識別反饋。

如:用戶沒有聽清路況播報時,反饋“為你重新播放剛剛的內容,前方發生擁堵,預計通過時長為40分鐘,是否規避擁堵?”

如:用戶在長途行駛中,添加途徑地服務站,導航至服務站后,在提示完“已到達服務站”后,可詢問用戶“是否繼續導航至深圳大劇院?”

導航結束:

(1)結束導航提示

提示用戶導航已結束。導航結束通常有兩種場景,一是已到達目的地,此時提示“已到達目的地,導航已結束”,二是用戶退出導航,此時提示“導航已結束”

(2)進入休眠狀態

導航結束后,自動進入休眠狀態,等待下一次喚醒。

完~

 

本文由 @陳想吃 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 你是不死用到了假的高德導航了哦?!多久測試的結果?

    來自四川 回復
  2. 請問能否轉載至公眾號?

    回復
    1. 你公眾號多少?我給你開白名單

      回復
    2. AutoinFuture,謝謝~

      回復
  3. 陳建川?

    來自北京 回復