車載語音產品需求分析與產品設計

2 評論 7846 瀏覽 64 收藏 23 分鐘

語音交互是車載系統中常見的一種交互方式,但在用戶體驗上,現在市面上的車載語音交互常常容易受人吐槽。怎么做好相應的車載語音產品設計呢?這篇文章里,作者對車載語音產品從需求分析到原型圖設計的完整流程做了較為系統的闡述,一起來看看吧。

目錄:

  1. 車載語音產品概述
  2. 需求分析與競品分析
  3. 需求分類與功能設計
  4. 智能化場景與交互設計方案
  5. 車載語音VUI與原型圖設計
  6. 車載語音產品系統架構

一、車載語音產品概述

多模交互已經成為當前智能座艙的標配,在車載系統中同時使用多種交互方式,其中之一就是語音交互。語音交互可以與其他交互方式(如觸摸屏、物理按鈕等)結合,提供更豐富和便捷的用戶體驗,用戶可以更方便地進行操作,尤其在駕駛過程中可以更專注于道路,提升安全性和便捷性。

同時,語音交互也可以與其他交互方式相結合,提供更靈活的操作選擇,滿足用戶的不同需求。

1. 車載語音交互具有以下特點和優勢

車載語音是指通過語音識別技術(ASR)將駕駛員或其他乘員的語音指令轉化為可理解的指令,然后通過語音合成技術(TTS)將系統的反饋信息以語音形式傳達給對應人員。

  1. 提升駕駛安全性:駕駛員可以通過語音指令完成操作,無需分散注意力去觸摸屏幕或按鈕,減少駕駛風險;
  2. 提供便捷的操作方式:語音交互能夠提供更自然、更直觀的人機交互方式,讓駕駛員更輕松地控制車輛功能和獲取信息;
  3. 支持多任務處理:通過語音交互,駕駛員可以同時進行駕駛和操作,無需停下來或轉移注意力;
  4. 個性化體驗:車載語音交互可以根據駕駛員的習慣和偏好進行個性化設置,提供更加貼合用戶需求的服務和建議。

2. 車載語音產品腦圖框架

二、需求與競品分析

1. 車載語音交互痛點分析

語音喚醒率差,識別率差,NLP理解能力差、多輪對話不靈活,離線功能少,目前大部分的車載語音是被吐槽頻率最高的一個功能,基本上可以說是雞肋。

下面是用戶痛點整理:

2. 基于實際駕駛情景的分析

3. 車載語音體驗地圖

4. 車載語音產品的競品分析

頭部造車新勢力將語音交互功能作為其產品智能化與差異化的核心體現,因此通常會選擇自研搭建智能語音技術框架,以提高智能語音助手的功能迭代與優化的頻率以及便捷性。

從當前各車企語音交互功能的智能化配置來看,造車新勢力的語音交互功能的智能化水平依然存在一定優勢。傳統主機廠通常選擇外部合作的發展模式,但頭部的傳統主機廠也開始逐漸發力,全雙工、多音區覆蓋等核心功能也已搭載上車。

部分車企語音交互功能智能化配置:

1)小鵬首創全系統功能覆蓋、連續對話等,智能化表現成其標簽

小鵬基于全車揚聲器分布,推出的全系統功能覆蓋、連續對話等多種行業首創功能為其取得行業領先地位,符合其極客定位。

通過“OTA+云端”的高頻迭代方式,實現用戶無感情況下的語音助手優化。語音助手小P更像是用戶專屬的助理與朋友,通過定制裝扮、多種音色選擇與定制化語音暗號建立小P與客戶的獨有聯系。

小鵬將繼續優化提升語音交互的基礎能力與語音包與應用場景的豐富度,同時也將座艙內部分語音相關的軟件應用通過“軟件收費”的方式進行開放。

2)理想智能語音交互產品“理想同學”另辟蹊徑,定位契合車型定位

語音助手“理想同學”的產品定位完美契合理想ONE中高端家庭用車的車型定位,以全車語音覆蓋、座艙全成員平等交互權利等特點,滿足家庭出行場景的語音交互需求。

理想同學基于其產品用戶畫像,深耕4音區以及開拓多音區覆蓋,使車內所有人員均可通過語音進行人機交互,同時也將從整車交互的角度進行場景化的思考,貼合家庭出行用戶使用習慣。

3)蔚來賦予NOMI具有情感的擬人化形象,助其成為“蔚來的靈魂

蔚來智能語音交互助手NOMI,源于蔚來對于語音交互體驗的理解-“Know me”,其集成了語音交互系統和智能情感引擎,被賦予了具有感情的擬人化形象,使蔚來的汽車產品從機器演變成了具有生命的駕乘伙伴。

蔚來的NOMI智能語音交互助手的語音技術是在科大訊飛的支持基礎上進行了個性化設計與改造。NOMI聽音辨位免打擾獨立音區交互等功能,可幫助其后排乘客進行語音交互的體驗。

三、需求分類與功能設計

1. 車載語音產品場景控制劃分

車載交互的場景控制,包括語音助手情景模式、語音助手推薦、全場景語音控制。

2. 車載語音系統交互功能劃分

按照語音識別的交互功能整個鏈路來進行分類,包括語音助手形象、助手感知、語音助手交互、語音助手聲音。

3. 功能設計

1)語音助手形象設計

不同場景下的語音交互助手的形象不同,比如在休眠狀態就是一個波浪形,在設置界面是一個卡通或者人形,這些都是基于車輛定位,比如五菱車型就是設置卡通,萌寵的形象。如果是商務車,可以設置比較穩重的形象。

  • 卡通化的語音形象:在親和力上有很大的優勢能夠被用戶快速的接受,但是辨識度上可能存在同質化嚴重問題,所以在效果表現力上面有欠缺,也較難表達車企的品牌理念。
  • 抽象化的語音形象:則通過造型的多變和動效豐富,從而在設計感和效果上相對突出,在傳達性上也不滿意,用戶不容易知道當前語音是處在一個什么狀態下,在親和力上遠也不如卡通化形象。

2)車載語音助手感知

語音助手感知,更多的層面類似于人的眼睛和耳朵,通過聽和看兩個感覺器官來進行內容輸入。

也可以通過多麥克風及回音消除方案進行設計,多音區的控制,硬件通過A2B的麥克風布局,同時軟件進行界面設置,是否允許多音區喚醒。

喚醒方式分實體按鈕喚醒與虛擬按鈕喚醒,實體按鈕,好處就是能夠給到用戶觸覺上的反饋,用戶感知性強;虛擬按鈕,此類的按鈕一般都會在中控屏幕上面,喚醒的方式是點擊。

語音喚醒詞有兩種,一種是語音公司默認的,這個是訓練過的模型,男生、女生、老人、小孩都適合。一種是自定義喚醒詞,需要付費給語音公司,要么他幫你訓練,車上其他乘客(包括車上其他陌生乘客),如果不付費,就是錄入自己家人的語音,這樣才識別率會高一些。

3)車載語音助手交互

語音助手交互更多類似于人的大腦,進行多模態交互,多輪交互等等。

構建對話交互平臺,解決用戶三大對話類型,獲取內容/服務。任務型和問答型對話,用戶需要盡快的得到想要反饋和解決方案,并且快速的完成,此類任務的反饋要求還需要清晰、簡單明了,閑聊型的任務帶有的目的性不是很強,但是對于趣味性要求會高。

4)車載語音助手交互/多模態

主流的車型上都配備有多模態的交互方式包括觸摸、語音、人臉、手勢、聲紋、指紋、燈光、手表等等。目前主流的是聲音+手勢會比較多長安汽車的視線喚醒、長城汽車的聲紋識別。

另外,還有語音+車內+車外攝像頭交互方式,奔馳“MBUX Travel Knowledge”–駕駛員可通過視線鎖定一棟建筑物,并說:“我想知道這棟樓的用途即可獲取相關信息。”該功能由Cerence Look提供技術支撐。

語音+唇動識別與唇動識別融合下的語音交互將極大提高語音識別性能,不同語言下的唇部動作不同,在嘈雜的座艙環境下即使系統接收到聲音很小,結合唇部動作也可以保障較高的語音識別率。

5)車載語音助手交互/UGC用戶定義

車主可通過手機APP自定義語音指令及對應的操作,在不影響整車控!功能與行車安全的前提下,增加語義定制功能,用戶可根據個人喜好與場景化需求,靈活設置語音交互對話內容,增加個性化和趣味性,此項功能可關閉。比如特斯拉的彩蛋屁,可以設置一個語音,小P放一個屁,回復就是一個屁的聲音,非常有意思。

6)車載語音助手聲音選擇

語音助手聲音更多的是輸出部分,類似于有“郭德綱”“林志玲”等聲音,也可以個性化錄制自己的聲音。音色切換指語音系統除了默認語音聲音外,可提供其他聲音供用戶選擇,如明星、游戲人物的聲音等??梢栽O計親和女聲、知性女聲、磁性男聲、稚嫩童聲、熱情女聲五種音色供選擇,可以聯網選擇明星播報語音。

四、智能化場景與交互設計方案

1. 車載音頻的焦點優先級設計

1)獨占交互

在獨占交互中,一次只允許一個應用持有焦點。因此,在傳入的焦點請求被授予焦點的同時,現有的焦點持有者會失去焦點。例如,用戶在現有應用中播放音樂時啟動新的音樂應用。由于這兩個應用都在播放媒體內容,因此一次只允許其中一個應用持有焦點;

2)拒絕交互

在拒絕交互中,傳入的請求一律會遭到拒絕。嘗試在通話過程中播放音樂就是拒絕交互的一個示例。在這個例子中,如果撥號器正為某個通話持有音頻焦點,而另一個應用要請求焦點來播放音樂,則音樂應用發出的請求會收到AUDIOFOCUS REQUEST FAILED 響應。由于焦點請求遭拒,因此系統不會向當前焦點持有者分派任何類型的焦點丟失事件;

3)并發交互

AAOS 最獨特的地方就是并發交互。在這種交互模式下,請求音頻焦點的車載應用可與其他應用同時持有焦點。

2. 處理并發聲音流

雖然并發交互適用于許多實用應用,但原始設備制造商(OEM)必須在硬件級別跨輸出設備實現混音和降音(安卓里面稱為閃避)。

因此,建議僅將存在并發播放的 CarAudioContext 路由到無法與其同時播放的CarAudioContext 的同一輸出設備。通過為并發聲音流提供單獨的輸出設備,HAL便可在混音之前對其中一個聲音流進行閃避。

例如,如果同時提供導航提示音和媒體播放聲音,媒體聲音流的增益會暫時降低(閃避),以便用戶能更清楚地聽到導航提示。

AndroidCar音頻焦點-智能座艙交互矩陣實例表

3. 車載語音智能化場景分析

1)場景控制

車載交互的場景控制,包括情景模式預制、助手推薦、全場景語音控制,語音產品經理需要重點掌握的是場景推薦模式設計、聚合媒體的全部功能、語義表單的設計、多輪對話的設計。

2)車載聚合媒體內容

作為車載語音產品經理,把聚合媒體的所有菜單內容都理解一遍,這些內容的語音交互場景是什么,才能知道語義表的設計以及邏輯框架的設計。

3)車載場景智能化推薦

場景智能化推薦,80%是主動交互的一種,未來語音交互也是從被動走向主動,需要產品經理非常強的場景智能化的設計能力,做到既不打擾用戶,又能給用戶更好的體驗。

上車問候:上車的時候有比較常見的就是開機動畫,儀表自檢,場景推薦可以是節假日彩蛋、個性化開機語、生日提醒等;場景智能化推薦的上車相關內容,包括有主體的喚醒、運營事件、二十四節氣提醒、氛圍燈聯動等等;

實況關懷、媒體推薦:場景智能化推薦的實況關懷在一些汽車上已經實現,比如哈佛初戀的車型,包括加班關懷和限號提醒媒體推薦主要是智能歌單、電臺推薦等等;

其他還有目的地推薦、美食推薦、離車關懷、故障提醒、電量/油量提醒、疲勞駕駛,智能車控、乘客服務等等。

4)車載語義功能表

(省略)因Excel表格內容太多,放進來影響文章可讀性,所以就不展示了。語義功能表包括:通訊模塊、導航模塊、媒體模塊、查詢模塊、車輛控制、語音技能、自動泊車、DMS、駕駛相關設置、香氛控制等。

五、車載語音VUI與原型圖設計

1. 對話系統設計

對話設計是基于人們的對話的設計語言,它集合多個設計的內容,其中包括語音用戶界面設計、交互設計視覺設計、動畫設計、語音對話腳本設計、乃至還有音頻設計增加語音助手的靈動性。

1)語音交互原理

為了更能理解用戶的需求,需要進行多輪對話的設計。

2)語音交互流程

第二步對話管理,主要完成對話狀態的維護(dialog state tracing,DST),生成系統決策(dialogpolicy),作為接口與人物模型進行匹配、提供語義表達的期望值(expections for interpretation)、分發任務記錄當前queryID和pageID。

當前是用戶的一次對話需要經歷的全部流程,如果需要多次的對話,就要不斷的維護對話棧,并且對話棧要匹配當前的pagelD,才能幫助用戶經歷多次跳轉都能到達預期的頁面,所以多輪交互更加復雜和難以掌控。

3)注意事項

語音對話系統設計包括語音用戶界面設計、交互設計、視覺設計、動畫設計、語音對話腳本設計。

對話系統設計的原則:語音簡短化、響應等待設計、避免過多選擇、不要假設用戶知道該做什么語言文案設計一致性、不要信息轟炸用戶、避免使用專業術語。多輪對話設計,主要需要二次選擇和確認,對搜索結果排序。

2. 車載語音VUI設計

1)GUI與VUI的特點對比

VUI在某些場景下具有非常明顯的優勢,但是也需要比較好的設計邏輯。

綠色表示VUI優勢明顯

2)語音VUI交互設計規范

目前業界未存在公認的語音交互的設計規范標準,業內各家公司都處于前瞻、摸索、引導的階段盡管語音交互被看做是一種區別GUI的交互方式,但基本的可用性原則依舊適用于衡量用戶體驗的質量。

3)VUI的設計原則

VUI的設計原則相關內容,主要是社會原則、感性原則、理性原則:

3. 車載語音VUI邏輯與原型圖設計

下圖是車載語音撥打電話的主流程圖:

六、車載語音產品系統架構

1. 智能座艙域控制高通8155整機框架圖

主流的8155方案是一芯帶5屏,這里有液晶儀表、中控導航、后排頭枕顯示屏、同時有語音mic的輸入、U盤、wifi、藍牙、外接喇叭的輸出。

2. 語音系統架構

語音系統架構交互,是AI交互中的其中一個環節,更多的是整體的解決方案是需要算力、平臺解決方案。

3. 常見車云通訊協議

以上是車載語音產品的需求分析到原型圖設計的完整流程(完結)。

本文由 @ALICS 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 太干了,贊

    來自上海 回復
  2. 配圖有些糊,請問有清晰版本嗎?

    來自上海 回復