智能座艙之語音喚醒

0 評論 2537 瀏覽 7 收藏 5 分鐘

在越來越多場景下,我們可以看到智能語音的應用,而其中,“語音喚醒”這個概念是必然要被提及的。這篇文章里,作者就對“語音喚醒”的定義、功能、問題等方面做了解讀,一起來看看吧。

一、智能語音的發(fā)展趨勢

2017年,小愛同學、天貓精靈誕生,到2019年分別基于手機、家庭開始打造以語音交互為核心,智能場景協(xié)同的護城河;

2020年智能音箱在國內銷量一度達到1.51億臺,成為繼手機之后的銷量最大的終端智能消費品類。

消費類智能語音終端的趨勢:

  • 單設備、單場景的指令交互向多設備、全場景的智能交互發(fā)展;
  • 從單感官的交互方式向多感官的人機交互(多模)演進;
  • 從功能性向情感陪伴的精神需求演進。

二、什么是語音喚醒?

在連續(xù)語流中實時檢測說話人特定語音片段。

三、語音喚醒的指標有哪些?

喚醒率:用戶交互成功率。

誤喚醒:用戶未進行交互,誤觸發(fā)的概率,一般以一天發(fā)生幾次計算。

響應時間:用戶說完喚醒詞后設備給出反饋的時間。

功耗水平:喚醒系統(tǒng)的耗電量如何,由于目前智能座艙應用于新能源汽車,該指標可不計。

四、語音喚醒能夠做的具體功能

oneshot用戶無需等待喚醒反饋,即可發(fā)出工作指令。例:“你好百度播放音樂”,客戶端會在喚醒后直接啟動識別以及語義理解等服務。

多喚醒:滿足用戶個性化的喚醒詞候選。例:百度的車,你可以用“你好百度”,用戶也可以自定義“你好騰訊”。

ZERO-SHOT:將常用指令作為喚醒詞,達到用戶無感知的喚醒效果。例:“打開車窗”、“導航到天安門”作為喚醒詞,實現(xiàn)快速響應;這種喚醒策略,為了減少誤喚醒平呂,大多情況下都會限制喚醒詞范圍。

五、語音喚醒遇到的典型問題

場景魯棒性:在環(huán)境嘈雜的情況下,通常會喚醒失敗或者誤喚醒,常見的車內場景:播音場景、開窗場景、高速場景、交談場景等,該類場景通常作為路試的必須場景。

相似詞誤喚醒:例:當喚醒詞為“你好百度”,此時說“你好小度”。

提前喚醒:當喚醒詞為“你好百度”,此時說“你好百”就喚醒。

詞嵌套:當喚醒詞有“百度”“百度助手”,用戶準備喊“百度助手”,“百度”被喚醒。

六、產品角度看語音喚醒

用戶體驗:語音喚醒作為語音交互的開始,喚醒率極大的影響了用戶對語音的使用欲望,目前智能座艙的語音喚醒率普遍已經實現(xiàn)≥95%,能夠給到用戶較為滿意的體驗。

未來趨勢:如今各家都在這點上做不斷地優(yōu)化,同時開始向多模語音的方向發(fā)展,但是多模交互在當前技術階段,存在支持范圍受限、誤喚醒率高、成本較高等問題,語音喚醒詞在一段內,仍是市場主流的選擇。

未來隨著VPA、主題世界、大模型對話在車機上的應用,喚醒詞可能會隨著語音風格等有著更加有趣的變化。比如“你好,嬛嬛”,“華妃在哪”。

品牌價值:語音喚醒詞在一定程度上也對品牌的塑造有一定的價值,目前各家的默認喚醒詞通常都為語音助手的名字“理想同學”、“小琪”、“小P”等等, 在日常語音使用中,不斷深化用戶對品牌的認知。

本文由@加飯 原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!