智能座艙之語音喚醒
在越來越多場景下,我們可以看到智能語音的應用,而其中,“語音喚醒”這個概念是必然要被提及的。這篇文章里,作者就對“語音喚醒”的定義、功能、問題等方面做了解讀,一起來看看吧。
一、智能語音的發(fā)展趨勢
2017年,小愛同學、天貓精靈誕生,到2019年分別基于手機、家庭開始打造以語音交互為核心,智能場景協(xié)同的護城河;
2020年智能音箱在國內銷量一度達到1.51億臺,成為繼手機之后的銷量最大的終端智能消費品類。
消費類智能語音終端的趨勢:
- 單設備、單場景的指令交互向多設備、全場景的智能交互發(fā)展;
- 從單感官的交互方式向多感官的人機交互(多模)演進;
- 從功能性向情感陪伴的精神需求演進。
二、什么是語音喚醒?
在連續(xù)語流中實時檢測說話人特定語音片段。
三、語音喚醒的指標有哪些?
喚醒率:用戶交互成功率。
誤喚醒:用戶未進行交互,誤觸發(fā)的概率,一般以一天發(fā)生幾次計算。
響應時間:用戶說完喚醒詞后設備給出反饋的時間。
功耗水平:喚醒系統(tǒng)的耗電量如何,由于目前智能座艙應用于新能源汽車,該指標可不計。
四、語音喚醒能夠做的具體功能
oneshot:用戶無需等待喚醒反饋,即可發(fā)出工作指令。例:“你好百度播放音樂”,客戶端會在喚醒后直接啟動識別以及語義理解等服務。
多喚醒:滿足用戶個性化的喚醒詞候選。例:百度的車,你可以用“你好百度”,用戶也可以自定義“你好騰訊”。
ZERO-SHOT:將常用指令作為喚醒詞,達到用戶無感知的喚醒效果。例:“打開車窗”、“導航到天安門”作為喚醒詞,實現(xiàn)快速響應;這種喚醒策略,為了減少誤喚醒平呂,大多情況下都會限制喚醒詞范圍。
五、語音喚醒遇到的典型問題
場景魯棒性:在環(huán)境嘈雜的情況下,通常會喚醒失敗或者誤喚醒,常見的車內場景:播音場景、開窗場景、高速場景、交談場景等,該類場景通常作為路試的必須場景。
相似詞誤喚醒:例:當喚醒詞為“你好百度”,此時說“你好小度”。
提前喚醒:當喚醒詞為“你好百度”,此時說“你好百”就喚醒。
詞嵌套:當喚醒詞有“百度”“百度助手”,用戶準備喊“百度助手”,“百度”被喚醒。
六、產品角度看語音喚醒
用戶體驗:語音喚醒作為語音交互的開始,喚醒率極大的影響了用戶對語音的使用欲望,目前智能座艙的語音喚醒率普遍已經實現(xiàn)≥95%,能夠給到用戶較為滿意的體驗。
未來趨勢:如今各家都在這點上做不斷地優(yōu)化,同時開始向多模語音的方向發(fā)展,但是多模交互在當前技術階段,存在支持范圍受限、誤喚醒率高、成本較高等問題,語音喚醒詞在一段內,仍是市場主流的選擇。
未來隨著VPA、主題世界、大模型對話在車機上的應用,喚醒詞可能會隨著語音風格等有著更加有趣的變化。比如“你好,嬛嬛”,“華妃在哪”。
品牌價值:語音喚醒詞在一定程度上也對品牌的塑造有一定的價值,目前各家的默認喚醒詞通常都為語音助手的名字“理想同學”、“小琪”、“小P”等等, 在日常語音使用中,不斷深化用戶對品牌的認知。
本文由@加飯 原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!