一龍雙太子,星紀(jì)元和智界語音能力如何?

0 評論 562 瀏覽 2 收藏 14 分鐘

在人工智能技術(shù)迅猛發(fā)展的今天,汽車行業(yè)正不斷加大在車輛AI能力提升上的投入。然而,不同品牌和型號的車輛在AI技術(shù)運用上展現(xiàn)出參差不齊的性能。針對星紀(jì)元ES和智界S7這兩款極為相似的車型,本文將以語音助手為切入點,探究這些智能語音特性如何具體影響用戶在出行安全和駕乘體驗方面的實際提升。

語音助手的設(shè)計初心在于簡化人們的日常操作與互動。

它讓用戶即使在忙碌或視線受阻的情況下,也能輕松執(zhí)行各種任務(wù),極大提升了車與人的交互效率。

對于汽車制造商而言,語音助手不僅是座艙用戶體驗的一張王牌,更是實現(xiàn)個性化服務(wù)與產(chǎn)品獨特性的核心所在。

對消費者而言,語音助手代表著便捷、前沿科技和個性化表達的象征,它不僅迎合了智能車生活的趨勢,也能在確保行車安全與便捷性方面發(fā)揮著重要作用。

因此,車載語音助手已成為現(xiàn)階段新能源汽車領(lǐng)域中不可或缺的重要功能。

一、工作流程

智能座艙的語音系統(tǒng)(VOS)是智能座艙的一個重要組成部分,它基于語音交互技術(shù),為用戶提供車內(nèi)環(huán)境下的語音控制服務(wù)。

VOS系統(tǒng)包括語音識別(Automatic Speech Recognition, ASR)、自然語言理解(Natural Language Understanding, NLU)、對話管理(Dialogue Management, DM)、語音合成(Text-to-Speech, TTS)等技術(shù),可以代替實現(xiàn)車輛控制、地圖導(dǎo)航、音樂及多媒體應(yīng)用、系統(tǒng)設(shè)置等功能的多種人車觸摸式交互。

語音指令的使用可以解放手指,無需偏移視線,提高行車安全。并且整個系統(tǒng)包括車端系統(tǒng)、云端系統(tǒng)、語音運營管理平臺和訓(xùn)練與分析模塊,可通過運營平臺和訓(xùn)練分析,對系統(tǒng)進行優(yōu)化和改進。

二、競品選擇與分析

1. 競品選擇

首先,語音助手在爭奪用戶關(guān)注方面的重要性日益凸顯。

從2019年至2023年1-9月,車載語音的裝配數(shù)量和裝配率持續(xù)攀升。2023年前三個季度,前裝車載語音的搭載量接近1200萬輛,裝配率高達80%。

此外,下圖也清晰地展示了近幾年汽車語音交互領(lǐng)域?qū)@麛?shù)量的激增。

其次,從公開技術(shù)信息來看,華為的盤古大模型于2023年9月發(fā)布,擁有千億級別的參數(shù)規(guī)模,特別強化了對中文語言的理解。

而科大訊飛的星火大模型于2023年5月推出,雖然具體參數(shù)規(guī)模尚未公開,但側(cè)重于特定場景下的實際應(yīng)用效果。

且截至2024年2月,星紀(jì)元ES和智界的全國銷售量分別為482和784輛,市場反響相當(dāng)。

而奇瑞作為資深國產(chǎn)汽車制造商,華為作為互聯(lián)網(wǎng)技術(shù)巨頭,以及科大訊飛作為語音識別行業(yè)的領(lǐng)導(dǎo)者,三者在不同商業(yè)模式下的合作催生了兩種截然不同的車型。

從車輛定位到產(chǎn)品賣點,它們各有特色。

因此,本文將基于智界S7與星紀(jì)元ES這兩款車型的語音助手,探討在實際功能應(yīng)用上的表現(xiàn),以及語音助手將如何發(fā)揮其作用。

2. 定位分析

智界S7與星紀(jì)元ES均由奇瑞所打造,不同點在于智界所搭載的車載系統(tǒng)是華為最新的鴻蒙座艙系統(tǒng),而星紀(jì)元ES搭載的是奇瑞聯(lián)合科大訊飛共同研發(fā)的大模型車載系統(tǒng)LION OS。

3. 語音部分能力分析

在筆者本人的用戶畫像的基礎(chǔ)上,結(jié)合語音助手的必要性與功能性,筆者簡單挑選了幾個主要場景類別,并進一步細化到具體的使用場景

這些場景涵蓋了語音助手的核心能力項,旨在評估智界S7與星紀(jì)元ES的語音助手在實際應(yīng)用中的表現(xiàn)。并通過對這些細分場景,筆者將設(shè)計出一套體驗測評項目,并制定相對應(yīng)的評分標(biāo)準(zhǔn),以實現(xiàn)對語音助手體驗的量化評估。

語音助手基本能力項

4. 評分標(biāo)準(zhǔn)

  • 交互使用便利性:確保用戶通過語音助手進行交互的便利性,使其操作比傳統(tǒng)的觸摸操作更為簡單快捷。這一指標(biāo)衡量的是語音助手能對用戶所說的話給予反饋用戶在使用語音助手時,能否以更少的步驟和更高的效率完成任務(wù)。
  • 指令翻譯準(zhǔn)確性:優(yōu)秀的語音助手必須能夠準(zhǔn)確理解用戶的語音指令,這包括對語句意思的準(zhǔn)確把握。這一指標(biāo)衡量的是語音助手能夠明白用戶的意圖。
  • 指令執(zhí)行完整性:除了理解指令,語音助手還應(yīng)當(dāng)能夠徹底執(zhí)行用戶的指令,并在任務(wù)完成后提供明確的反饋,讓用戶知道操作結(jié)果。這一指標(biāo)衡量的是語音助手能對用戶所說的話給予反饋。
  • 指令結(jié)果可用性:是指指令執(zhí)行后產(chǎn)生的結(jié)果是否符合用戶的預(yù)期。這一指標(biāo)衡量的是用戶對語音助手的信任度和滿意度。
  • 語音助手?jǐn)M人化:主要是為了提升用戶體驗,使語音助手具備擬人化的特質(zhì),讓用戶愿意與之交流,并在人與車的交互中更愿意使用語音助手。這一指標(biāo)衡量的是用戶使用語音助手的意愿程度。
  • 可持續(xù)發(fā)展性:通過集成先進的AI技術(shù),語音助手可以實現(xiàn)長期的發(fā)展,使助手能夠?qū)W習(xí)并適應(yīng)用戶的習(xí)慣,實現(xiàn)與用戶的共同成長。這一指標(biāo)衡量的是語音助手的自我迭代。

以上評判標(biāo)準(zhǔn)具體量化標(biāo)準(zhǔn)劃分采用5分滿分制,設(shè)置三個等級,分別為:及格(3分)、良好(4分)、優(yōu)秀(5分)。在后續(xù)的體驗中會以該標(biāo)準(zhǔn)對語音助手進行評分,最后匯總得出結(jié)果。

三、產(chǎn)品體驗

1. 體驗過程

筆者對智界S7與星紀(jì)元ES的語音助手進行了多次的實車體驗,累計制作了約7GB的視頻素材,通過模擬日常使用場景,詳細記錄了語音助手的工作流程和互動體驗,體驗記錄部分截圖如下:

2. 體驗小結(jié)

盡管兩款車型在技術(shù)基礎(chǔ)上有所共通,但在實際應(yīng)用中,即使是同一車型,其語音交互功能的穩(wěn)定性與表現(xiàn)力也是參差不齊,具體表現(xiàn)如下

  • 便利性:兩車在基礎(chǔ)語音喚醒和車控指令執(zhí)行上均達到行業(yè)標(biāo)準(zhǔn),但在處理語音助手無法直接執(zhí)行的功能時,智界S7的觸摸操作邏輯更為用戶友好,提供了更友好的保底策略;
  • 準(zhǔn)確性:星紀(jì)元ES可能得益于科大訊飛的技術(shù)背景和芯片算力,在語音指令的NLU理解和執(zhí)行速度上稍優(yōu)于智界S7,但兩者均屬于實用級別;
  • 完整性:產(chǎn)品定義上的差異導(dǎo)致兩車在完整性方面表現(xiàn)不同。智界S7相對保守,對于復(fù)雜指令的執(zhí)行和反饋不夠充分。相反,星紀(jì)元ES展現(xiàn)出更全面的“助理”角色,能夠準(zhǔn)確執(zhí)行并給予用戶明確反饋;
  • 可用性:在指令執(zhí)行結(jié)果的可靠性方面,智界S7更為穩(wěn)妥,僅執(zhí)行確認能夠完成的任務(wù),避免了錯誤執(zhí)行。星紀(jì)元ES雖然會嘗試執(zhí)行所有指令,但有時會導(dǎo)致結(jié)果偏離用戶本意。
  • 擬人性:星紀(jì)元ES在擬人性方面顯著領(lǐng)先,提供豐富的語音助手形象,而智界S7的語音助手形象較為單一(筆者在體驗過程中意外發(fā)現(xiàn)銀河E8的語音助手還可以更換人物聲音)。
  • 發(fā)展性:星紀(jì)元ES的語音助手能夠根據(jù)用戶使用習(xí)慣推薦高頻指令,并調(diào)整推薦內(nèi)容,顯示出較強的學(xué)習(xí)和發(fā)展能力。相比之下,盡管智界S7屬于后發(fā),但在發(fā)展性上并未體現(xiàn)出明顯優(yōu)勢。

綜上所述,星紀(jì)元ES在準(zhǔn)確性、完整性、擬人性和發(fā)展性方面占優(yōu),而智界S7在便利性和可用性上表現(xiàn)出色。

四、總結(jié)與改進

在深入體驗了導(dǎo)航、車輛控制及多媒體的語音交互功能后,我發(fā)現(xiàn)智界與星紀(jì)元在語音交互設(shè)計上均展現(xiàn)出一定程度的“擰巴”,但各自的策略差異使這種“擰巴”呈現(xiàn)出不同面貌。同時,二者在提高人車交互效率方面也展現(xiàn)出不相上下的實力。

智界的“擰巴”主要表現(xiàn)為過于嚴(yán)謹(jǐn)?shù)牟僮鬟壿?,有時顯得不夠智能。例如,盡管用戶記住了復(fù)雜菜單下的指令關(guān)鍵詞,系統(tǒng)卻無法直接執(zhí)行,仍需用戶手動導(dǎo)航至相應(yīng)指令層級界面再語音操作,但語音助手在處理同級頁面其他操作時卻又可以直接響應(yīng)。在收藏地點的過程中,智界雖支持通過語音助手設(shè)置收藏地點,但卻缺少執(zhí)行指令后的反饋。并且智界擁有華為支付優(yōu)勢,但鴻蒙系統(tǒng)在第三方應(yīng)用支付流程上的優(yōu)化仍有待提升。

而星紀(jì)元的“擰巴”則體現(xiàn)在其語音助手的過度主動上。雖然其提供了類似nomi的擬人化交流體驗,符合“伴我成長”的產(chǎn)品理念,但有時會擅自更改用戶指令,導(dǎo)致執(zhí)行結(jié)果與用戶初衷背道而馳。

在新能源汽車迅猛發(fā)展的當(dāng)下,智界與星紀(jì)元的“擰巴”現(xiàn)象,在我看來,是完全可以理解的,因為這些在體驗過程中遇到的問題,大多可以通過后續(xù)的OTA升級得到解決和優(yōu)化。

但從產(chǎn)品完成度來看,星紀(jì)元在產(chǎn)品定位、運營宣傳以及具體功能實現(xiàn)上都略勝一籌,這也讓我對其語音系統(tǒng)更加青睞。

而對于兩車未來的發(fā)展方向,我認為星紀(jì)元應(yīng)著重加強自然語言理解(NLU)的培訓(xùn),以提升對用戶意圖的精準(zhǔn)識別能力。至于智界,則應(yīng)當(dāng)在對話管理(DM)和文本轉(zhuǎn)語音(TTS)技術(shù)方面注入更多人性化的元素,從而使得交互體驗更加自然和流暢。

本文由@Siom 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!