深度剖析豆包AI耳機(jī)Ola friend
在各家都還在做APP尋找大模型的使用場(chǎng)景時(shí),字節(jié)已經(jīng)開發(fā)了與AI大模型結(jié)合的硬件產(chǎn)品——Ola friend。雖然不是第一個(gè),但字節(jié)的這款硬件產(chǎn)品,有何獨(dú)特之處?這篇文章,我們看看作者的分析。
上次分享了《深度剖析字節(jié)豆包AI》這篇文章后,比較有趣的是事情是,收到了很多大廠圈的朋友的反饋,其中也包括字節(jié)內(nèi)部的同學(xué),一方面文章在幫助他們面試字節(jié)AI相關(guān)崗位的時(shí)候發(fā)揮了很大作用,其次是對(duì)于AI產(chǎn)品和商業(yè)不太熟悉的同學(xué),讀完也會(huì)有些收獲,這些熱情反饋給了三白更多的創(chuàng)作熱情,今天分享的是字節(jié)最近剛推出的另外一個(gè)AI產(chǎn)品:豆包AI耳機(jī)Ola Friend。
全文累計(jì)1.7萬字,閱讀預(yù)計(jì)需要20分鐘,內(nèi)容包括七個(gè)探討主題,覆蓋產(chǎn)品、行業(yè)、用戶需求、競(jìng)品、商業(yè)等多個(gè)領(lǐng)域,為提升大家的閱讀效率,全篇內(nèi)容我整理了一個(gè)腦圖如下:
為什么要寫這篇文章?
大模型在應(yīng)用端的落地,是整個(gè)行業(yè)都在關(guān)注的問題。
過去一年AI在軟件端的落地說實(shí)話并沒有呈現(xiàn)明星應(yīng)用大爆發(fā)的情況,一方面國(guó)內(nèi)只有少數(shù)幾個(gè)產(chǎn)品在大廠流量和大量投放的情況下達(dá)到月活千萬級(jí)別;另一方面有大量的AI應(yīng)用面臨成本比較高且商業(yè)化變現(xiàn)困難的難題;逐漸的大家也開始把目光轉(zhuǎn)移到AI硬件,大家普遍的認(rèn)知都認(rèn)為,相比購(gòu)買一個(gè)云端的AI軟件應(yīng)用,用戶更愿意為一個(gè)看得見摸得著的AI硬件產(chǎn)品付費(fèi);10月字節(jié)的豆包耳機(jī)Ola Friend發(fā)布之后,國(guó)內(nèi)投資圈開始掀起對(duì)于AI硬件領(lǐng)域的關(guān)注熱潮。
從產(chǎn)品發(fā)布后的第一天開始,三白便一直保持著對(duì)豆包AI耳機(jī)的關(guān)注,并且還有幸參加了字節(jié)官方組織的“智能硬件x大模型”行業(yè)解決方案交流活動(dòng),我個(gè)人十分認(rèn)可未來AI在硬件領(lǐng)域的應(yīng)用,隨著目前大模型、芯片、音視頻等技術(shù)的發(fā)展,能提供良好的產(chǎn)品體驗(yàn)的AI硬件已經(jīng)是一個(gè)觸手可及的事情,為了讓自己能夠更加深入的了解這個(gè)行業(yè),我花了將近1周的時(shí)間整理輸出了這篇研究分析。
之所以開始關(guān)注AI硬件領(lǐng)域,與自身相關(guān)的,一方面是在從事了8年的互聯(lián)網(wǎng)軟件應(yīng)用領(lǐng)域的工作后,深深的覺得,純軟件應(yīng)用領(lǐng)域的發(fā)展已經(jīng)有瓶頸了,這個(gè)行業(yè)已經(jīng)進(jìn)入成熟期,潛在的機(jī)會(huì)也越來越少;相比之下,我更加認(rèn)同“軟硬一體”的產(chǎn)品領(lǐng)域的發(fā)展,所以好好研究一下說不定以后能夠在這個(gè)領(lǐng)域找到下一個(gè)更好的創(chuàng)業(yè)、投資、或者求職的機(jī)會(huì);我一直都認(rèn)可一個(gè)說法,如果你認(rèn)可一個(gè)行業(yè),就應(yīng)該搞清楚它,并通過創(chuàng)業(yè)、投資,以及入職一家公司的方式去追逐這個(gè)行業(yè),它能給自己帶來紅利。
另一方面,現(xiàn)在和我一樣想要了解清楚AI硬件行業(yè)的人也越來越多了,所以我也想借著自己的文筆和研究,花點(diǎn)時(shí)間輸出一點(diǎn)東西,幫助一下大家。
文章適合哪些朋友?
- 有意愿從事AI硬件行業(yè),或者想要入職像華為、OPPO、小米、Vivo等手機(jī)廠商,或者其他國(guó)內(nèi)知名消費(fèi)硬件廠商、大廠Ai硬件團(tuán)隊(duì)的朋友;
- 有意愿投資AI硬件行業(yè),或者想要在該領(lǐng)域做創(chuàng)業(yè)項(xiàng)目的朋友;
- 正在研究AI硬件行業(yè)或者具體產(chǎn)品的研究人員;
我將分享哪些內(nèi)容?
概括起來,我將分享如下7個(gè)主題:
- 產(chǎn)品概述:分享產(chǎn)品的基本信息、交互、使用場(chǎng)景、用戶反饋、供應(yīng)鏈等;
- 產(chǎn)品定位思考:思考如何看待字節(jié)布局AI,以及豆包AI耳機(jī)的產(chǎn)品定位;
- 所在行業(yè)分析:分享AI硬件行業(yè)賽道布局、智能耳機(jī)行業(yè)賽道布局和行業(yè)動(dòng)態(tài)信息等;
- 用戶需求思考:分享消費(fèi)者對(duì)智能耳機(jī)和AI耳機(jī)的訴求,以及豆包AI耳機(jī)的滿足情況,技術(shù)挑戰(zhàn)等;
- 產(chǎn)品競(jìng)爭(zhēng)分析:分享競(jìng)品動(dòng)態(tài),以及對(duì)字節(jié)在AI耳機(jī)的競(jìng)爭(zhēng)力思考;
- 商業(yè)模式思考:思考AI耳機(jī)的商業(yè)模式、利潤(rùn)空間問題;
- 產(chǎn)品局限和未來發(fā)展思考;
聲明:其中大部分內(nèi)容輸出來自于個(gè)人思考、圈內(nèi)朋友的交流和討論,以及個(gè)人通過廣泛收集大量的高質(zhì)量的參考資料,通過AI效率工具快速整理輸出。
一、產(chǎn)品概述
1.1 產(chǎn)品基本信息
字節(jié)豆包于 10 月 10 日發(fā)布首款 AI 智能體耳機(jī) Ola Friend,Ola Friend接入豆包大模型,與豆包 APP 深度結(jié)合,用戶戴上耳機(jī)后,無需打開手機(jī),便能通過語音喚起豆包進(jìn)行對(duì)話。目前,Ola Friend 已經(jīng)在各大電商平臺(tái)開啟售賣,售價(jià) 1199 元。
Ola Friend是一款OWS開放式耳機(jī),單耳僅重6.6克,設(shè)計(jì)上簡(jiǎn)潔而美觀,擁有多種配色和充電倉(cāng)選擇。同時(shí)還搭載了 5 核音頻芯片,支持專業(yè)聲音解析和智能降噪算法,保證耳機(jī)本身的優(yōu)秀音質(zhì)。
1.2 產(chǎn)品交互形態(tài)
- 豆包AI耳機(jī)首先需要連接手機(jī)端豆包APP,連接后才可使用,耳機(jī)和手機(jī)APP的連接方式是通過藍(lán)牙建立連接,所以產(chǎn)品的使用需要確保耳機(jī)和手機(jī)在藍(lán)牙連接范圍之內(nèi);
- 在藍(lán)牙連接距離內(nèi),使用時(shí),可以脫離手機(jī),通過觸摸或語音指令即可喚醒豆包APP,然后使用豆包APP的功能;
- 本質(zhì)上,所有的AI功能其實(shí)是在APP端完成的,耳機(jī)只是作為一個(gè)接收APP輸出音頻內(nèi)容信息的載體,耳機(jī)本身并沒有部署端側(cè)模型,耳機(jī)本身內(nèi)置的芯片也主要是解決耳機(jī)自身音頻識(shí)別、音頻轉(zhuǎn)碼、降噪等功能,并不設(shè)計(jì)大模型的算力消耗;
大致繪畫一下使用過程中數(shù)據(jù)交互的邏輯如下:
- 用戶通過聲音發(fā)出語音質(zhì)量,耳機(jī)通過識(shí)別傳感器獲取音頻信息,然后將信息通過藍(lán)牙傳遞給豆包APP;
- 豆包APP將語音轉(zhuǎn)文字后輸入給大模型,大模型生成問答結(jié)果輸出給豆包APP;
- 豆包APP將文本內(nèi)容合成為語音之后,見語音內(nèi)容發(fā)送給耳機(jī),耳機(jī)通過麥克風(fēng)播放器播放聲音;
1.3 產(chǎn)品核心功能和使用場(chǎng)景有哪些?
目前豆包AI耳機(jī)實(shí)際上就是繼承了豆包APP語音相關(guān)的應(yīng)用功能,所以所有能夠通過語音在豆包APP上使用的功能,理論上通過AI耳機(jī)也能支持。
盡管如此,ola friend官方主要主打作為賣點(diǎn)的應(yīng)用場(chǎng)景主要包括如下5個(gè):
- 通用的知識(shí)問答和語音聊天:整體能力和手機(jī)端的豆包智能體差不多,但是AI耳機(jī)生成結(jié)果和APP端生成結(jié)果稍微有些差異,有可能用了另一個(gè)更小的模型用于支持AI耳機(jī)內(nèi)容的生成;
- 口語陪練:支持口語陪練能力;
- 情感陪聊:支持情感陪伴語音聊天;
- 旅行導(dǎo)游:支持旅行導(dǎo)游講解、旅游攻略推薦、餐飲店鋪推薦等;
- 聽音樂:支持調(diào)用調(diào)用汽水音樂的數(shù)字音樂資源,但是版權(quán)資源有限制,部分付費(fèi)版權(quán)內(nèi)容需要付費(fèi)后才能播放,官方有贈(zèng)送一個(gè)月的音樂會(huì)員;
從目前主打的使用場(chǎng)景上看,其應(yīng)用領(lǐng)域覆蓋了搜索問答、教育學(xué)習(xí)、生活服務(wù)、休閑娛樂、情感陪伴著幾個(gè)場(chǎng)景雖然目前都主打了一個(gè)單一的場(chǎng)景,但是相信未來官方會(huì)支持越來越多的使用場(chǎng)景的功能。
1.4 豆包AI耳機(jī)未來可能還會(huì)有哪些使用場(chǎng)景?
雖然目前豆包AI耳機(jī)只是主打了幾個(gè)使用場(chǎng)景,但是個(gè)人認(rèn)為,未來AI耳機(jī)可以結(jié)合的應(yīng)用場(chǎng)景,將會(huì)是充滿想象空間的,它可以覆蓋我們的生活、學(xué)習(xí)教育、商務(wù)辦公等多個(gè)方面的應(yīng)用。
AI耳機(jī)在生活應(yīng)用場(chǎng)景
- 本地生活服務(wù)推薦:比如附近餐飲商家推薦;
- 個(gè)人助理:比如日程安排、出行導(dǎo)游;
- 休閑娛樂:包括聽音樂、聽資訊新聞等;
- 出行:比如出行導(dǎo)航、打車等;
- 運(yùn)動(dòng)健康:比如運(yùn)動(dòng)健身、健康咨詢、生理診斷等;
- 智能家居:AI耳機(jī)與其他智能設(shè)備無縫連接,實(shí)現(xiàn)語音控制和互動(dòng),可以通過耳機(jī)直接控制家中的燈光、溫度和家電等設(shè)備;
學(xué)習(xí)教育場(chǎng)景
- 百科問答:覆蓋K12,職場(chǎng)等多個(gè)問答場(chǎng)景;
- 口語學(xué)習(xí):包括口語陪練,口語學(xué)習(xí)助手等;
辦公場(chǎng)景
- 電話和會(huì)議記錄;
- 錄音筆;
- 翻譯:語音同傳;
最近個(gè)人也有留意到,豆包APP已經(jīng)開始做語音錄制等功能,這個(gè)能力和豆包AI耳機(jī)的應(yīng)用可能存在密切的關(guān)聯(lián),或許AI耳機(jī)后續(xù)也能支持會(huì)議耳機(jī)的產(chǎn)品能力,以上這些場(chǎng)景我們可以保持期待一下。
1.5 豆包AI耳機(jī)的用戶體驗(yàn)反饋如何?
正向反饋:在接觸過大部分使用過豆包AI耳機(jī)的朋友,普遍他們會(huì)表達(dá)的正向反饋主要聚焦如下3點(diǎn):
1)豆包的語音功能具備不錯(cuò)的情感交互的體驗(yàn),陪伴感比較強(qiáng);
“如果你使用過 Ola friend 這款產(chǎn)品,就會(huì)體驗(yàn)到一種「aha moment」,就是那種強(qiáng)烈的陪伴感,就像身邊有人在跟你低語交流。這種陪伴感正是吸引用戶的重要特質(zhì)之一”
2)佩戴輕便無感;“佩戴還很無感,從下午 3 點(diǎn)一直戴到晚上 9 點(diǎn)也沒有負(fù)擔(dān),好幾次走在路上沒有播放聲音的時(shí)候,還要手動(dòng)摸一下才能確定戴著耳機(jī)”
3)超長(zhǎng)的續(xù)航能力;“另外值得一提的還有續(xù)航表現(xiàn),6 個(gè)小時(shí)中度使用,兩只耳機(jī)耗電都不到 50%。同時(shí)到手體驗(yàn)兩天多,耳機(jī)盒還有 14%的電量”
負(fù)向反饋:而從小紅書等平臺(tái)中可以看到,大部分豆包AI耳機(jī)的使用者,普遍反饋容易遭受環(huán)境音影響,降噪和音質(zhì)效果不太好,響應(yīng)慢,以及和豆包APP的連接故障等問題;
- 拾音效果:拾音效果還不錯(cuò),語音轉(zhuǎn)文字的效果是可以滿足需求的;但是容易受環(huán)境干擾,不能精準(zhǔn)識(shí)別使用用戶主體,可能會(huì)讓豆包誤把他人的聲音當(dāng)作使用者的聲音。
- 實(shí)時(shí)性和流暢度:反應(yīng)還比較慢,響應(yīng)速度有點(diǎn)長(zhǎng);
- 音質(zhì)要求:暫時(shí)沒有非常強(qiáng)的音質(zhì)體驗(yàn);
- 降噪能力:降噪效果一般,不過這也正常,主打的是一個(gè)開放式耳機(jī),還要支持良好的拾音效果,本來就難以和降噪的功能平衡;
- 語音互動(dòng)體驗(yàn):互動(dòng)體驗(yàn)生成的結(jié)果可能和豆包APP還有些差距;
整體而言,個(gè)人認(rèn)為,目前Ola Friend交付的AI耳機(jī)還是能帶來一些驚喜,但是肯定還存在很多體驗(yàn)層面的問題,此前有些朋友反饋下單之后需要2周以上的時(shí)間才能發(fā)貨,可能也因?yàn)槟壳斑€有不少問題,官方還需要加快做產(chǎn)品迭代和問題修復(fù)。
1.6 供應(yīng)鏈情況
圈子內(nèi)的朋友可能會(huì)對(duì)豆包的供應(yīng)鏈情況也比較感興趣,以下針對(duì)豆包AI耳機(jī)不同的元器件的供應(yīng)商和產(chǎn)品型號(hào)做了一下整理,信息參考來自公眾號(hào)“我愛音頻網(wǎng)”的文章,筆者非常專業(yè),真的購(gòu)買了一個(gè)耳機(jī)并詳細(xì)的拆解了其中的每一個(gè)元器件,其專業(yè)程度讓人佩服!
1.7 字節(jié)內(nèi)部組織架構(gòu)情況
據(jù)了解,Ola friend是字節(jié)此前收購(gòu)的耳機(jī)硬件企業(yè)oladance聯(lián)合字節(jié)flow AI團(tuán)隊(duì)共同打造;Oladance是一個(gè)整機(jī)廠商,負(fù)責(zé)耳機(jī)的整體設(shè)計(jì),開模和生產(chǎn),有自己的生產(chǎn)工廠,其中芯片等硬件設(shè)施通過供應(yīng)鏈支持。
二、產(chǎn)品定位思考
2.1.字節(jié)為何要布局AI硬件?
事實(shí)上,字節(jié)搞硬件的決心一直都沒有停止過,從之前收購(gòu)PICO,Oladance,錘子手機(jī),至今一直都沒有放棄過對(duì)硬件領(lǐng)域的嘗試,如今重新開啟AI硬件的探索,其目的為何,個(gè)人思考如下:
- 做硬件的核心目的還是為了掌握用戶的使用入口:作為一個(gè)從掌握核心流量入口中獲利的一家公司,字節(jié)很清楚掌握用戶的使用時(shí)間和場(chǎng)景的價(jià)值,所以,硬件是從另一個(gè)維度牢牢的鎖定用戶的使用入口的重要方式;
- AI硬件也是大模型的核心應(yīng)用領(lǐng)域之一:大模型的應(yīng)用并不僅僅局限于軟件應(yīng)用,另一個(gè)重要的領(lǐng)域的硬件領(lǐng)域,或許在字節(jié)制定大模型應(yīng)用頂層設(shè)計(jì)的時(shí)候,就已經(jīng)綜合考慮的覆蓋軟件和硬件兩側(cè),而豆包AI耳機(jī)是開啟AI硬件的第一步;
- AI軟件應(yīng)用商業(yè)化受阻,AI硬件或許更容易獲得商業(yè)化成功:從目前國(guó)內(nèi)的情形看,軟件端的商業(yè)化真的很困難,而更多用戶對(duì)AI硬件表現(xiàn)出濃厚的興趣,付費(fèi)意愿更強(qiáng);
2.2.豆包AI耳機(jī)的產(chǎn)品定位是什么?
寫這篇文章的時(shí)候,我一直在想,怎么去形容Ola friend的產(chǎn)品定位,它到底想做一個(gè)什么產(chǎn)品?因?yàn)閺亩拱壳暗墓δ苌峡?,它可以干很多事情,有很多的?yīng)用場(chǎng)景,讓人一時(shí)想不到其產(chǎn)品定位,但是回看其產(chǎn)品名稱Ola Friend,便也逐步明白其產(chǎn)品的理念和定位:
產(chǎn)品價(jià)值理念:你的隨身陪伴的朋友,主打陪伴和情緒價(jià)值官方?jīng)]有把它稱為你的個(gè)人助理assitant之類的,所以或許官方也沒有打算定位為一個(gè)提升效率的工具,“朋友”更多的像是定位為一個(gè)陪伴你的工具,所以或許定位為一個(gè)陪伴產(chǎn)品,主打?yàn)橛脩籼峁┣榫w價(jià)值,是這款產(chǎn)品的核心定位;
產(chǎn)品的生態(tài)定位:AI生態(tài)的延伸
- 從“應(yīng)用-數(shù)據(jù)-服務(wù)”向“硬件-數(shù)據(jù)-服務(wù)”轉(zhuǎn)型:過往字節(jié)AI主要還是聚焦在軟件端應(yīng)用,通過軟件集成數(shù)據(jù)和服務(wù),提供AI應(yīng)用服務(wù),AI耳機(jī)的出現(xiàn),標(biāo)志著字節(jié)AI向“硬件-數(shù)據(jù)-服務(wù)”轉(zhuǎn)型拓展的開始;
- 從APP喚醒AI,到隨時(shí)隨地喚起AI:字節(jié)或許想要把豆包做成另外一個(gè)超級(jí)APP,打造豆包系列的應(yīng)用矩陣;AI耳機(jī)可能是豆包應(yīng)用的使用延伸之一,未來可能還會(huì)有更多的豆包系列的產(chǎn)品,我們現(xiàn)已經(jīng)看到,豆包系列的產(chǎn)品還有豆包愛學(xué)(教育)、豆包Marscode(編碼),根據(jù)相關(guān)消息,內(nèi)部可能還在做豆包訂餐、豆包體育等相關(guān)的應(yīng)用;
目標(biāo)用戶和市場(chǎng)需求:從目前產(chǎn)品主打的賣點(diǎn)和能力上,個(gè)人認(rèn)為產(chǎn)品主要面向如下用戶群體
- 一二線城市的城市年輕人和職場(chǎng)群體:他們尋求的是便捷、高效且智能的設(shè)備體驗(yàn),同時(shí),作為焦慮集中人群,他們也是更加需要情感陪伴和情緒價(jià)值的群體;
- AI科技圈的發(fā)燒友用戶:對(duì)他們而言,更多的是滿足其好奇和“酷”的需求,為AI的重度愛好者;
- 三四線城市的娛樂偏好人群:下沉市場(chǎng)用戶,更多追求的是產(chǎn)品的娛樂價(jià)值和情感陪伴價(jià)值,滿足他們打發(fā)空閑時(shí)間的“消遣”;
產(chǎn)品核心功能和差異化價(jià)值:從產(chǎn)品目前的特點(diǎn)看,硬件層面其產(chǎn)品核心主打的差異化價(jià)值是開放式、無感便攜、續(xù)航能力;從軟件層面則主打?qū)崟r(shí)語音交互式使用、陪伴感音質(zhì);相比傳統(tǒng)智能耳機(jī)而言,弱化對(duì)降噪能力、高保真音質(zhì)等的追求,不做全面能力強(qiáng)大的耳機(jī),耳機(jī)聚焦單點(diǎn)能力;
價(jià)格定位:目前的定價(jià)是1199元,該定價(jià)在耳機(jī)的整體價(jià)格段里面屬于中高端價(jià)位,也就是說,其價(jià)格定位聚焦在中高端型的耳機(jī);雖然目前該定價(jià)很多用戶反饋太貴了,但是從品牌方提供的產(chǎn)品和服務(wù)的成本而言,可能產(chǎn)品本身的利潤(rùn)也不高,除了硬件本省的成本,用戶持續(xù)的使用AI服務(wù),還有大模型和語音合成技術(shù)的成本,這些目前都沒有收費(fèi),讓用戶免費(fèi)使用,只能說成體技術(shù)和服務(wù)成本就比較高,所以這個(gè)定價(jià)這么貴也能理解。
2.3.字節(jié)未來還會(huì)布局哪些AI硬件?
根據(jù)目前關(guān)注到的消息,預(yù)計(jì)未來字節(jié)可能在如下幾個(gè)硬件領(lǐng)域會(huì)有AI的應(yīng)用布局:
- 穿戴類設(shè)備:AI耳機(jī)(Oladance業(yè)務(wù))、AI眼鏡(PICO業(yè)務(wù))、AI手機(jī)(錘子手機(jī)業(yè)務(wù))
- 教育硬件:AI學(xué)習(xí)機(jī)、機(jī)器狗(豆包愛學(xué)業(yè)務(wù))
以上信息僅為個(gè)人猜測(cè),并未得到證實(shí)僅供參考,參考新來源如下:
“據(jù)悉,字節(jié)跳動(dòng)同時(shí)還在探索 AI 眼鏡方向,可能會(huì)投資一家新公司或組建內(nèi)部團(tuán)隊(duì),并且有一名互聯(lián)網(wǎng)公司的前大模型核心人物已在與字節(jié)合作研發(fā) AI 眼鏡。
此前在 2024 年 5 月舉行的火山引擎 Force 原動(dòng)力大會(huì)上,字節(jié)跳動(dòng)曾對(duì)外展示了 3 款聯(lián)合外部合作方開發(fā)的 AI 硬件產(chǎn)品,其中包括機(jī)器狗、學(xué)習(xí)機(jī)以及學(xué)習(xí)機(jī)器人。
字節(jié)跳動(dòng)曾在 2021 年底投資 AI 技術(shù)及智能眼鏡研發(fā)商「李未可」,2024 年 7 月,李未可與博士宣布在全國(guó) 50 家博士眼鏡門店線下首發(fā)李未可的 Meta Lens AI 眼鏡?!?/p>
三、所在行業(yè)分析:AI硬件、智能耳機(jī)
3.1 AI硬件行業(yè)賽道布局和核心玩家
根據(jù)個(gè)人了解,目前國(guó)內(nèi)外在AI硬件的上布局,主要聚焦在AI手機(jī)、穿戴類設(shè)備、教育硬件、辦公硬件、智能家居和車載設(shè)備領(lǐng)域;其中穿戴類設(shè)備自然是受關(guān)注度最大的領(lǐng)域,而AI手機(jī)、AI耳機(jī)自然屬于AI硬件行業(yè)領(lǐng)域目前最受關(guān)注的兩大領(lǐng)域,各個(gè)領(lǐng)域目前的子賽道和國(guó)內(nèi)外主要玩家情況如下:
1)AI手機(jī):AI手機(jī)是目前廣大消費(fèi)者比較期待的AI硬件領(lǐng)域,繼蘋果不斷地釋放AI信號(hào)之后,我們暫時(shí)沒有看到有實(shí)質(zhì)性的蘋果AI產(chǎn)品出來,反而是國(guó)內(nèi)的手機(jī)最近觀看了OPPO X8自帶的手機(jī)AI功能后感覺開始看到一些AI手機(jī)的應(yīng)用雛形,X8在一鍵識(shí)屏以及AI消除、去拖影、去反光等圖像AI方面的表現(xiàn)讓人煥然一新,感覺AI手機(jī)終于開始到來的感覺;不過目前大家都還是聚焦在圖像和攝影領(lǐng)域,我們還是更期待手機(jī)AI助手和APP Agent能帶來更多創(chuàng)新;
2)穿戴類AI硬件:賽道包括主要以AI耳機(jī)、AI眼鏡、AI配飾、AI智能手表等領(lǐng)域,具體如下
- AI耳機(jī):Ola friend的發(fā)布,讓整個(gè)投資圈和AI圈開始更加關(guān)注AI硬件領(lǐng)域,讓大家終于看到Chatbot能夠在耳機(jī)端使用,大家暢想的AI耳機(jī)終于可以落地;同時(shí),國(guó)內(nèi)像訊飛也推出了AI會(huì)議耳機(jī),主打會(huì)議錄制和會(huì)議AI助手功能;海外目前也關(guān)注到,三星也推出了AI 耳機(jī) Galaxy Buds3 Pro;
- AI眼鏡:在AR眼鏡發(fā)展不瘟不火的同時(shí),目前整個(gè)硬件行業(yè)大家開始把目光轉(zhuǎn)移到AI眼鏡上,這種在眼鏡上搭配耳機(jī),把AI眼鏡和AI耳機(jī)組合在一起的感覺,讓人開始真的感受到一個(gè)便攜式穿戴的“第二大腦”真的可以實(shí)現(xiàn);Meta和Ray-Ban聯(lián)合推出的雷朋AI眼鏡推出之后,讓大家開始把注意力關(guān)注到AI眼鏡領(lǐng)域,目前國(guó)內(nèi)包括華為等廠商也在布局該領(lǐng)域并推出相應(yīng)的產(chǎn)品,還有一些垂直創(chuàng)業(yè)公司像李未可、雷鳥等也在推出相應(yīng)的產(chǎn)品;10月參加了字節(jié)火山引擎線下舉辦的智能硬件x大模型的線下會(huì),上臺(tái)演示的AI眼鏡也不少,可見越來越多的創(chuàng)業(yè)公司已經(jīng)開始投入該領(lǐng)域的產(chǎn)品打造;
- AI配飾:海外AI pin和Rabbit R1出來之后,讓人看到了不一樣的AI硬件產(chǎn)品,把AI配飾的概念也炒火了起來,作為新興的產(chǎn)品,目前這兩款產(chǎn)品在海外的用戶滿意度還不是很高,產(chǎn)品能力上被吐槽和詬病的比較多,所以激起了一定的水花但是很快又平靜了,不過新興領(lǐng)域就是這樣,未來還是需要這些產(chǎn)品廠商持續(xù)的打磨產(chǎn)品才能交付給消費(fèi)者一個(gè)滿意的產(chǎn)品;
- AI智能手表:智能手表目前在國(guó)內(nèi)外很多手機(jī)廠商都有布局,但是目前結(jié)合大模型的AI只能手表暫時(shí)沒有看到有類似的產(chǎn)品,個(gè)人覺得,未來這塊會(huì)是大家爭(zhēng)先投入的領(lǐng)域,特別是兒童手表領(lǐng)域;
3)AI PC:蘋果和聯(lián)想等電腦廠商一直都聚焦AI電腦領(lǐng)域有比較多的發(fā)聲和暢想,我們也相信這個(gè)領(lǐng)域未來會(huì)是AI的重點(diǎn)應(yīng)用方向,不過目前確實(shí)還沒有看到深度結(jié)合AI的電腦終端產(chǎn)品出現(xiàn);
4)AI教育硬件:教育硬件領(lǐng)域,一方面很多傳統(tǒng)的教育硬件比如猿輔導(dǎo)的學(xué)練機(jī),科大訊飛的學(xué)習(xí)機(jī),開始結(jié)合大模型推出部分AI功能;另一方面,AI玩具現(xiàn)在也是很多創(chuàng)業(yè)公司投入的應(yīng)用領(lǐng)域,包括機(jī)器狗,甚至連AI盆栽、AI玩偶都有,產(chǎn)品主打益智和陪伴價(jià)值;
5)AI辦公硬件:除了教育,辦公也同樣是硬件集中地,圍繞辦公領(lǐng)域的AI硬件目前比較少,暫未看到太多知名度較高的產(chǎn)品出來;
6)AI智能家居:**這塊目前主要還是以AI音箱為主,主要玩家還是傳統(tǒng)智能音箱的那些玩家,包括天貓精靈,以及亞馬遜Echo;
7)AI車載設(shè)備:最后一個(gè)領(lǐng)域的AI車載設(shè)備,目前國(guó)內(nèi)像蔚來、理想汽車等都有推出相應(yīng)的AI車載結(jié)合硬件,同樣海外像奔馳、大眾,也有相關(guān)的應(yīng)用案例;
3.2 AI硬件行業(yè)動(dòng)態(tài)情況
1)AI Pin和Rabbit R1
AI硬件最早爆火的產(chǎn)品,是2023年底美國(guó)Humane公司在世界移動(dòng)通信大會(huì)上發(fā)布的AI Pin,用戶將其別在衣服上,將畫面投影在手掌上,用語音進(jìn)行控制。
AI Pin定價(jià)699美元,發(fā)布一個(gè)月內(nèi),預(yù)定量就超過了450萬臺(tái)。然而, AI Pin的實(shí)際效果卻不盡如人意,存在反應(yīng)慢、交互體驗(yàn)差、續(xù)航差等諸多問題,很快跌落神壇,產(chǎn)品退貨量甚至超過發(fā)貨量。
與AI Pin類似的還有曾在百度智能硬件負(fù)責(zé)人呂聘創(chuàng)立公司Rabbit推出的R1,用戶只需要通過和巴掌大小的R1進(jìn)行語音交流,即可調(diào)用手機(jī)上所有APP。產(chǎn)品定價(jià)199美元,發(fā)布一周,預(yù)售量達(dá)4萬臺(tái),幾個(gè)月內(nèi)銷售量破10萬臺(tái)。然而,R1很快也受到套殼安卓、續(xù)航差、基礎(chǔ)功能缺失、幻覺嚴(yán)重等質(zhì)疑。根據(jù)今年10月呂聘的采訪可以推斷,Rabbit R1正常的雙日活僅有5206,相較于銷量并不理想。
AI Pin和Rabbit R1均采用了全新的硬件形態(tài),也可以被稱為是AI Native的硬件產(chǎn)品。全新的形態(tài)雖然在初期極大吸引了消費(fèi)者的興趣,但一旦出現(xiàn)Over Promise和Under Deliver的問題,很快就會(huì)被消費(fèi)者拋棄。
2)Ray-Ban Meta智能眼鏡
在這一點(diǎn)上,Meta則選擇了不同的解法。
2023年9月,Meta與 Ray-Ban聯(lián)手推出智能眼鏡Ray-Ban Meta,用戶可以通過眼鏡拍攝照片與視頻、接聽電話以及播放音樂,并可以通過語音和簡(jiǎn)單的手勢(shì)來控制設(shè)備。
Ray-Ban Meta起售價(jià)為299美元,相較于Ray-Ban的傳統(tǒng)眼鏡產(chǎn)品并不昂貴。
僅2023年第四季度,Ray-Ban Meta出貨量就超過30萬副,直到目前累計(jì)出貨量已超百萬。而今年9月份Meta發(fā)布的與視覺AI模型相結(jié)合的AR眼鏡Meta Orion則再度引爆輿論,以至于很多人紛紛認(rèn)為眼鏡將是AI硬件的最佳形態(tài)。
3)AI車載設(shè)備
高通推出支持生成式 AI 的數(shù)字座艙
展會(huì)期間,高通通過驍龍數(shù)字底盤概念車,展示了驍龍座艙平臺(tái)的傳統(tǒng) AI 和生成式 AI 能力,涵蓋數(shù)字座艙、車聯(lián)網(wǎng)技術(shù)、網(wǎng)聯(lián)服務(wù)、先進(jìn)駕駛輔助與自動(dòng)駕駛系統(tǒng)等多個(gè)方面。
對(duì)于復(fù)雜的大模型而言,單一在云端運(yùn)行的 AI 存在高成本、高能耗和隱私安全等問題。
高通通過兼具高性能和低功耗的平臺(tái),將終端側(cè)生成式 AI 能力帶進(jìn)座艙,為座艙提供強(qiáng)大、高效、私密、更安全和更個(gè)性化的車載交互體驗(yàn)。
自駕出游前不再需要做復(fù)雜的攻略,數(shù)字助手能夠根據(jù)我們的出行偏好規(guī)劃一趟完美的行程;碰到如何換輪胎、安裝嬰兒安全座椅這些問題,無需翻出上百頁的用戶手冊(cè)查找答案,AI 助手能通過對(duì)話指導(dǎo)你完成;它還能告訴你儀表盤上突然出現(xiàn)的警示燈代表什么,幫你預(yù)約最近的服務(wù)中心檢測(cè)維修。
值得一提的是,高通還為兩輪車、電動(dòng)踏板車等新型車輛細(xì)分市場(chǎng)推出了驍龍數(shù)字底盤,提升車輛安全性、連接、信息娛樂、輔助系統(tǒng)(ARAS)和個(gè)性化云連接等方面的體驗(yàn)。
梅賽德斯奔馳
與 Open AI 合作開發(fā)車載語音助手寶馬與亞馬遜合作推出 Alexa 大型語言模型,而梅賽德斯奔馳正在與 OpenAI 合作車載語音助手——MBUX AI。
作為 MB.OS 的一部分,MBUX 引入的語音助手能夠提供基于上下文的建議,并與用戶進(jìn)行對(duì)話;它能夠基于情境給出建議,主動(dòng)提問,更清楚地了解用戶所詢問的內(nèi)容。
它還可以根據(jù)駕駛員的心理狀態(tài)來調(diào)整其回答問題時(shí)的語氣,比如,如果駕駛員的心情沮喪,那么它的提示和反應(yīng)將更短、更直接;而如果駕駛員心情好,虛擬助手的聲音會(huì)更愉快,更健談。
自查功能,可以對(duì)語音助手的回答進(jìn)行合理性檢查。例如,當(dāng)它推薦的餐館或商店關(guān)閉時(shí),語言助手將通過云數(shù)據(jù)或者客戶的陳述來進(jìn)行復(fù)查。
大眾汽車
與 Cerence 合作開發(fā)車載語音助手在 AI 的加持下,汽車已經(jīng)成為對(duì)話伙伴。
大眾汽車在 CES 2024 期間表示,計(jì)劃在二季度推出首款大模型汽車,整合了 ChatGPT 的語音助手,將在汽車行駛過程中識(shí)別并響應(yīng)駕駛員的一系列需求。
其語音助手「Hello Ida」將整合 ChatGPT 的大模型能力,在汽車行駛過程中識(shí)別并響應(yīng)駕駛員的一系列需求。
新的由大模型加持的車載語音助手將登陸 ID 4 和 ID 7 兩款新能源汽車。方案由 Cerence 協(xié)助完成,相比之前的語音交互體驗(yàn),大模型加持的語音助手應(yīng)用范圍更廣、更自然。
4)AI智能家居
- 三星家居全家桶:冰箱、吸塵器、洗衣機(jī)、電視,還有投影機(jī)器人,通通 AI 加持三星在 CES 展前發(fā)布會(huì)上,展出了多款 AI 加持下的家居新品,展示了「AI for All」的決心??梢宰R(shí)別食物種類,并制定菜譜的四門 Flex 冰箱。AI 物體識(shí)別、AI 地板檢測(cè)技術(shù)加持下的 Jet Bot Combo 真空吸塵器,能夠更大力度減輕我們的清掃工作。QLED 8K 電視,也已支持上 AI 音頻轉(zhuǎn)字幕,并可通過 AI 分析環(huán)境聲,提升影音體驗(yàn)。萌萌的 Ballie 投影儀機(jī)器人,真 AI 伴侶,能自動(dòng)幫你投喂寵物,執(zhí)行視頻通話,甚至投影出健身教程。
- Displace:全球首個(gè)購(gòu)物電視,自動(dòng)分析商品,自動(dòng)加購(gòu)物車,**在國(guó)內(nèi)已有不少視頻應(yīng)用,支持通過圖片識(shí)別技術(shù),一鍵定位劇中好物。但電視廠商 Displace 似乎覺得,這還不夠便利!在 CES 2024 期間,Displace 直接帶來兩款極度方便剁手黨的電視新品 Displace Flex 和 Displace Mini。兩臺(tái)電視都內(nèi)置有 AI 加持下的 Displace Shopping 服務(wù)。當(dāng)用戶觀看電視發(fā)現(xiàn)心頭好物時(shí),只需使用手勢(shì)就能即刻暫停畫面,自動(dòng)分析商品。并且,秉承極致便利原則,Displace Shopping 可直接將商品加載至購(gòu)物車。按照這個(gè)邏輯,看完電視,再刷刷滿滿當(dāng)當(dāng)?shù)馁?gòu)物車,也是件很愉快的事兒。
5)AI眼鏡
- 雷鳥:大模型加持的輕量級(jí) AR 眼鏡,國(guó)內(nèi) AR 廠商雷鳥科技,在 CES 2024 上發(fā)布了新款 AR 眼鏡雷鳥 X2 Lite。AI+AR 是這款眼鏡,主打功能亮點(diǎn)。和早先發(fā)布的雷鳥 X2 一樣,雷鳥 X2 Lite 也內(nèi)置了大模型語音助手 Rayneo AI。Rayneo AI 可實(shí)現(xiàn)多輪自然語言對(duì)話、行程規(guī)劃、便捷百科問答、頭腦風(fēng)暴等多項(xiàng)能力。同時(shí),雷鳥 X2 Lite 也支持 AI 輔助翻譯、3D 空間導(dǎo)航、第一人稱視角影像創(chuàng)作等功能。
- Solos:ChatGPT 協(xié)助翻譯的音頻眼鏡:智能眼鏡公司 Solos 亮相了其去年上新的一款搭載 ChatGPT 的新品 Solos AirGo 3。Solos AirGo 3 核心功能即實(shí)時(shí)翻譯。搭配有應(yīng)用軟件 SolosTranslate,進(jìn)而可透過 ChatGPT 翻譯眼鏡所拾取的聲音。并且,Solos AirGo 3 還可以提供不同的場(chǎng)景模式,比如一對(duì)一對(duì)話模式,就非常適合與人面對(duì)面交流時(shí)使用。
3.3 智能耳機(jī)行業(yè)市場(chǎng)規(guī)模情況
1)全球市場(chǎng)規(guī)模情況:根據(jù)沙利文白皮書報(bào)告分享,2023年全球耳機(jī)零售量5.1億副,其中開放式耳機(jī)3000萬副,開放式耳機(jī)占比6%;預(yù)計(jì)2028年全球耳機(jī)規(guī)模7.6億副,開放式耳機(jī)5400萬副;
2)國(guó)內(nèi)市場(chǎng)規(guī)模情況:根據(jù)智研瞻公開分享數(shù)據(jù),2023年中國(guó)智能耳機(jī)的市場(chǎng)規(guī)模為144億,年復(fù)合增長(zhǎng)率在15%左右;
3)開放式耳機(jī)市場(chǎng)規(guī)模:作為智能耳機(jī)的一個(gè)重要分支,開放式耳機(jī)近年來也表現(xiàn)出強(qiáng)勁的增長(zhǎng)勢(shì)頭,特別是在華南和華中地區(qū),開放式耳機(jī)的出貨量在2023年達(dá)到了652萬臺(tái),同比增長(zhǎng)130.2%;目前開放式耳機(jī)在智能耳機(jī)中的滲透占比大概是7%左右,其中70%的開放式耳機(jī)是骨傳感形式的耳機(jī);
3.4 智能耳機(jī)類型劃分
智能耳機(jī)行業(yè)可根據(jù)不同的分類標(biāo)準(zhǔn)進(jìn)行劃分,涵蓋連接方式、使用方式、消費(fèi)場(chǎng)景、價(jià)格段:
1)按照連接方式連接方式上,包有線耳機(jī)和無線耳機(jī),其中無線智能耳機(jī)成為市場(chǎng)主流,無線耳機(jī)中TWS藍(lán)牙耳機(jī)獨(dú)占66%市場(chǎng)份額,展現(xiàn)真無線立體聲設(shè)計(jì)和多樣化智能功能,頸戴式、頭戴式和項(xiàng)圈耳機(jī)分別占據(jù)約15.2%、8.6%和7.6%的市場(chǎng)。
2)按照佩戴方式包括入耳式、半入耳式、掛耳式,入耳式耳機(jī)因緊貼耳道帶來震撼音質(zhì),半入耳式設(shè)計(jì)舒適適合長(zhǎng)時(shí)間佩戴,而掛耳式則平衡了舒適與牢固,掛耳式也就是OWS(開放式耳機(jī)),2021年,“Oladance”創(chuàng)始人李浩乾(前BOSE高管)在TWS行業(yè)峰會(huì)上首次提出“OWS”概念,即“Open Wearable Stereo(開放式無線音響)”,至此,開放式耳機(jī)行業(yè)進(jìn)入發(fā)展期。具體來說,開放式耳機(jī)采用不入耳的佩戴設(shè)計(jì),是讓用戶聽見耳機(jī)內(nèi)聲音的同時(shí)能夠感知到周圍環(huán)境的無線藍(lán)牙耳機(jī)。開放式耳機(jī)主要由骨傳導(dǎo)和氣傳導(dǎo)兩種技術(shù)組成,根據(jù)沙利文白皮書相關(guān)報(bào)告,開放式耳機(jī)中,目前有70%的耳機(jī)采用的是骨傳導(dǎo)形式,30%采用氣傳導(dǎo)方式;
3)按照使用場(chǎng)景包括消費(fèi)級(jí)、商用級(jí)、工業(yè)級(jí)使用場(chǎng)景,其中消費(fèi)級(jí)產(chǎn)品包括娛樂消費(fèi)耳機(jī)(聽音樂、看電影等)、商務(wù)耳機(jī)(開會(huì)議、通電話)、運(yùn)動(dòng)耳機(jī)等;
4)按照價(jià)格段劃分
- 低端耳機(jī):價(jià)格區(qū)間在0-199元,競(jìng)爭(zhēng)非常激烈,這一價(jià)格段主要面向入門級(jí)用戶或追求性價(jià)比的用戶,產(chǎn)品多以入耳式或有線耳機(jī)為主,音質(zhì)和功能相對(duì)基礎(chǔ),滿足日常簡(jiǎn)單的聽音需求。
- 中低端耳機(jī):價(jià)格區(qū)間在200-499元,數(shù)量較多,普及型耳機(jī)市場(chǎng)的主要價(jià)格段,這一價(jià)格段產(chǎn)品在功能性上有所提升,許多耳機(jī)配備了降噪、語音助手等功能,適合對(duì)音質(zhì)和功能有一定要求的用戶,尤其是藍(lán)牙真無線耳機(jī)逐漸普及;
- 中端耳機(jī):價(jià)格區(qū)間500-999元,產(chǎn)品數(shù)量適中,以知名品牌為主,這個(gè)價(jià)格段的耳機(jī)在音質(zhì)、降噪和舒適性上都有較好的表現(xiàn)。以真無線和入耳式耳機(jī)為主,適合對(duì)音質(zhì)有較高要求的用戶,產(chǎn)品在功能、續(xù)航和外觀設(shè)計(jì)上都更加均衡;
- 高端耳機(jī):價(jià)格區(qū)間1000-1999元,數(shù)量相對(duì)較少,但品牌覆蓋度較廣,高端耳機(jī)價(jià)格段多用于真無線、頭戴式降噪等高音質(zhì)、功能性強(qiáng)的耳機(jī),產(chǎn)品品質(zhì)、音質(zhì)、降噪效果突出,適合追求較高聽覺體驗(yàn)和品質(zhì)的用戶。示例品牌包括:
- 超高端耳機(jī):2000元以上,數(shù)量少,主打高端市場(chǎng);
3.5.智能耳機(jī)產(chǎn)業(yè)鏈分析和核心玩家
上游環(huán)節(jié):
原材料供應(yīng)商包括芯片(如主控藍(lán)牙芯片和存儲(chǔ)芯片)、電子元器件(包括傳感器和MEMS麥克風(fēng)等)、電池以及外殼、耳塞等零部件。這些組件是智能耳機(jī)實(shí)現(xiàn)無線連接、數(shù)據(jù)處理和各種功能(如噪音消除、語音助手集成)的基礎(chǔ)。
上游耳機(jī)主控藍(lán)牙芯片廠商包括BES恒玄、Bluetrum中科藍(lán)訊、JL杰理等; MEMS麥克風(fēng)廠商包括敏芯微電子、意芯微電子等;耳機(jī)電池廠商包括VDL紫建電子、HJ弘捷等;其他傳感器廠商包括SHOUDING首鼎、PinTeng品騰等;電源管理芯片廠商包括Injoinic英集芯、金宇宙等;無線充電接收芯片廠商包括Prisemi芯導(dǎo)科技、COPO酷珀微等;充電盒電池廠商包括眾旺德、EVE億緯鋰能等;
中游環(huán)節(jié):
則涉及整機(jī)制造和封裝,代加工廠商包括天鍵股份、奧尼電子等廠商;
下游環(huán)節(jié):
則主要由品牌廠商和銷售渠道構(gòu)成,直接面向終端消費(fèi)者。品牌廠商如華為、小米、OV、蘋果、Beats、sony、bose、JBL、漫步者、海能達(dá)等,新興品牌商包括Oladance、Shokz韶音、Cleer等;在無線耳機(jī)市場(chǎng)上,蘋果、華為和小米三大品牌占據(jù)了前三名的位置,合計(jì)市場(chǎng)份額達(dá)到32.8%。華為耳機(jī)憑借出色的用戶口碑與媒體評(píng)價(jià),在2021年中國(guó)十大耳機(jī)品牌評(píng)選中榮登榜單。國(guó)產(chǎn)品牌的競(jìng)爭(zhēng)力也在不斷增長(zhǎng),多個(gè)中高端國(guó)產(chǎn)耳機(jī)品牌如QDC、達(dá)音科、TANCHJIM、HIFIMAN等在發(fā)燒友中獲得認(rèn)可。
3.6.AI耳機(jī)和傳統(tǒng)智能耳機(jī)的差別是什么?
- 傳統(tǒng)耳機(jī)只是手機(jī)聲音的延伸,不支持交互,AI耳機(jī)可以支持交互和互動(dòng)、支持完成指令和任務(wù):老實(shí)說,AI耳機(jī)相比傳統(tǒng)的智能耳機(jī)而言,主要的差別其實(shí)就是增加了支持AI互動(dòng)的功能,讓耳機(jī)硬件本身能夠支持接收用戶的聲音指令,然后實(shí)時(shí)的響應(yīng)輸出;但是增加了這個(gè)能力之后在使用場(chǎng)景上卻可以帶來很多耳機(jī)的應(yīng)用場(chǎng)景,讓耳機(jī)的價(jià)值更高;傳統(tǒng)的智能耳機(jī)更多的是以單線的輸出為主,無法接收過多的指令。
- AI耳機(jī)可以在不碰手機(jī)的情況下調(diào)動(dòng)APP執(zhí)行任務(wù),可以遠(yuǎn)程操控APP甚至手機(jī);
- AI耳機(jī)支持輸入和輸出音頻內(nèi)容上云,支持錄制,從而獲得更多的服務(wù)能力;
四、用戶對(duì)于AI耳機(jī)的需求思考
4.1 消費(fèi)者對(duì)智能耳機(jī)的基礎(chǔ)訴求
根據(jù)沙利文白皮書發(fā)表報(bào)告,消費(fèi)者在決策耳機(jī)的購(gòu)買因素的時(shí)候,會(huì)優(yōu)先考慮如下幾個(gè)因素:
- 舒適度、續(xù)航時(shí)間:這考量的是耳機(jī)的重量、佩戴方式、攜帶方式等物理體驗(yàn),以及耳機(jī)的電池續(xù)航能力;
- 價(jià)格:消費(fèi)者對(duì)于耳機(jī)的價(jià)格接受度;
- 音質(zhì):消費(fèi)者對(duì)直接的音質(zhì)需求,有強(qiáng)烈的渴望和需求,希望能支持更良好的音質(zhì)體驗(yàn);
- 降噪:包括智能降噪等功能;
- 易用性:包括使用操作更簡(jiǎn)單、藍(lán)牙連接和調(diào)節(jié)操控簡(jiǎn)便
4.2 消費(fèi)者對(duì)開放式AI耳機(jī)的進(jìn)階訴求
- 語音互動(dòng)能力:能更“聰明”、更實(shí)時(shí)的和用戶語音互動(dòng),是AI耳機(jī)的關(guān)鍵訴求之一,這是AI耳機(jī)最關(guān)鍵的能力;
- 音質(zhì)要求:包括高保真、低遲延、高流暢度、低音效果、個(gè)性化調(diào)節(jié)的需求,特別是發(fā)燒友用戶,對(duì)音質(zhì)有更加嚴(yán)苛的追求;
- 拾音效果:與傳統(tǒng)智能耳機(jī)以輸出為主不同,AI耳機(jī)需要支持靈敏的語音輸入,所以需要具備靈敏的拾音效果,且最好能支持自動(dòng)增益,準(zhǔn)確識(shí)別使用者的聲音,避免受到環(huán)境音的干擾;
- 智能降噪能力:對(duì)開放式的耳機(jī)而言,降噪是一個(gè)短板,所以用戶更容易提出智能降噪的需求,包括能夠支持智能過濾環(huán)境音,甚至對(duì)于部分不應(yīng)該降噪的聲音可以做到不被降噪,例如消防車聲音;
- 記憶存儲(chǔ)和錄制能力:用戶也期望耳機(jī)能夠具備記憶存儲(chǔ)和錄制的能力,從而支持語音錄制的功能;、
4.3 豆包AI耳機(jī)目前在消費(fèi)者訴求上的滿足情況
綜合以上用戶對(duì)于AI耳機(jī)的需求的衡量因素,整體上看,目前豆包AI耳機(jī)在語音互動(dòng)、舒適度、續(xù)航能力等方面基本可以滿足用戶需求,但是在音質(zhì),降噪能力等方面還不足,整體定價(jià)也高于消費(fèi)者預(yù)期;
4.4 AI耳機(jī)滿足用戶需求存在的挑戰(zhàn)有哪些?
1)硬件性能和算力要求:包括芯片的計(jì)算能力、拾音器硬件的性能等,AI耳機(jī)需要支持大模型運(yùn)算,以及實(shí)時(shí)的處理速度,且需要準(zhǔn)確的語音識(shí)別能力,這些都是需要關(guān)鍵攻克的技術(shù)難題;
- 數(shù)據(jù)處理速度:AI耳機(jī)需要實(shí)時(shí)分析聲音和環(huán)境數(shù)據(jù),以提供快速響應(yīng),這對(duì)芯片的處理能力和算力提出了很高的要求。
- 低功耗高性能:在有限的電池容量下實(shí)現(xiàn)低延遲、實(shí)時(shí)AI運(yùn)算和長(zhǎng)時(shí)間續(xù)航,需要先進(jìn)的芯片技術(shù)和能源管理優(yōu)化;
2)用戶對(duì)音質(zhì)要求的挑戰(zhàn):音質(zhì)是用戶購(gòu)買耳機(jī)的重要決策因素之一,目前開放式AI耳機(jī)在音質(zhì)上的弱項(xiàng)會(huì)是消費(fèi)者比較在意的一個(gè)點(diǎn),而提升音質(zhì)很大程度上取決于聲學(xué)腔體的設(shè)計(jì)、芯片性能、傳輸鏈路、編碼技術(shù)等因素的影響,極大的考驗(yàn)技術(shù)和成本,該部分具體可見4.5部分;
3)復(fù)雜環(huán)境的語音識(shí)別準(zhǔn)確性
- 降噪與語音識(shí)別的平衡:在嘈雜環(huán)境下,既要保證語音指令識(shí)別的準(zhǔn)確性,又要進(jìn)行有效降噪,這對(duì)算法提出了較高的要求。
- 多語言與方言識(shí)別:支持多種語言和方言,尤其是具備較強(qiáng)的方言識(shí)別能力,對(duì)AI語音識(shí)別技術(shù)是一個(gè)重大挑戰(zhàn)。
4)成本挑戰(zhàn):面對(duì)高昂的模型、語音識(shí)別、語音合成等技術(shù)成本,AI耳機(jī)如何保持商業(yè)模式的成功;
5)面對(duì)多樣的能力和多種硬件組合:在體積有限的耳機(jī)中集成多個(gè)傳感器并保持輕量化,是技術(shù)設(shè)計(jì)上的挑戰(zhàn)。
4.5 AI耳機(jī)如何提高音質(zhì)表現(xiàn)?
前面也提到了,音質(zhì)是消費(fèi)者對(duì)耳機(jī)非常重視的因素,目前豆包AI耳機(jī)在音質(zhì)和AI互動(dòng)能力上,優(yōu)先保障了AI互動(dòng)的能力,對(duì)于音質(zhì)的追求必然也會(huì)有些犧牲,所以我們可以大概了解一下如果要獲得更好的音質(zhì)表現(xiàn),需要依賴哪些技術(shù)能力;
- 聲學(xué)腔體設(shè)計(jì):無論是入耳式、頭戴式還是開放式耳機(jī),都需要一個(gè)外殼來容納其發(fā)聲單元,這一部分被稱為腔體”。腔體設(shè)計(jì)對(duì)耳機(jī)的音質(zhì)表現(xiàn)至關(guān)重要,它直接影響聲音的調(diào)音和漏音情況,從而直接影響用戶的聽覺體驗(yàn)。其主要從聲音調(diào)音、共振和失真控制、減少漏音與聲場(chǎng)感和定位幾個(gè)方面影響耳機(jī)音質(zhì);腔體設(shè)計(jì)的經(jīng)驗(yàn)和技術(shù),更多取決于廠商在這方面的經(jīng)驗(yàn)和積累;
- 藍(lán)牙芯片:芯片的性能也同樣決定了音質(zhì)表現(xiàn)的效果,目前市面上中高端的芯片主要是蘋果、高通、華為、恒玄科技等廠商的芯片;
- 傳輸鏈路:在傳輸過程中如果音頻文件無法順暢傳輸,也會(huì)直接影響音質(zhì),而將音頻文件以“高保真”格式傳輸,對(duì)于無線耳機(jī)功耗又是一個(gè)挑戰(zhàn)。如何在保證功耗情況下實(shí)現(xiàn)穩(wěn)定傳輸,同時(shí)確保傳輸接近“無損”水平,是當(dāng)前所有廠商亟待解決的問題之一;
- 編碼技術(shù):編碼技術(shù)也會(huì)影響音質(zhì)的好壞,目前編碼技術(shù)的音質(zhì)表現(xiàn)從優(yōu)到劣排列為aptXLossless>LDACLHDC>aptX>AAC>SBC;
- 藍(lán)牙版本:藍(lán)牙版本越高,傳輸速率和穩(wěn)定性也會(huì)越高,對(duì)音質(zhì)的效果越好,藍(lán)牙吧版本5.4是目前最優(yōu)的版本;
五、產(chǎn)品競(jìng)爭(zhēng)分析
5.1 AI耳機(jī)競(jìng)品的動(dòng)態(tài)情況
科大訊飛:
2024年5月 15 日,科大訊飛旗下品牌未來智能發(fā)布了訊飛會(huì)議耳機(jī)Pro2和iFLYBUDS2兩款新耳機(jī),訊飛會(huì)議耳機(jī) Pro2支持 VIAIMAI進(jìn)化大模型,可一鍵生成會(huì)議摘要總結(jié)、待辦事項(xiàng),支持 AI會(huì)議助理有問必答、32 國(guó)語言同傳翻譯,支持閃錄音功能,支持免費(fèi)錄音轉(zhuǎn)文字等AI功能,iFLYBUDS2 具備會(huì)議摘要總結(jié)、多場(chǎng)景錄音撰寫多國(guó)語音同聲傳譯、快速生成會(huì)議摘要和待辦事項(xiàng)等 AI功能。
Cleer:
2024 年4 月 22 日,智能聲學(xué)品牌 Cleer 發(fā)布了“全球首款開放式 AI耳機(jī)”CleerARC3 音弧,該耳機(jī)搭載了全新一代 Greenwaves Gap9 AI芯片,內(nèi)置了 Gomore 研發(fā)的AI運(yùn)動(dòng)算法,可幫助用戶實(shí)時(shí)監(jiān)控運(yùn)動(dòng)生理數(shù)據(jù),如消耗卡路里、訓(xùn)練負(fù)荷及恢復(fù)時(shí)間、進(jìn)階跑步指標(biāo)等精準(zhǔn)運(yùn)動(dòng)數(shù)據(jù);在智能交互方面,CleerARC3音弧還集成了出門問問的語音控制技術(shù),升級(jí)了 AI語音控制,用戶無需提示詞喚醒語音助手,使用“下一首”“接聽電話”等快捷口令即可進(jìn)行相應(yīng)操作;CleerARC3音弧還在開放式耳機(jī)中實(shí)現(xiàn)了 AI降噪效果,通過引進(jìn)全新一代 AI芯片 GAP9 及 AI算法,首次在開放式耳機(jī)中實(shí)現(xiàn)了 AI降噪效果。
三星:
2024 年 7 月 10 日,三星發(fā)布兩款耳機(jī)新品——Galaxy Buds3 Pro 與 Galaxy Buds3。其中 Samsung Galaxy Buds 3 Pro 耳機(jī)主打 AI,具備自適應(yīng)降噪、環(huán)境分析(可以視周圍環(huán)境的種類對(duì)降噪強(qiáng)度進(jìn)行調(diào)整,進(jìn)行”選擇性的降噪”,例如路上救護(hù)車的聲音就不會(huì)被”降噪”掉)等功能,并能夠配合 Galaxy 手機(jī)完成實(shí)時(shí)翻譯功能;
阿里通義:
首款智能耳機(jī) AIxFU(愛富)在 2024 年云棲大會(huì)上首次對(duì)外發(fā)聲。這款耳機(jī)融入了阿里通義的 AI 技術(shù),定位也是耳畔智能助手,具體的功能細(xì)節(jié)目前暫時(shí)尚未公開;
百度小度:
另有消息透露,最早在 2020 年 9 月推出智能耳機(jī)的小度,今年也在加快AI耳機(jī)新品節(jié)奏。
漫步者:
在 2023 年與阿里集團(tuán)下屬人工智能公司簽訂合作開發(fā)智能耳機(jī)的協(xié)議書,相關(guān)產(chǎn)品已在研發(fā)中。
魅族:
聯(lián)合怒瞄在今年年初推出的首款 AI Device 亮相,也是 AI 耳機(jī)形態(tài),計(jì)劃將于今年年底美國(guó)「黑五:」購(gòu)物節(jié)期間正式發(fā)布。
整體而言,目前AI耳機(jī)競(jìng)品中,除了Cleer已經(jīng)也支持AI互動(dòng)體驗(yàn)且更多聚焦運(yùn)動(dòng)健康領(lǐng)域,科大訊飛垂直聚焦會(huì)議場(chǎng)景,目前像豆包AI耳機(jī)一樣具備完整的AI語音互動(dòng)能力,且支持多種應(yīng)用場(chǎng)景的AI耳機(jī),暫時(shí)還沒有看到,其他產(chǎn)品基本都還在研發(fā)過程中;
5.2 面對(duì)激烈的市場(chǎng)競(jìng)爭(zhēng),字節(jié)的競(jìng)爭(zhēng)力是什么?
AI耳機(jī)的技術(shù)實(shí)現(xiàn)基本包括以下幾部分:LLM(大模型)+ASR(自動(dòng)語音識(shí)別)+TTS(語音合成)+RTC(實(shí)時(shí)通信)+Agent;其中ASR作為語音識(shí)別輸入技術(shù),LLM+Agent作為生成回答的處理中樞,TTS和RTC作為語音生成輸出技術(shù),閉環(huán)整個(gè)產(chǎn)品的能力,字節(jié)在以上幾部分上的競(jìng)爭(zhēng)優(yōu)勢(shì)如下:
- 語音技術(shù)能力的優(yōu)勢(shì):目前字節(jié)在語音技術(shù)上的優(yōu)勢(shì)更為顯著,其語音效果在業(yè)界的口碑和認(rèn)可度比較高,背后主要依托其ASR、TTS、RTC的技術(shù)能力,語音技術(shù)作為AI硬件最重要的技術(shù)之一,掌握語音技術(shù)能力將更加有競(jìng)爭(zhēng)優(yōu)勢(shì);
- 大模型的技術(shù)優(yōu)勢(shì):字節(jié)自研大模型,相比沒有大模型的廠商而言,則更加有優(yōu)勢(shì),而對(duì)于同樣也有大模型的廠商,且不提基礎(chǔ)大模型能力差異如何,字節(jié)至少在成本端占據(jù)更加優(yōu)勢(shì)位置,從其定價(jià)上看,模型定價(jià)為行業(yè)最低;
- Agent:未來耳機(jī)的使用場(chǎng)景,本質(zhì)上其實(shí)也是通過Agent的方式實(shí)現(xiàn)的,字節(jié)在Agent的設(shè)計(jì)能力上,依托扣子的技術(shù)能力,或許能具備更強(qiáng)大和靈活的agent開發(fā),從而支持豐富的應(yīng)用場(chǎng)景;
六、商業(yè)模式思考
6.1 AI耳機(jī)真的有利潤(rùn)空間嗎?
我們先盤點(diǎn)一個(gè)AI耳機(jī)的成本結(jié)構(gòu),個(gè)人總結(jié)下來主要包括如下幾部分:
- 硬件部分成本:包括芯片、電池、傳感器、耳機(jī)外殼等,該部分為一次性成本;
- 大模型和云服務(wù)部分:包括大模型token成本、語音識(shí)別和語音合成云服務(wù)成本,該部分為用戶只要使用就會(huì)產(chǎn)生的成本;
由此可見,其產(chǎn)品的成本說實(shí)話可能不低,所以AI耳機(jī)真的有利潤(rùn)空間嗎?
引用rabbit R1 的創(chuàng)始人呂聘的公開消息,其AI硬件產(chǎn)品 Rabbit R1的售價(jià)199美元,硬件的成本大概占比60%,只考慮硬件的利潤(rùn)率是40%左右,然而用戶的使用過程中還有云端的服務(wù)消耗的成本,硬件的利潤(rùn)預(yù)計(jì)能夠滿足用戶1~1.5年的使用,也就是說,產(chǎn)品的利潤(rùn)取決于產(chǎn)品的使用壽命以及用戶的使用頻率和消耗。
所以,可見單純硬件本身,說實(shí)話可能沒有太多的利潤(rùn)空間,那么AI耳機(jī)的商業(yè)模式到底是什么樣的?
6.2 豆包AI耳機(jī)的商業(yè)模式什么?
參考Rabbit R1創(chuàng)始人呂聘的說法,未來AI 耳機(jī)的商業(yè)模式可能和手機(jī)廠商的模式相同,可能也是基于應(yīng)用商店APPStore的模式實(shí)現(xiàn)商業(yè)化;未來AI耳機(jī)的使用可以支持多種應(yīng)用場(chǎng)景,相應(yīng)的應(yīng)用由開發(fā)者開發(fā)并發(fā)布到應(yīng)用商店,應(yīng)用本身可以通過提供增值服務(wù)等方式讓用戶付費(fèi),而應(yīng)用商店品牌方采用收傭分成的方式獲利。
舉個(gè)比較典型的例子,比如音樂、聽書和FM類的應(yīng)用,天然就是AI耳機(jī)最合適的搭配應(yīng)用,用戶可以購(gòu)買耳機(jī)應(yīng)用商店內(nèi)的服務(wù),獲得更多的增值能力,而品牌方從中抽取一定的分成;
6.3 AI耳機(jī)的應(yīng)用,和手機(jī)APP的應(yīng)用有何區(qū)別?
看到前面第二點(diǎn)的時(shí)候,可能很容易會(huì)設(shè)想的問題是目前手機(jī)端已經(jīng)有APP,且連接耳機(jī)就可以支持接聽音樂等,為何還需要一個(gè)單獨(dú)的AI耳機(jī)的應(yīng)用?
仔細(xì)理解一下就可以知道,目前手機(jī)端的APP更多的只是支持聲音的輸出,尚不能通過耳機(jī)對(duì)APP發(fā)起指令,也就無法實(shí)現(xiàn)AI互動(dòng),應(yīng)用本身必須要和耳機(jī)建立連接和“通訊”才可實(shí)現(xiàn)這樣的AI互動(dòng)效果,所以手機(jī)APP也需要結(jié)合AI耳機(jī)做二次開發(fā),形成適配耳機(jī)互動(dòng)的應(yīng)用,這是兩者之間的差別。
當(dāng)然,以上這些也都是大家的揣測(cè),并沒有看到現(xiàn)實(shí)成功的案例,這些可以交給現(xiàn)在的AI硬件廠商們給我們答案;
七、產(chǎn)品局限和未來發(fā)展思考
7.1.豆包AI耳機(jī)目前的產(chǎn)品局限性
1.從產(chǎn)品使用的角度看,目前不能脫離手機(jī)使用:個(gè)人認(rèn)為,最蛋疼的就是必須要藍(lán)牙連接手機(jī),這就意味著,耳機(jī)只是手機(jī)在空間上的延伸,耳機(jī)不能脫離手機(jī)使用,對(duì)于用戶而言,也必須時(shí)刻保留在手機(jī)可以連接的范圍內(nèi);
2.從硬件的角度看,語音識(shí)別在復(fù)雜環(huán)境中的準(zhǔn)確性不足:例如在嘈雜的環(huán)境中,用戶體驗(yàn)可能受到影響;
3.從數(shù)據(jù)的運(yùn)行效率上,目前耳機(jī)的AI問答效果需要經(jīng)歷“耳機(jī)→APP→豆包應(yīng)用→云端大模型”,鏈路比較長(zhǎng),無法實(shí)現(xiàn)“耳機(jī)→云端大模型”直連,這將影響其多任務(wù)處理和即時(shí)信息反饋方面的表現(xiàn) ;
4.從商業(yè)模式上,AI耳機(jī)現(xiàn)在還是個(gè)新興領(lǐng)域,商業(yè)模式是否能成功還沒有得到印證,AI耳機(jī)未來將持續(xù)面臨商業(yè)模式的挑戰(zhàn);
7.2.豆包AI耳機(jī)未來發(fā)展的思考
綜合前面關(guān)于產(chǎn)品局限性的思考,個(gè)人認(rèn)為,未來AI耳機(jī)的發(fā)展可能包括如下幾個(gè)方面:
1)從產(chǎn)品使用的角度,未來AI耳機(jī)朝著可以脫離手機(jī)獨(dú)立運(yùn)行的方向使用,能夠支持自身聯(lián)網(wǎng),直接連接云端大模型,這樣耳機(jī)便可以不需要通過藍(lán)牙連接耳機(jī)使用,脫離手機(jī)連接距離范圍也能運(yùn)行,手機(jī)端的價(jià)值更多的解決耳機(jī)應(yīng)用安裝和管理的能力,以及語音數(shù)據(jù)上云的作用;但是這必然意味著對(duì)芯片等硬件的要求會(huì)更高;
2)從硬件的角度,未來AI耳機(jī)可以逐步補(bǔ)充其在智能識(shí)別、智能降噪、音質(zhì)等方面的短板,基礎(chǔ)性能上追趕傳統(tǒng)智能耳機(jī)的體驗(yàn),讓AI成為耳機(jī)標(biāo)配下的增值部分,而不是讓用戶在傳統(tǒng)智能耳機(jī)和AI之間做選擇;
3)從數(shù)據(jù)的運(yùn)行效率上,個(gè)人覺得潛在的發(fā)展路徑包括如下幾個(gè)階段:
- 耳機(jī)→APP→豆包應(yīng)用→云端大模型:這是現(xiàn)在的實(shí)現(xiàn)模式;
- 耳機(jī)→云端大模型:未來耳機(jī)如果直接支持聯(lián)網(wǎng)和計(jì)算,便可以直連云端大模型;
- 耳機(jī)→端側(cè)模型+云端模型:未來如果端側(cè)模型的發(fā)展起來,可以讓耳機(jī)本身自己承擔(dān)一部分算力計(jì)算,部分鏈接云端大模型,形成端云混合的計(jì)算方案;不過這個(gè)還比較遙遠(yuǎn),端側(cè)模型目前還沒有在手機(jī)和電腦上看到落地實(shí)現(xiàn);
4)從商業(yè)模式上,AI耳機(jī)除了持續(xù)迭代產(chǎn)品提升產(chǎn)品價(jià)值,也會(huì)持續(xù)的尋找降低硬件和軟件成本的路徑,同時(shí)尋找商業(yè)變現(xiàn)的機(jī)會(huì),把商業(yè)模式跑通;
7.3.字節(jié)將如何賦能AI硬件行業(yè)
我相信字節(jié)做AI耳機(jī)和AI硬件,不會(huì)只是想單純的做硬件本身,按照大廠的生態(tài)發(fā)展思路,他們通常都會(huì)把解決方案開放出來,賦能整個(gè)行業(yè),10月在參加火山引擎舉辦的“智能硬件x大模型”的線下會(huì)議的時(shí)候已經(jīng)看到了大概的思路;
1)智能硬件連接大模型的解決方案:LLM+ASR+TTS+RTC+Agent
官方給出的關(guān)于AI硬件的技術(shù)解決方案的組合是串聯(lián)大模型LLM,語音自動(dòng)識(shí)別技術(shù)ASR、語音合成技術(shù)TTS、實(shí)時(shí)通訊技術(shù)RTC、Agent開發(fā)技術(shù),如此便可以實(shí)現(xiàn)硬件AI化的能力;
火山引擎提供大模型和語音技術(shù)的一體化SDK,接入SDK即可直接使用自己的語音和大模型技術(shù),至于Agent的構(gòu)建,這主要可以通過扣子實(shí)現(xiàn),扣子后續(xù)將在API插件方面增加硬件插件能力,支持扣子和硬件能力的連接,解決Agent調(diào)用硬件能力的問題;
2)字節(jié)的語音技術(shù)能力情況
- 強(qiáng)大語音識(shí)別能力:支持中文普通話、方言混合、語種混合能力;
- 智能降噪能力:支持回聲消除、背景音一直、自動(dòng)增益(自動(dòng)識(shí)別說話人的聲音并強(qiáng)化該聲音,弱化其余聲音)
- 智能打斷:支持語音隨時(shí)打斷,交互更加流暢、自然、擬人化;
八、結(jié)尾
OK,至此關(guān)于字節(jié)豆包AI耳機(jī)的分析大致寫完了,老實(shí)說這是第一次這么系統(tǒng)的去關(guān)注和分析一個(gè)硬件產(chǎn)品,當(dāng)然這個(gè)過程中也借此接觸和了解到了更多硬件、語音等相關(guān)的技術(shù),對(duì)我個(gè)人而言還是很有幫助的,希望同樣也能幫助到大家,個(gè)人相信,未來AI硬件也能像軟件一個(gè),用AI把整個(gè)硬件行業(yè)重新再做一遍,對(duì)于消費(fèi)者而言,我們可以享受更多的科技成果,我們拭目以待!
作者:三白有話說,公眾號(hào):三白有話說
本文由 @三白有話說 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!