2024CES-深度剖析AIGC與智能硬件結合的趨勢|Rabbit-R1 & AI-Pin & TAB-AI

0 評論 1998 瀏覽 8 收藏 14 分鐘

隨著AI技術的進步和時間的推移,AI與人類生活的融合度也在不斷提升,許多融合了AI的智能硬件,也以多樣的形態出現在我們面前。這篇文章里,作者從產品設計理念、產品能力,以及產品交互形態等維度拆解了3款消費級AI設備,一起來看看吧。

見字如面~

文章內容相較于視頻內容會更加精簡

如需了解更多細節的內容請觀看視頻,視頻地址:https://www.bilibili.com/video/BV1w6421V7k5

引言

一年一度的全球消費電子風向標CES 2024已經落下帷幕,展會中展示了很多科技向善的產品。

有專為視障人士設計的導盲眼鏡(lumen glasses),能夠感知周圍障礙物、路標等物體,再通過聲音和觸覺反饋指引盲人行動。

有輔助步行鍛煉的穿戴設備WIM,用戶穿戴后可以減少20%的步行能量,適用于肌肉力量不足的老年人。

還有在展會中呼聲很高的手持設備,Rabbit-R1。

AI在以各種各樣的方式融入我們的生活,也從相對專業的領域,逐步向C端消費市場中落地,文章會以三款消費級AI設備為切入點:Rabbit-R1、AI PIN、Tab AI。

從產品設計理念、產品能力,以及產品交互形態等幾方面,向你介紹生成式人工智能與可穿戴設備的融合趨勢,希望能夠給你帶來啟發與幫助。

一、Rabbit-R1

這款產品由華人創始人呂騁所創建,Rabbit-R1絕對是CES展會中的亮點產品之一。首批 1 萬臺迅速賣光,短短5天時間已經賣了50000多臺,一臺售價199美元,在預售階段已經獲利近1000萬美元。

1. 產品設計理念

Rabbit-R1的核心設計理念是“讓用戶告別繁瑣的應用操作”。

怎么理解呢?好比我們需要訂一張旅游機票,有了它無需在應用程序中自己摸索操作,而是通過語音的方式,給設備傳達指定,通過LLMs了解意圖,再將意圖轉化為LAM(大動作模型)的指令,從而自動完成應用程序中的所有操作,并將結果呈現給用戶進行選擇。

2. 硬件方面

R2abbit-R1通體呈亮橙色,其重量約為115克,正面有一塊2.88英寸的觸摸顯示屏。

屏幕右側上方,是一個能夠360° 旋轉的AI攝像頭,能夠執行視覺類的任務,如:物體識別、圖像分析。

攝像頭下面是操作滾輪,通過滑動滾輪或屏幕,可瀏覽屏幕中呈現的內容。

側邊有一個圓形按鍵,是一鍵喚醒AI的快捷鍵。

3. 信息呈現及交互方式

在硬件方面,通過語音交互和拍攝的方式進行信息輸入,信息的輸出以屏幕顯示和語音的方式進行呈現,交互上通過滑動滾輪或屏幕瀏覽信息。

4. 軟件方面

Rabbit-R1的操作系統叫做 Rabbit OS,其核心在于操作系統中搭載了「大動作模型」(Large Action Model)。

簡單的說LAM能夠學習人們操作應用程序(APP)的行為,能夠基于文本指令,實現應用程序內的操作步驟,從而完成任務目標。

與LLM的區別在于,LLM-大語言模型學習的是文本語料,從而理解文本語意,生成文本內容。

LAM大動作模型學習的是人們操作應用程序的行為路徑,可基于指令完成應用程序操作。

我們接著來看第二款產品。

二、AI-PIN

AI Pin是初創公司Humane的首個產品,兩位創始人均為蘋果的前員工。

它是一款可以吸附在衣服上的智能設備,沒有屏幕,設備中搭載語音裝置和投影儀,可以通過語音、手勢、觸控等形式與設備進行交互。

產品的基礎定價為699美元,外加24美元的月訂閱服務費。

其中訂閱服務費的核心服務包括:T-Mobile電話號碼和網絡服務、照片/視頻/文件的云存儲服務以及GPT4的無限調用次數。

1. 產品設計理念

其目標是減少用戶對智能機的依賴,以全新的、無屏幕、可對話的形式,賦予用戶隨時隨地使用AI的能力。

簡單的說就是想干掉智能手機,邁入穿戴設備的iPhone時刻。

2. 硬件方面

AI Pin由兩部分組成:設備和電池,設備與電池之間可通過磁性吸附在衣服上,產品總量為54克,相當于一個雞蛋的重量。

設備的頂部方搭載了麥克風/揚聲器,能夠進行音頻播放,作為語音信息輸入的關鍵配件。

設備的上方搭載了廣角攝像頭能夠進行拍照、攝影。作為AI信息輸入的“眼睛”,能夠識別和分析現實中的商品或檢測食品的營養成分。

在攝像頭的旁邊裝在了激光投影儀,可將數字信息投影在手掌上,從而實現數字信息的展示與交互。

抬起手掌即可喚醒投影裝置;

通過手掌側移,手指捏合可以實現數據信息的交互。

設備的下方為觸控板區域,能夠通過手指實現觸控交互,如單指點擊并按住,可以和AI進行交流;雙指雙擊可進行拍攝,滑動可控制音頻的音量等等。

3. 軟件方面

AI PIN操作系統名為Cosmos。

它支持實時訪問GPT4,不僅可以對輸入的信息(語音或圖像)進行處理,也能通過AI幫助我們總結和搜索重要信息,比如:語音輸入特定指令:Catch me up 后,AI會將我們日常重要信息進行摘要匯總,也能通過語音指令,讓AI檢索信息后,直接告訴我們信息內容。

AI PIN提供了個人信息的管理中心,名為:Humane.center。

在Humane.center中,用戶可管理自己的數據,包括照片、視頻、筆記、郵件、短信等,隨著這些信息不斷的豐富,AI會更懂用戶,成為真正的個人助理。

AI PIN這款產品的出現,無論在外觀的工業設計、人機交互方式,還是與生成式人工智能的結合上,都為可穿戴人工智能設備開辟了一條新道路。但是這款產品本身也做不到替代智能手機。

主要分享兩個個人觀點:

第一,該產品的使用場景受限,語音交互作為AI PIN的主要交互形式,在相對嘈雜環境中會影響信息輸入的準確性、在相對安靜的環境中,對于I人來說不好意思開口,不適合在公共場所中使用。其次投影+手勢交互形式,雖然形式很新穎,但在手掌投屏,其清晰度、可見度和內容展示的豐富度,都不如顯示屏。

第二,雖然AI PIN自建了COSMOS操作系統~~,并且能夠讓用戶在Humane.center中管理和上傳與自己相關的數據~~,但該系統不支持接入第三方應用程序APP,所以無法構建生態應用,導致在智能手機中的數據遷移成本過高。

三、TAB-AI

Tab AI由一位名叫Avi Schiffmann的哈佛大學生開發。

它是一款可穿戴的AI項鏈,目前的產品樣式是一個圓形的裝置,內置通過麥克風、藍牙和電池,可持續運行 30 小時、全天候、不間斷地記錄周圍的對話。

1. 產品設計理念

AVI在做這款產品時,他認為穿戴設備只是作為一個附屬物,最好是讓使用者幾乎感覺不到它的存在,所以硬件設備只需要能夠持續運行、隨時可用即可,無需有復雜交互方式。

2. 硬件方面

在產品的硬件設計上,最重要的三個硬件裝置就是麥克風、藍牙和電池,項鏈僅僅作為語音信息收集端,將音頻收集后,傳到軟件系統中,進行音頻轉文字的處理,處理后的文字內容存儲在云端服務器中。

一方面作為AI的知識庫,可以被AI調用,讓AI更懂用戶。

另一方面,可以將文本傳給大模型進行內容分析,比如個人的情感分析 或者 心理健康狀態分析等等。

3. 軟件方面

用戶通過在手機應用程序的中與AI進行交流,交互的方式類似于移動端的ChatGPT,支持語音和文本的輸入,支持多輪溝通。

所以Tab AI通過獲取用戶日常的語音數據,了解了用戶整個生活背景的上下文,能夠輸出專屬于我的內容。

我們沿著這個基礎上做更近一步的假設。

除了在搜集音頻外,Tab AI若能夠近一步的做出行為規劃,那將是一件更酷的事情。

比如一場會議結束后,AI通過搜集到的音頻內容,自動生成會議紀要以及待辦事情。

再比如我們日常交流觀點時,AI能夠獲取我過往的思考,并與當前討論內容進行結合,從而幫助我們形成知識的連接。每一個富有創新的想法時,就是在一次又一次的思維碰撞與連接中產生的。

結尾

好啦~咱們分別介紹三款消費級AI設備:Rabbit-R1、AI PIN、Tab AI

你更喜歡哪一款呢?

隨著時間的推移,AI必將成為我們日常生活中的合作伙伴、助理、甚至是懂你的朋友,它可能以具身機器人的形態出現,也可能以日常穿戴配件的方式融入我們的生活,無論以什么形式,我們都將迎來一個更加智能、便捷、高效的美好生活。

感謝你的觀看,咱們下期再見。

作者:在野在也,公眾號:在野在也

本文由 @在野在也 原創發布于人人都是產品經理。未經作者許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!