【2.1 萬字實錄】Rabbit 創(chuàng)始人&CEO 呂騁最新對談|R1 更像是 AI + iPod,而不是 iPhone 殺手
這是 Rabbit CEO 呂騁(Jesse Lyu)在 CES 后在《This Week Startup》節(jié)目上與硅谷知名天使投資人 Jason Calacanis 最新對話,長達 90 分鐘的對談詳細描述了他最新的產品思考。
呂騁強調了技術的演進是為了解決相同的問題,但以更直觀的方式。他詳細介紹了 LAM (Large Action Model)的工作原理, LAM 旨在提高效率、節(jié)省時間,這是一個真正的時間節(jié)省裝置,讓用戶更多地專注于其他事情,這一理念是公司的核心驅動力。
此外,他還分享了個人 10 多年前開始的硬件創(chuàng)業(yè)的挑戰(zhàn),以及硬件創(chuàng)業(yè)現在與過去的不同之處,討論了硬件迭代周期的縮短、深圳等地的制造能力,以及對低延遲技術對 AI 和數據中心能源消耗潛在影響的擔憂。
以下為這次對談的全部內容:
Jason Calacanis:
上周我們討論了 RabbitR1 ,它是 CES 上最值得關注的新產品之一,這是在拉斯維加斯舉辦的消費電子展覽,也許你們在 X/ Twitter 上看過它的演示視頻,這是一個看起來非??岬漠a品,是一款便攜式 AI 伴侶,可以放在口袋里。
它上面有一個用于導航的輪子,有一個可以翻轉的攝像頭,還有一個LED屏幕,我猜的,還有一個明亮漂亮的橙色,是我最喜歡的顏色,它是當場的明星產品。
他們進行了很棒的演示,今天我們邀請創(chuàng)始人來談談這個產品。在某些方面,它真的有點復古,但它擁有自定義的 LLM 和 200 美元的價格,讓所有人都興奮不已。
他們已經賣出了超過 6 萬臺這樣的設備。在過去的五天里,他們每天都在賣出大約 1 萬臺。Rabbit 創(chuàng)始人 Jesse Lyu 就在這里,公司位于加利福尼亞州圣莫尼卡。
Jesse,你好嗎?見到你很高興。你是否預料到你的設備會引發(fā)這種反應?你是否認為它會成為最熱門的產品,除了 LG 首款無線透明的 OLED 電視外?很多人對這款透明電視也感到興奮,我甚至不知道透明電視有什么用途。如果它靠在墻上,我們能看到墻后面嗎?對我來說這毫無意義。那么,這是什么感覺?你是否預料到這種情況?
Jesse Lyu:
一點也沒有。說實話,我們對觀眾非常謹慎,也對你坦誠以待,我們預計第一天可能會銷售 500 臺,早期市場采用者可能會有 3000 臺,這可能就是全部了。但我們確實準備好了,如果需要的話,可以加大訂單。
我們也有備選計劃,但我是團隊中最保守的一個。我們的市場團隊和設計團隊可能比我們更有信心,但對我來說,我非常保守。
有一件事我必須提到的是,我喜歡這個產品。第一個原型實際上是一個帶屏幕的Raspberry Pi。因為我們是一個非常小眾的團隊,我們去年早些時候推出了一個 Web 版本,供一小部分用戶測試 LLM 的一個功能,即提前播放 Spotify ,結果很好。
我喜歡這個產品,因為我大約 4 個月前擁有了第一個原型,它的外觀和手機差不多。大約 8 個月前擁有了預制的手工原型。我一直在搗鼓它。另一方面,我有點擔心,也許我們只是一群極客,這只是我們自己的小玩意兒。
Jason Calacanis:
為自己制造能帶來快樂的東西,至少你知道你有一個客戶,就是你自己,然后你只需要弄清楚是否還有其他客戶。
讓我們從這個瘋狂的價格開始,這個設備售價200美元。我看了一下,沒有訂閱費用。如果你想在里面插入 LTE 卡,你需要有一個數據訂閱,
如果你想加入 5G,那就是你的事情了,只需購買 Google 的數據卡,大概每個月 20~30 美元,它們相當便宜。如果這個設備只賣 200 美元,硬件又如此精美,你如何打算從中盈利呢?我在想,你如何將這個做成一項業(yè)務?
Jesse Lyu:
我想從商業(yè)角度來看,這是最常被問到的問題之一。
首先,我可以告訴你,Jason,我們非常努力地在設計和硬件成本之間尋找完美的平衡,盡管我不能告訴你一個非常確切的硬件成本數字,因為我不允許分享,但我們確實從硬件上賺錢。
根據我觀察到的和我在過去職業(yè)中學到的,硬件的毛利潤非常低。如果你看手機,毛利潤可能在 -25%~7%或8%之間,僅此而已。盡管如此,大多數人仍然試圖通過硬件來賺錢,顯然是訂閱。
與 eSIM 相比,選擇制作相同的托盤有兩個原因,一是我們希望進一步削減設備的硬件成本,因為 eSIM 需要更昂貴的部件,而相同的托盤則不需要,但更重要的是,我們希望將產品銷售到多個目的地,而不是像在美國。
我們需要與運營商進行談判,比如 Verizon、T-Mobile 或 ATT 等。我們進展得太快,沒有時間坐下來與這些公司一年時間的談判,而現在他們主動聯系我們,這非常好,所以這都是戰(zhàn)略性的決策。
首先,我想糾正一點。實際上看了你上一集關于我們的節(jié)目,我們沒有制造任何 LLM 。我們使用的是神經符號模型,它不是一個 LLM ,通常我們說的是 GPT、Bard、Grok 等,這些都是基于 Transformer 的,它們需要大量的云端 GPU 來進行訓練并獲得正確的結果。
沒有哪家初創(chuàng)公司能夠突然間制作自己的 LLM ,就算籌集到 3000 萬美元的資金也不行,所以就記錄而言,我們沒有這樣做。我們與所有最好的語言模型和小型語言模型合作。如果有開源語言模型,將來我們也會考慮。
基本上,我們建立了一個內部評估系統(tǒng),以持續(xù)監(jiān)測所有主要供應商的性能,可以靈活切換,這就是 RabbitOS 的工作原理,但我們專注于 LAM (Large Action Model)。
我們確切知道,語言模型或 Transformer 是為更好地理解語言而設計的,但至少目前在完成任務方面表現非常糟糕,而且我們不喜歡與 API 一起工作,因為 API 有很多問題。
首先,你要賭所有人都會為你提供 API ,事實并非如此。對于 OpenAI 來說,鼓勵或大公司鼓勵所有人為他們構建 API 更容易,但對于初創(chuàng)公司來說,很難說服突然間有 2000 個供應商在你的 API 中按照你的格式工作。
即使你擁有所有的 API ,往往它們也不能完全復制 App 的全部功能。比如,我的上一家公司 Raven(渡鴉科技)工作時曾與 Uber 的 API 合作過,他們的 API 只能完成 10 項任務中的 3 項,要說服他們做出 App 的全部功能非常困難,因為他們沒有激勵,所以我們不喜歡 API 。
這就是為什么我們想要一種通用解決方案,也為通用解決方案創(chuàng)建了一個 AI 。無論是 Android App 、iOS App 、Windows App ,無論是什么 App ,我們都要構建一個通用解決方案,知道語言模型并不是為觸發(fā)動作而設計的。
因此,我們實際上使用了神經符號(Neuro-symbolic)來開始。我們實際上開始與數據標注公司合作。根據我們自己的評估,我們開始收集真正的人與不同種類的軟件進行互動,比如 Uber 、 Spotify 等常見的 App 。
我們大約在兩年半前開始了這個過程。開始收集真正的人與各種軟件互動的數據,然后我們建立了一個神經符號算法,它就是今天的 LAM ,你可以將所有這些剪輯放入 LAM 中,并要求我們的模型逐幀讀取這些剪輯。
Jason Calacanis:
隨著時間的推移, LAM 了解了頁面上的像素,它知道這是一個 App ,知道我在 App 中點擊了什么地方,所以當有人對 Rabbit 說:“給我訂一輛 Uber 豪華車。當我回家時,我希望有五個家庭份量的壽司準備好,包括一些卷和一些素食選項?!?它會知道如何做到這一點,因為你已經訓練了它很多次,觀看了成百上千次在一個 App 中的互動。你需要多少互動次數?我是否正確描述了你正在做的事情?
Jesse Lyu:
你描述得很正確。首先,我們不會記錄用戶的操作。我們有一個測試小組,我們?yōu)樗麄兎峙淙蝿?。我們實際上與數據標注合作伙伴一起工作,以確保所有的剪輯都是有目的地收集的,而不會侵犯任何人的隱私。
我們從來不會設置東西來記錄用戶的屏幕。但是,你的理解是正確的。我們實際上已經在 Rabbit 研究上發(fā)布了整篇論文,其中包含幕后的內容。你可以去那里看一看那篇論文。
我們從真正的人類與這些 App 互動中收集了數據。事實是,這是非常具有諷刺意味的,因為神經符號在 CPU 上運行效果比 GPU 好,所以與 OpenAI 或任何 LLM 相比,我們的云部署非常合理,我們不會談論數以百萬計的現金,甚至不會談論數百萬美元。
我們有足夠好的 GPU 集群和足夠好的 CPU 云計算。我們不是按請求收集數據。只是要求人們隨意玩耍,比如我們收集數據的方式。所以部署的任務可能是:“你有 10 分鐘的時間在 Spotify 上,盡情嘗試,做盡可能多的事情。我不會告訴你必須播放這首歌,點擊這里,做那個,你可以自由探索 10 分鐘?!?/p>
神經符號算法是傳統(tǒng) RPA 的最大不同之處。如果你熟悉 RPA,它基本上是在記錄屏幕操作,當然了,但然后部署一個預先編程的順序來導航你的鼠標、光標到x、y 坐標位置,基于絕對坐標。
Jason Calacanis:
你是說 RPA?
Jesse Lyu:
沒錯。
Jason Calacanis:
當你編程一個機器人時,你實際上可以拿起機器人手臂,然后將它移動到拾取東西,放入這個盒子中,然后再拾取不同的物體,放入盒子 B 中,它記錄了這個,學到了這個,然后可以一遍又一遍地執(zhí)行這個操作。你實際上完成了這個任務,這幾乎就像是向猴子展示如何剝香蕉,然后它按照你的方式剝香蕉。猴子看,猴子學,基本上是這樣?
Jesse Lyu:
那就是 RPA,但是神經符號將其推進了一步,因為我們不是通過屏幕的絕對坐標來識別所有這些元素,而是從符號方法直接提取和自動標記一些元素,并進行推理。這意味著如果一個 App 徹底改變了UI,也沒有關系。
Jason Calacanis:
明白了。所以當 Spotify 重新設計它的 App ,將播客從標簽中移出,然后將標簽放在頂部,或者放在漢堡下拉菜單中,它仍然知道那是“播客”這個詞,以及在 Spotify 中找到播客的地方。
Jesse Lyu:
完全正確。因為基本的邏輯是,這些現代軟件都是為人類眼睛處理信息而設計的,它們必須有一些設置,它們必須有一些符號和文本,還有搜索欄之類的東西。
與僅僅在 GPT-4 之上構建硬件相比,這對我們來說是一個優(yōu)勢。首先,我想澄清一點,我們不制作任何 LLM,我們與 LLM 合作,但我們還創(chuàng)建了 LAM ,這是一種神經符號方法。
當我告訴 Rabbit :“為我訂購一份壽司,五口之家,這么多食物,等等?!?它知道如何使用 Uber Eats App 或 Doordash App ?,F在, Rabbit 設備然后向云端的某個地方發(fā)送這個請求。
Jason Calacanis:
這個請求我已經通過一個 Web 界面進行了身份驗證,我已經驗證了我的 Uber Eats、Doordash 賬戶。它知道我喜歡的壽司餐廳,然后開始了訂餐過程。然后我想,它回到我這里,說:“只是想確認一下,這是你要的嗎?”我說是的。然后它會做什么?它彈出一個云端的仿真器,然后你有一個具有我的登錄身份驗證的 Web 仿真器,這是如何工作的?
Jesse Lyu:
首先,讓我們從認證開始。因為如果你考慮這個設備,它與以前的一代設備的工作方式完全不同,因為它沒有預先安裝任何軟件。它沒有預先安裝任何東西。它只是一個 AI ,你可以選擇啟用什么樣的服務。你可以選擇這個設備有多復雜,有多高級。
如果你只說:“這是一個看起來很酷的 iPod ,我只想用它來聽音樂。”然后你解鎖音樂功能,選擇任何供應商,它只會播放音樂。
但是明天,如果你想開始點餐,你必須解鎖那個功能,登錄過程你的理解是正確的,我們有一個 Web 門戶,有點像我們自己的迷你版本的 IQ/icloud,如果你理解的話,它有助于所有的身份驗證設置和功能管理。
你去網站上,你基本上選擇你想要解鎖的任何服務,因為再說一遍,對于 LAM 來說, Spotify 、YouTube Music、Apple Music 都沒有區(qū)別,它們都是接口。事實上,Expedia 和 YouTube Music 甚至沒有區(qū)別,它們都是接口。
我們給你自由選擇你想要解鎖的首選服務,你去那里,然后你點擊“連接到 Spotify ”按鈕,然后接下來會將你重定向到 Spotify 登錄界面,我們不保存你的憑證,我們不觸碰它們。
你點開 Spotify、 Uber 或者 Doordash,通過它們登錄,然后我們會識別出這個賬戶已經與 RabbitOS 連接了,然后發(fā)生的是,在我們的云端,有一個非常創(chuàng)新的結構。
我們有一臺超級計算機,當 Jason 與他的 Rabbit 談論從 Doordash 訂購漢堡時,發(fā)生的事情是,首先我們會看到 Jason 是否登錄到了 Doordash 或 Uber Eats,然后我們看到 Jason 選擇了 Doordash,接著在那臺超級計算機上 LAM 與 Doordash 的 App 或網站進行虛擬互動,你看不到這一切,因為突然之間這一切都完成了,因為這是 AI。
然后,我們將重新渲染 Rabbit 的主題界面,為你提供結果,你也不是直接與主機互動,你只是與它對話,意圖傳遞給 LLM。
Jason Calacanis:
你想做這個,然后 LAM 在虛擬環(huán)境中執(zhí)行,然后重新渲染結果到你的設備上。這就是它的工作原理。你是否需要得到 Spotify 的許可才能這樣做,或者你一旦在數據上訓練了它,就可以做到這一點?我是說,獲得許可是不錯的,但聽起來你可以不需要。
Jesse Lyu:
是的。當然,得到這些人的許可是不錯的,或者我不應該說許可,我們應該開發(fā)一種更好的商業(yè)模式。對我來說,這有點像是早期,喬布斯給索尼打電話,說:如果從明天開始,因為我們有了這個設備,每首歌要 9 美分,我覺得這有點像是類似的情況。
首先,我們不是在創(chuàng)建新用戶,我們不是在創(chuàng)建垃圾用戶,不是在創(chuàng)建預付用戶UIU,你是 Jason,在你的身份驗證下使用他們的接口來使用他們的服務,就像你在手機或電視上使用一樣。
我們花了很多時間來研究條款和協議,并試圖理解。對我們來說,除非他們關閉他們的接口,這是不可能發(fā)生的,因為我們沒有違反任何規(guī)定,甚至沒有創(chuàng)建虛假用戶花費。有很多浪費。
我不知道你是否看到了 Sunbird 的短信繞過 Android,有很多奇怪的方法可以設置它,但我們沒有設置任何這些。
Jason Calacanis:
這很有道理,因為對于他們來說,這只是他們的用戶通過基本上是聲音界面的方式與他們的 App 進行交互,并在屏幕上進行一些確認。
在你發(fā)布的 1.0 版本或者你發(fā)布的 0.1 版本的階段,這個互動是如何工作的?如果餐館要花兩個小時才能送貨,或者他們停止送貨。
Jesse Lyu:
這是一個很好的問題,這是我們正在努力解決的一個新問題,有一部分我們確切地知道,如果是直接操作,就會直接觸發(fā)服務,如果你想聽“幸運”,那就是了,播放“幸運”。
如果你想要立刻到那里,那很容易,但我們還發(fā)現了一些情況。我沒有在我的主題演講中展示的一些原因,我通過 Expedia 為整個旅行計劃預訂了一些內部的東西或一些與我想象的,與我想象的相當相關的東西。我們基本上想為你創(chuàng)建一個方式,讓你一遍又一遍地檢查。
確切是這樣。你們每個人都有這個意思,我自己也有這個意思。所以,我們需要分開類別。有一些情況下,你想讓 Uber 送你回家,那就是簡單的。
如果在未來有更復雜的文本,你應該能夠在你的 Rabbit Hole Web 門戶上看到一份關于實際文件的副本,這就是我們想要設計的方式。你總是可以得到一個門戶來檢查,更合法的東西,備份和你的筆記,你的會議摘要,所有這些東西都會同步到白色門戶上,這就是為什么我把它更像是我們的迷你版本的云,它實際上很小。
Jason Calacanis:
它是完全半部 iPhone ,與 iPhone 15 的厚度相同。
Jesse Lyu:
因為我有一個非常小的手,很多人都誤解了實際大小。我們實際上在辯論是否應該取消屏幕,因為對我們來說,這是一個缺點。
Jason Calacanis:
iPod Shuffle 是一款非常小的產品。所以它只是變成了一個小的錄音機,或者無論你可以將它制作成手表,你可以將它制作成任何數量的東西。確切地說,帶我參觀一下形式工廠,你用一個真的很棒的設計公司為你設計了這個,也許你可以談談你是如何使用它來設計它的,以及設備背后的靈感,因為它看起來既現代又復古。
Jesse Lyu:
這是標志性的。我不確定是否有信心說它已經成為標志性的,但我看到很多人為我們制作了機箱和其他東西的框架。這是一個很好的開始,至少這是我和 Teenage Engineering 之間的一個很棒的故事,我尊敬他們,他們是我的英雄公司。
大約 15 年前,我開始了與復古合成器有關的工作。當他們推出便攜式合成器 OP1 時,我立刻買了下來,但制作成本非常昂貴,一開始花了幾個月時間籌集資金。
首先, Teenage Engineering 不是一家設計公司,不是一個積極尋求合作并收取設計費用的公司,他們是一個非常專注于音樂技術消費品的公司,已經存在了將近 十幾二十年了,非常了不起的團隊。
我告訴我的團隊,當我還在 Raven 的時候,如果這些家伙給我一個機會,讓我去為他們工作,我會去的。時間回到 2017 年,當我正在進行 Raven 硬件項目時,我突然意識到,也許我可以說服他們與我合作,而不是我為他們工作,因為我想挑選最好的。
在我心目中,他們是最好的,所以我就寫了封電子郵件,聯系了他們,三天后,我就坐在斯德哥爾摩的他們辦公室里,然后 Yasper 是 Teenage Engineering 的 CEO 和 Co-founder。
我們都拿出了一個筆記本和一支鉛筆,然后開始畫東西。在這個過程中,他問我關于,你最喜歡的藝術家是誰?你最喜歡的汽車設計是什么,還有一些 Web Chat 的問題,令我驚訝的是,我們幾乎在一切事情上都有完全相同的口味,就像他問我的所有問題,他向我展示了他的黑膠唱片收藏,我向他展示了我的黑膠唱片收藏,完全一樣,而且順序也相同,他說,我喜歡這個,我喜歡那個。
我們談論了一些事情,然后一拍即合。整個過程就像魔術一樣,我想我從來沒有在任何媒體或社交網絡上談論過這個,但我們實際上建立了一個秘密的 Instagram 賬號。
我們沒有電子郵件通信,沒有電話,什么都沒有。我們只是開始在 Instagram 上發(fā)布草圖和視覺效果。然后,我們就像互相點贊,互相留言。就是這樣,所以我們做到了。
Jason Calacanis:
這是一個公開的賬號還是私人賬號?
Jesse Lyu:
是一個私人賬號,公開的評論。
Jason Calacanis:
這是一個有趣的方式。
Jesse Lyu:
因為時間太長了,也許以后我可以分享一些早期的作品。但我想說的是,這是兩組直覺性很強的人,我們互相認識,然后有很強的協同作用。
2018 年,我正式成為他們董事會的董事,然后我對公司有了更好的了解,我明白他們需要非常專注于他們當前的路線圖,他們有很多事情要完成。但我開始看到對他們工業(yè)設計的更廣泛的認可,過去的 3、4 年里,我非常高興。
Teenage 也是一家叫做 Nothing 的公司的共同創(chuàng)始設計合作伙伴,我不知道你聽說過一家叫做 Nothing 的公司嗎?他們制造手機 —— Nothing Phone。
我們也是 Nothing 的 Co-founder ,就像整個 Teenage 一樣,我們幫助 Nothing 建立了最初的整個設計語言和一切,然后當我們開始做 R1 的時候,情況正好相反,我們想要創(chuàng)造一些酷炫的東西。當然,我們要看的第一件事是誰在那里,我們看到了一些強大的競爭對手,比如 Humane、AI-Pin、ex Apple 的人,對團隊表示極大的尊重。
我告訴自己,我有點說服自己,你正在提供一種全新一代的交互軟件。對我來說,提供一種沒有人知道如何使用的科幻小工具實在是太冒險了。
在我的理論中,硬件從來不是首選的選擇。你不是因為想制造一個炫酷的硬件而制造硬件。大多數情況下,如果你這樣做,它會徹底失敗。我學到了很多好的案例,我也經歷了很多好的案例,你有一個很好的軟件,你想要專門的硬件來讓它變得更好,它總是圍繞著軟件,總是圍繞著內部的東西。
如果你有一個非常前衛(wèi)、非常新穎的軟件,你想在硬件上降低風險,至少在第一代的時候是這樣。對我來說, R1 是通過必要性選擇硬件的結果,而不是通過偏好選擇硬件。
如果我想做硬件,我可能想做很多其他的機型,就像你說的,怎么樣一個花哨的玻璃?怎么樣什么什么的?我們首先意識到的第一件事是,我們想建立一個良好的位置,以便我們可以與所有這些大公司和即將推出的競爭對手競爭。同時,我們也想提供一些可以與你的文化、回憶和現有工作流程產生共鳴的東西,你不需要菜單來理解如何使用它。
Jesse Lyu:
首先,對于任何單個直接操作,我現在更傾向于使用 Rabbit 。為什么呢?因為當我開始嘗試完成任務時,它的速度就像思維的速度一樣,我已經具備了這種速度。而且我覺得這幾乎比找到那個模擬按鈕還要快、更直觀,甚至可以不看它,直接說話,而且 AI 的準確性足夠好,執(zhí)行速度也足夠快。
我來給你一些快速參考。我總是在多個屏幕上,每天工作時都會同時處理很多事情,也許還要和其他人交流,如果我有什么我不知道的東西,這肯定更快。忘了鬧鐘,就說搜索方面,這絕對更快。然后我不得不設置一個新的標簽頁或者去 Chrome 開始輸入。
Jason Calacanis:
你有操作按鈕,有點像無線電,你按下按鈕,然后定義這個詞,我不需要思考,差不多 6 或 7 個步驟。
Jesse Lyu:
甚至不用那么多,一些非常高級的數字,讓你快得多,我給你一個實際的例子。我正在和我們現有的一位投資人之一開會,他們會問一些關于銷售和其他公司的一些數字的性能比較。
我一般不知道,我不知道去年一個公司的收入是多少。如果你考慮一下,我在 Google 上搜索,有 200 個標簽頁,哪一個是準確的?哪一個是正確的?這就是為什么我們設置了戰(zhàn)略合作伙伴活動,只是為了增強這一部分,這就是單單搜索。
另一件事是音樂。我可以告訴你,你會喜歡這個的,因為它可以播放音樂,這是第二代經典 iPad,具有相同級別甚至更簡單的控制。我昨天實際上有幸與 Tony Fadell 通了電話,我們通話了三個多小時,光是播放音樂,這在過去的八個月里肯定是我的首選。除了搜索,可能有 70% 的時間都在聽音樂。
很多人仍然不明白。我開始在 Twitter 上發(fā)布一些東西,有一個場景我使用了視覺功能,基本上我雙擊相機旋轉并指向你想指向的任何東西。我使用視覺來查看一個 Discord,因為 Rabbit 。過去的三天,我們已經有了 5000 名會員,而我是那里的客服人員。
Jason Calacanis:
作為創(chuàng)始人來聽客戶支持熱線,那里才是離用戶最近的地方。
Jesse Lyu:
我盡量回復盡可能多的信息,但我開始迷失了,因為信息太多了。我實際上在與其他人的視頻通話中,然后我簡單地指向相機,說,這里的人在談論什么?很多人不明白怎么用,很多人認為,你有眼睛,你不是盲人,這太愚蠢了,你為什么要這么做?
實際上我正在做其他事情,沒有時間滾動鼠標查看 50 頁的內容,即使當前版本的視覺 GPT 和我們自己的視覺模型需要更快,實際上在發(fā)布之前需要更快,我正在推動它,經過 4~5 秒鐘,它會說,這是一個結論。人們正在討論 Rabbit R1 如何可能浪費工作,它給我提供了報告。
Jason Calacanis:
通常情況下,你可能會有一個受過大學教育的人,你會告訴他總結每天客戶支持線上發(fā)生了什么?或者你可能會指著它,讓 LLM 去做報告,這里你只需迅速拍個照片。
我也遇到這個問題。這個周末我在滑雪,一直試圖用 Siri 來更改我的音樂,只是降低音量或更改曲目或播放不同的播放列表都非常痛苦,你說的是成功需要 5~10 秒, Siri 弄錯了,然后你必須重新操作,然后你的音樂會被切斷。
你說你按下這個按鈕,然后很快地現在的響應時間,所有這些智能音響系統(tǒng),你提到了幾次 Raven,你曾經賣給了百度,那是你的第一家公司,我想,或第二個公司。你一定學到了很多關于聲音命令的響應時間,等待那 4~5 秒鐘等它醒來并理解你在做什么是多么可怕。這是你正試圖解決的問題,就是前 5 秒,你如何解決這個問題?
Jesse Lyu:
如果分解一下,延遲來自兩個部分。LAM 很快。如果你去查看我在 Twitter 上發(fā)布的演示,就會發(fā)現它很快。播放一首歌是瞬間完成的。
如果你問一些隨機的通用問題,我們有一項技術,基本上是通過 LAM 來制作流式令牌,使它非常快速。如果你問橙子和橘子之間有什么區(qū)別?任何不需要最新信息的事情,500 毫秒以內,如果你嘗試在剛開始使用 OpenAI ,那么任何搜索最新信息都會開始變慢。
我最近沒有嘗試過,我覺得最近又有所改進,但通常情況下,我們談論的是與500 毫秒相比,2~3 秒的時間。但視覺部分是延遲最大的地方。
我們談論的是大約 8~10 秒左右,但這不是我們的問題。這實際上是目前行業(yè)中最快的速度,我們正在不懈努力地尋找進一步縮短時間的方法。
現在延遲的主要原因真的只是搜索最新信息,僅此而已。如果你只是觸發(fā) LAM 的東西,那就很快。
讓我告訴你一些挫折。首先,我不想攜帶兩個設備,沒有人想攜帶兩個設備。我不是要說服人們這只是性感,所以也許你想攜帶。
目前我們所能做的是,我們知道它不能成為一個 App 。與你的 iPhone 相同的足跡。它實際上非常輕,只有 110g 那么 110g 是什么感覺?從你的冰箱,拿兩塊沒煮過的排骨,就是這樣,它足夠輕,以至于每次我放進口袋里,都會忘記它。
我感謝自己設計的模擬按鍵,因為我不需要真的把它拿出來看屏幕,我伸手到口袋里,覺得那個按鈕。那實際上是我大多數時間使用它的方式,只需連接我的 Airpods 或其他藍牙設備或汽車系統(tǒng),我真的不需要看它。
我伸手去摸,但還有很多事情我寧愿去手機上查看,至少目前是這樣。首先是重要的社交功能。至少在這一代中,這并不是為了連接所有你的朋友,閑聊并了解發(fā)生了什么,這更注重于解決任務。不幸的是,這部分我必須回到手機上,另一部分是專業(yè)的群聊。
Jason Calacanis:
如果你想加入 Signal、WhatsApp 或其他通訊工具的群聊,它還不能完全替代。
Jesse Lyu:
我們可以,它有個托盤,有 SIM 卡,它是一部手機。我們不是在努力成為一部手機,但它有能力做到手機所有功能。另一件事是,也許這只是事實,手機實際上是一個內容消費設備,如果你想一下 AppStore 上增長最快的 App ,那就是 TikTok、Netflix、 Instagram 等等。
iPhone 有一個更好的屏幕,我不得不承認這一點。這就是為什么,當我開始考慮激光投影儀時,我不確定,因為我看到了 Humane 的演示,手勢發(fā)送消息,我可能不會這樣做。
當我 2013 年開始 Raven 時,我實際上是與 Sri 幾個人合作的,似乎是斯坦福大學,后來成立了 Nuance,Nuance 孵化了 Siri,所以有一個很長的歷史,但我記得非常清楚的是,當我第一次拜訪 Siri 時,口授大約在 74% 左右,以本土英語為基礎,這是非常糟糕的,但它很快就上升了。
另一個問題是意圖理解。我們正在談論的是 Transformer 之前的時代,然后在 Raven 時,我們非常努力地開展自然語言處理或 NLP 工作,那是 Transformer 之前的最佳技術。我猜想問題不是因為我們沒有考慮我們可以設計算法的方式,只是當時我們沒有足夠強大的計算能力,比如 GPU 可以運行它,所以如果你說意圖識別,它真的很痛苦,非常消耗人力,因為本質上 Alex 以及以前的每一代智能音箱,就好像你正在為這個所謂的 AI 組裝一個菜單,然后你基本上是在硬編碼,這是 70 種與揚聲器交流的方式,這意味著你想聽這首曲目,有一堆句子可以描述相同的意圖,NLP 是幫助我們理解和組裝這個菜單的方式,很多事情都不太理想。
我完全理解對 R1 的懷疑,這是一個語音優(yōu)先的設備,因為我們都是同一代消費者,仍然患有從早期非常糟糕體驗的 PTSD。
Jason Calacanis:
確切地說,這正是 Siri 讓人們感到沮喪的地方,Alexa 更好一些,但在手機上的應用程度沒有 Google 那么高, assistant 從來沒有真正流行起來,我們只是假定它不好。
事實上,現在情況好多了,即使是使用 ChatGPT 的 App 也是如此。我現在用 iPhone 15,它有一個動作按鈕,類似于你在 Rabbit 上所做的,我把它連接到了 ChatGPT 的語音界面,當我按下它時,它在 App 中進入了那個對話模式,這非常好。
在美國,它會迅速運行,你什么時候會知道你已經制作出一個可以挑戰(zhàn)口袋中的手機的產品?你會贏得回家拿哪個設備的比賽,如果你忘記了你的手機,你會回去拿它。如果你忘記了你的錢包,你不會回去拿,你會說,我忘記了我的錢包。我的電話上有一些支付選項,如果你沒有它,你得回去拿,當你達到這個里程碑時,我必須掉頭回去拿我的 Rabbit。
Jesse Lyu:
首先,挑戰(zhàn)是一項雄心勃勃的任務。我們從來沒有自己設定,至少在心態(tài)上,我們從來沒有自己設定,就像 Rabbit 的整個目的是要殺死 iPhone 一樣。
不管它是什么。另一方面,我們深刻理解,特別是由于我的經驗,我的公司被賣給了百度,我們有一個非常獨特的工作關系,仍然保持著 Raven,但我已經看到足夠多了,不僅是百度,還有微軟,所有其他公司,大公司是如何運作的。
我們目前的看法是,我們不認為我們有信心挑戰(zhàn)它,但我們也不想等待。就像你可以成為用戶,我在 Twitter 上發(fā)布了產品,成為弄潮兒、旁觀者,還是陪跑者?你只能成為這三種的一種。
我們不是說有多少雄心勃勃,或者妄想,我有一個非常明確的總體計劃,這不是創(chuàng)業(yè)公司的性質。我有很強的信心的一件事情是,對于所有這些基于 App 的操作系統(tǒng)的當前一代,要想改進是不可能的,因為技術不是,根本操作系統(tǒng)的轉變,它永遠不會是一種改進,它總是重新運作,它總是相關的。
問題不在于技術。很多工程師在工程師的角度上有不同的看法,他們認為只是這樣做 Siri 就變成了 R1 ,那里就成了 RabbitOS。
不是這樣的,問題是他們賺錢的動機背后,他們建立了一個擁有數十億開發(fā)者和數十億 App 的整個 AppStore,突然間沒有 App 了,這怎么可能?
我看不到一個非常順利的過渡,它怎么能夠如此迅速地改變?我們認為應該等一等,進一步降低風險。我認為,考慮到 R1 是 iPod ,對于我們正在討論的一定數量的請求來說,它是比 iPod 稍微寬泛的要求,因為 iPod 確實只是為了取代 Walkman,但在 iPod 時代,你仍然用黑莓電話,我用黑莓 8900,我有我的 iPod,你有兩個褲袋。
Jason Calacanis:
每個褲袋放一個。
Jesse Lyu:
完全正確。它有點像固定形狀,如果你穿牛仔褲,你甚至不想摸它,你只是放在那里。但我們有 R1,這是我們對未來結構的第一次嘗試或方法,未來軟件將如何與人類一起工作?你如何與軟件互動?也許在一年半到兩年內,我們會有一個更好的答案。
Jason Calacanis:
現在,你要去找那些早期采用者,想要嘗試它的人,想要投入時間并給你非常好的想法的人。有沒有 App 開發(fā)者直接來找過你,只是想直接為你的 LAM 制作東西,提供接口, Uber 的工程師和你的工程師可以在同一個空間中無縫運行,實際情況是這樣么?
Jesse Lyu:
實際上這是雙方的。一方面,我們在 Twitter 上通過握手方式進行了交流,沒有預先溝通,現在我們?yōu)榍?10 萬臺設備提供 200 美元的 Credit。如果你考慮設備本身,價格只有 99 美元。更重要的是, RabbitOS 最被低估的特性,目前還處于實驗階段,但我們有信心很快在用戶收到設備后推出至少是 beta 的版本,這就是教學模式(Teach Mode)。
教學模式如何工作?實際上你之前解釋到了,就像猴子對猴子,你去這個網頁門戶, Rabbit Hole,打開教學模式,你決定今天我要教你點什么,就像你在教你 8 歲的孩子一樣,你會說,來找爸爸,坐在這兒,看我在做什么,學吧。
如果你考慮神經符號學,同樣的比喻,背后有一個心理因素,如果我讓你教我滑板,你是否愿意?有兩個決定,一個是你是否愿意做;第二,即使你想做,你可能也不愿意做。但更重要的是,如果你根本不知道如何做,你只會說不。對吧?所以你作為用戶去教學模式,你確切地知道你要教什么。
Jason Calacanis:
對吧?如果你從來沒有滑過滑板或滑雪,你是不會去教滑板如何使用的。但如果你說,嘿,我該怎么滑雪呢?如果我選擇這樣做,這將是很好的訓練數據,這就是你的想法。如果有一個 App 人們沒使用,就像你還沒有訓練 Twitter ,我可以說,讓我訓練 Twitter ,去記錄我的回復,我提及的內容,我喜歡讀的內容,然后請馬上大聲告訴我其中 5 條內容,但不需要你朗讀日期,只是想讓你讀內容,只需讀前 200 個字,而不是整個內容。
Jesse Lyu:
完全正確。你已經在使用這個功能了,這就是它的強大之處。教的時候,你知道你在做什么,你收集的數據,我們不會記錄在你的本地設備上。我們啟動虛擬機,這是一種舊技術,你進入虛擬機,選擇你想要教的平臺,然后開始教,這個錄音非常干凈,RabbitOS 可以獲得一次性的機會。
Jason Calacanis:
所以你讓整個社區(qū)來教 RabbitOS。
Jesse Lyu:
構建你自己的 Rabbit,這就是我們賺錢的方式,順便說一句。
Jason Calacanis:
明白了。我可以制作一個 Rabbit ,那將是我解釋 TikTok 或社交媒體 App 的方式,就像我們談到的那樣,然后我可以出售這些,我可以賣給其他用戶我的 Rabbit。
Jesse Lyu:
我們不是在重新發(fā)明任何商業(yè)模式,這是經典的 App , Apple 的 AppStore 或Google Play 商店獲得的邏輯,但我們不擔心從現在開始賺錢。
Jason Calacanis:
像這樣制作硬件設備,構建這些東西,你需要多大的團隊?我們看到很多人用更少的資源做更多的事情,我很好奇。
Jesse Lyu:
迄今為止,我們有大約 17 個全職員工,但我們正在招聘,但我也與優(yōu)秀的 ODM 以及 OEM 合作。在過去 Raven 職業(yè)生涯中,我有資源,這是同一個團隊加上,設計部門和十幾歲的孩子幫了我們很多忙,但我們正在招聘,正在努力制作 LAM 的未來版本。
考慮一下,這是 LAM1,我們正在設計 LAM2,明年將會更加有趣,具有不同的手機特征??傮w想法是,我從我以前的公司中學到了,如果你的目標是在第一天就賺錢,你可能根本不會成為一個消費者硬件公司,你會變成一個…..怎么說呢? 更像是 Oracle。
Jason Calacanis:
你似乎受到了 iPod 的很大啟發(fā),如果你想想 iPod ,我不知道你是否還記得,第 2 代 Shuffle,這是我的最愛。我相信 Apple 的巔峰瘋狂,它是一個夾子,幾乎就像一個領帶夾。
Jesse Lyu:
短一點的頭,耳機線短一點,他們也沒有改變,我記得它是一個環(huán),我也有。
Jason Calacanis:
一個短的耳機線,因為他們知道你要把它放在腰部以上,你不需要把它跑到口袋里,但它也有物理控制按鈕,所以從那個角度來看,它非常優(yōu)雅,物理上有滾輪,這個滾輪在這上面有什么作用?
Jesse Lyu:
我們正在研究不同的想法,我不能分享太多,但我可以分享一個正在研究的想法,這是如何解鎖你的設備。
Jason Calacanis:
當你在高中的時候,你的密碼就像一個鎖,兩次左轉,兩次右轉,那真是太聰明了。
Jesse Lyu:
帶有觸覺提示,而且沒有人會知道的,它甚至不是一個文本或什么的。
Jason Calacanis:
太酷了。所以會有不同尺寸的,你說你實際上不需要屏幕,你需要制作自己的響應式耳機嗎,還是你認為是藍牙的?
因為我有一個問題,我有我的 Airpods 第三代,它非常優(yōu)雅地工作,但我更喜歡 Pixel Buds,我不知道你是否用過 Pixel Buds,但它們是扁平的,他們是更加優(yōu)雅的設備。
如果你使用滑雪頭盔,如果你睡覺前想聽播客或像我一樣聽有聲讀物,它們更好。那么你怎么看?因為如果它是一個獨特的耳機,那么我會有硬件收益或用戶界面收益嗎?
Jesse Lyu:
如果你從內核的角度自定義,你可以進一步降低延遲,延遲是個問題,特別是在汽車系統(tǒng)中,這就是為什么所有的汽車理論都不起作用的原因,因為汽車系統(tǒng)的延遲是非常好的。它的藍牙 5.0,它默認適用于任何不同的默認機場和第三方制造商。我更感興趣的是,也許我們可以做一個 Rabbit Airpods ,但它是完全獨立的。
Jason Calacanis:
這太有趣了。所以你把它們戴上,它就是你的 Rabbit 版本。我只需與它交流并進行身份驗證,我只帶著我的 Rabbit Airpods 出門,說給我訂一輛 Uber,它說 OK,Uber Black、Uber X 或者 Uber SUV,這太酷了。
Jesse Lyu:
這些挑戰(zhàn)來自一個方面,你在等待一個更小但更強大的芯片。如果我做一個 Airpods Max,我可以很容易地做到,我現在就可以做到,但如果你想做得對,就會有一些挑戰(zhàn)。
Jason Calacanis:
在你的情況下,必須有 SIM 卡或 eSIM 或其他什么,電池壽命開始起作用了。有很多不同的問題,這是一個絕妙的想法。如果你有頭戴式耳機,而 Rabbit 內置在其中,然后你只需要那些。有沒有人曾經在耳機里放過 CPU ?我從來沒有見過,那將是令人驚嘆的。
Jesse Lyu:
深圳或秋葉原肯定有一些這樣的產品,我們可以去找找。理論上,我是說,深圳已經查過了,我打電話給我的朋友,確認那里有,高通以及 Apple 正在研究這個問題,我們不僅僅是在談論。
Jason Calacanis:
他們可能會推出這個,你認為他們可能會推出嗎?
Jesse Lyu:
這是每個人正在努力的方向。
Jason Calacanis:
我會戴上我的 Airpods Max,不管他們叫這些什么,那么我喊 Siri 進行播放,不需要帶著手機,它有內置 Wifi 和 LTE,那將是驚人的。
Jesse Lyu:
Jason,我給你看點東西,這是 R1 的實際主板, 我們甚至沒有試圖使它更小,因為看看手機的形狀,它很合適。如果我非常努力地嘗試使它更小。
Jason Calacanis:
它是一張撲克牌的一半,如果你把黑桃剪成一半,這就是主板的大小。
Jesse Lyu:
所我們現在可能可以做到,但我想做 Airpods 版本,那會有一點挑戰(zhàn)。另外,因為你想要將其設置為始終監(jiān)聽,電池也是一個問題。
Jason Calacanis:
監(jiān)聽需要更多的電池。
Jesse Lyu:
我對未來 48 個月非常有信心,我們可以開始研究這個問題,但另一件值得考慮的事情,我沒有泄漏我說的任何東西,這只是我的思維邏輯,這是我們接下來要做的事情。
Jason Calacanis:
這不是產品路線圖。
Jesse Lyu:
這不是,我們只是隨口說說。手表也是一個很有意義的選擇,社區(qū)成員中已經有很多人在 Twitter 上設計了 Rabbit 手表并標記了我,做得很棒,但如果你仔細想想, Apple Watch 可能是他們整個產品線中最弱的產品。
Jason Calacanis:
我必須說,直到 Ultra 出現之前, Apple Watch 都不怎么樣。電池壽命更長了,屏幕尺寸更大了。當我跳入水中時,它會告訴我我在水下多深,它的電池壽命實際上能夠持續(xù) 2 天,與其他產品相比,這是一個巨大的改變,屏幕比其他產品大多25%,它的屏幕非常亮,100% 非常亮。
Jesse Lyu:
這也是一個重要因素。我的意思是,從我自己的經驗來看,也許 Apple Watch 在他們整個產品線中是最弱的,因為它是一個配件,不是一個獨立的設備。
Jason Calacanis:
他們確實沒有將其作為一個獨立的設備來關注,我同意。
Jesse Lyu:
他們說它是一個獨立的設備,我明白你可以打電話,我明白有些功能,但有些地方做得不好。
Jason Calacanis:
打電話不好。
Jesse Lyu:
一些 Youtuber 用它做了一周的挑戰(zhàn)。我看到 Youtuber 挑戰(zhàn)了。我覺得有人真的用他們的 Apple Watch 一周,它可以工作,但它不是為這個設計的。有一個很好的機會或想法,因為我開始關注孩子和他們的設備使用方式,這是社區(qū)的一部分。
Jason Calacanis:
在我們繼續(xù)之前,我只想在現場展示一下,這是一個粉絲制作的作品,所以對于正在觀看的人來說,它是標志性的橙色,非常華麗。然后它有像是冠軍一樣的表冠。但最棒的部分是它有一個彈出式相機,屏幕上設計有一個彈出式相機的小缺口,完全不切實際,但很棒。
Jesse Lyu:
它保留了所有關鍵的元素,像通風孔,通風格柵等,令人印象深刻。
Jason Calacanis:
這個社區(qū)是如何開始的?順便說一下,因為你是不是引導了這個瘋狂的工業(yè)設計社區(qū),還是他們跟隨著 Teenage Engineering ,叫什么來著?Teenage Engineering ?
Jesse Lyu:
是的。
Jason Calacanis:
Teenage Engineering 鼓舞了工程學生或其他工程師,因為看到了多少人開始制作你的標志性產品的衍生品擴展。
Jesse Lyu:
確切如此。首先,我要非常感謝 Teenage Engineering 。如果你曾在設計或工業(yè)設計或音樂方面工作過一天,他們都是最高級別的。至少這是我的觀點。我不在乎有人是否同意或不同意我的觀點。在我心中,他們是最頂級的,這是一部分。另一部分是,Jason,手機現在太無趣了,工業(yè)設計基本上已經死亡了。
Jason Calacanis:
我可以解釋一下,因為我不能告訴我的過去五代 iPhone 之間的區(qū)別,確切如此。
Jesse Lyu:
像手機公司一樣,它們堅守著它們當前的樂趣因素。通常,如果我們考慮一下有趣的時光,讓我們考慮一下 Sidekicks、Engage,想想那些東西,像翻轉的諾基亞手機,這已經過去很久了。
如果你看看過去,尤其是過去的五年,三星和 Apple 是一個很好的例子,現在它們已經成為了經典,我看到了 iPhone ,我知道那是 iPhone ,我看到了Galaxy,我知道那是 Galaxy 手機,但我也可以 100% 地告訴你,下一代將會看起來一樣,只是顏色不同。
Jason Calacanis:
這是因為制造成本的原因。制造這些新版本非常昂貴,這就像汽車一樣。一旦你為豐田普銳斯制造了一輛新版本,每次重新設計它,你都要重新啟動整個生產線,而且你得不到任何規(guī)模效益,所以這是一個規(guī)模業(yè)務。你試圖在競爭激烈的市場中獲得巨大的利潤,所以他們不改變。
Jesse Lyu:
喬布斯并沒有。
Jason Calacanis:
他并不在乎,你可以肯定他并不在乎。
Jesse Lyu:
只是這種精神通常已經消失了。我們沒有幫助,我們沒有基本上在做這件事。這是我們所有人作為消費者的共同感覺,如果你帶來了新鮮的東西,它相對便宜,我們是一家新公司,但人們通過看它來感受到快樂,然后這啟發(fā)了他們創(chuàng)造自己的變種,這是另一輪漣漪,這個漣漪會不斷擴大。
我真的很理解為什么 Kyle Pay 在一開始就創(chuàng)立了 Nothing,我們有幾次聊天。他整個公司的立場是手機很無聊。
Jason Calacanis:
我是說 Nothing Phone 太瘋狂了,你喜歡Nothing Phone 的什么?什么激發(fā)了你?
Jesse Lyu:
他們可能是最注重工程和工業(yè)設計的公司之一,提供更好的事物。他們剛剛創(chuàng)立,大多數初創(chuàng)公司不會在這兩個基本領域投入這么多資金來制造產品,我要非常感謝他們,我沒有直接參與他們的管理或其他事務。
但是,與 Teenage Engineering 在一起,從一開始就看到了這家公司的發(fā)展,這是一段相當艱難的旅程,它非常具有挑戰(zhàn)性,他們的東西不便宜,你可以看出它不便宜。
Jason Calacanis:
它不便宜,是一種奢侈品,他們試圖制造它,它是一種奢侈品嗎?
Jesse Lyu:
嗯,它仍然比旗艦 Android 手機便宜 100 美元左右,我會這么說,但它不像深圳的東西那么便宜。如果你考慮年輕一代,比如在 2000 年后出生的所有孩子,當他們長大后,他們首次接觸手機,然后在過去的五年里都是一樣無聊的東西。這有多瘋狂?想想當我們開始擁有手機時,我們有 200 多種不同的選擇,我們之所以買手機,只是因為它很酷,就是這樣。
這一部分大多已經消失了,這是因為制造業(yè)務背后的東西,但是對我們來說是好事,因為我們太小了,剛剛起步。
Jason Calacanis:
你們承擔了巨大的風險,你們沒有什么好失去的。
Jesse Lyu:
就是這個原因, Siri 、Google Assistant 或 Alexa 不可能如此迅速地迎頭趕上。
Jason Calacanis:
我必須扔掉它。老實說,技術發(fā)展得如此之快,以至于 Siri 和 Alexa 需要被扔進垃圾桶,他們應該重新開始一個新的項目,這樣實際上會更快。
Jesse Lyu:
我同意。Siri 的技術一定是驚人的。整個范式已經發(fā)生了變化,變成了 LAMs 和 LLMs,而它們并沒有建立在這個基礎之上。
Jason Calacanis:
我是說,它需要扔掉。如果你看看 Elon 正在做的自動駕駛,他不會害怕說,我們制造了這個軟件來保持車道,但是它并不是,有新技術將會顛覆它。我們需要轉向新技術?,F在,硬件堆??赡懿粫淖?, iPhone 的硬件堆棧可能完全相同,但 Siri 必須消失。
Jesse Lyu:
我想給 Elon 非常大的贊賞,因為他的一些思考方式確實讓我產生共鳴。一個例子是,如果你看看 Cybertruck 中的所有電纜,我不確定你是否訂購了一輛,但它馬上就要到了。
如果你看看他們如何重新設計電纜,這太瘋狂了,因為所有的汽車都有,什么,像現在有大約 10 英里長的電纜,都繞在不同的支柱上。他不喜歡那樣,他認為那太復雜了,這些想法真的推動了很多創(chuàng)新。
從我們所受益的地方來看,就像你說的,我們很小,我們承擔風險,但這是我們想要思考事情的方式,我們不是說,也許我們再等兩年吧,還有更多的 API 可以使用,也許我們可以穿上西裝,走進 4 個 App 的辦公室,與他們的高管談話。也許我們可以達成交易。
我們的想法是我們不再使用 API ,我們不再使用 App ,我們只是從頭開始做一些事情,我們從中獲益匪淺。
Jason Calacanis:
Cybertruck 采用了 48 伏特的系統(tǒng),這降低了汽車中的總電纜長度,減少了80%?,F在我猜唯一的缺點是,如果你丟了那根電纜,汽車就完了,失去了很多,但好處是,如果出現問題,更容易診斷,你只需更換電纜。
Jesse Lyu:
很難丟失這根電纜,因為你有防彈板。
Jason Calacanis:
確切如此。我是說,Joe Rogen 試圖用箭射它,但沒有成功,而且他的射擊技巧相當不錯。你們很安全,Jesse,你是一個了不起的嘉賓,我希望你在它發(fā)貨時再來,你認為人們什么時候可以拿到這些設備?你最好的估計是什么?
Jesse Lyu:
我們的承諾日期是復活節(jié),也就是 3 月 31 日,那是我們開始發(fā)貨的時間,我們正在與當地的合規(guī)和法律團隊合作,以盡快發(fā)貨國際訂單。
國際批次可能會在 6 月或 7 月,但我們正在努力加快一切,但我們可以分配大約 550~100 個媒體測試設備的數量。
Jason Calacanis:
感謝你把我包括在內,我非常興奮。
Jesse Lyu:
你已經自己報名了。預計在 10 月中旬左右,在接下來 2~3 周內。從下周開始,我將開始發(fā)布所有在主題演講上展示的演示,我已經在這里和那里展示了一些,但正如我所說,延遲是我們真正關注的問題。
Jason Calacanis:
你們一共研發(fā)了多少年?順便說一下,人們不太欣賞的一點是,這不是你過去 6年一直在做的事情,創(chuàng)建硬件初創(chuàng)公司的能力與你 10 年前開始時大不相同。
深圳的成熟度,僅舉一個例子,當我第一次去深圳時,我想是在 2006 年或 2007 年,當時很少見到美國人,一個白人,所以當我去那里時,不要開玩笑,有 20 名學生圍著我,想要觸摸我并與我合影,因為他們從未見過,因為他們來自北方。
在深圳有一個著名的游樂園,不是為美國游客準備的,而是為中國國內的游客準備的,我去那里只是為了看看,我真的被攔住了,10 次左右,人們想要觸摸我并拍照。
現在有很多美國人,有很多初創(chuàng)公司在那里。當我在 2007 年去那里時,我猜是 15 年前吧,更多的是,會有一幢高樓大廈,30 層樓,然后,在周圍的四個街區(qū)里,都是停車場。你會從一棟建筑物開到另一棟建筑物,你可以看到你要開到的建筑物,但就像開車穿越沙漠,你知道嗎?
Jesse Lyu:
我在中國出生,但我是在一個非常西式的家庭中長大的,我的父母會說,一旦你滿 15 歲,你就得自己照顧自己。
我 15 歲后就開始學英語,然后他們說,一旦你獨立,我真的在 15 歲的時候離開了家。我有一次獲得了一個轉學機會,短暫地在新加坡的一所高中上了一段時間課,然后我去了英國,我畢業(yè)于利物浦大學數學專業(yè),然后在倫敦又待了一年半,只是和一群藝術家呆在一起,所以我現在真的不太了解中國,我已經離開這個國家很久了,但我相信你,情況已經非常不同了。
深圳的 ODM 和 OEM Infra 已經建立了幾十年,至少仍然為 Apple 等公司服務,所有的 iPhone 都是在那里生產的,但很多事情開始有所變化,因為從硬件角度來看,我能看到很多事情都變得模塊化了。另一方面,核心芯片正在變得集中化。
Jason Calacanis:
核心芯片正變得集中化,TSMC。
Jesse Lyu:
Nvidia 正在加強這一點,或者說 arm 和其他公司正在加強這一點,但是組件,任何人都可以制造它們,然后將它們插入這些 CPU 中,任何人都可以制造它。
Jason Calacanis:
但是,深圳的速度仍然無人能及。
Jesse Lyu:
這是一個很酷的地方,他們可以為你制造全新的東西,然后在幾天內將其送回到美國辦公室。完全可以迭代。迭代周期以前是幾個月,現在是幾周。
Jason Calacanis:
現在肯定是幾周,如果你有一些特殊的資源,你甚至可以在幾天內完成,這是令人難以置信的。
Jesse Lyu:
是的。想想看,以前迭代周期是每季度一次。因為我曾經試圖在 10 年前投資過一些硬件初創(chuàng)公司,迭代過程太慢了,你無法靈活應對。現在你可以在幾周內完成,甚至可能在一周內完成,這真是不可思議。
Jason Calacanis:
那為什么你認為芯片的集中化對初創(chuàng)公司來說不太好呢?
Jesse Lyu:
因為你只會與精選的合作伙伴合作,然后他們有很多大客戶需要合作,然后他們會說,如果你的銷量沒有超過這個數字,我們甚至不會和你談。
Jason Calacanis:
明白了。你認為風險和開源芯片運動會在未來產生影響嗎?風險對開源芯片有什么看法?
Jesse Lyu:
這更多是關于你如何設計一個系統(tǒng)。很多人在爭論,我一直在爭論,也在我的 Discord 社區(qū)中與我的社區(qū)成員爭論。
很多人說,我們能不能制造本地 LLM 呢?我們能在設備上運行 x 數量的功能,而不是在云中運行嗎?對我來說,我能理解出于隱私原因,那可能是唯一合理的理由。
Jason Calacanis:
為什么你愿意在本地運行呢?有多少人關心這個問題?關心的人很少。如果你將我的指令加密,然后在云中執(zhí)行它們,然后刪除它們,這有什么問題,或者每隔 60 天刪除一次,可能需要保留一些歷史記錄。
Jesse Lyu:
這只是學術觀點和消費者觀點之間存在巨大分歧的一個方面,消費者不在乎。
Jason Calacanis:
確切如此。我提出這個案例的方式是,有一種方法,我們可以朝著 Chromebook的方式前進,即使操作系統(tǒng)也在云中。如果我們選擇這條路線,那么我們就不用擔心芯片的問題,因為你不需要那個芯片來在本地運行大量任務。
Jason Calacanis:
它是一個終端,你把終端打開。
Jesse Lyu:
實際上,我支持這條路線,因為從消費者的角度來看,我為什么需要在我的汽車中擁有 CPU ?或者是電視機?為什么我需要那個?而且,一切都是智能的。
電視是智能的,一切都是智能的。我實際上正在設置一個小公寓,因為我變得太忙了,我不再呆在辦公室。我正在設置電視,然后我需要從我的電腦上進行 Airplay 操作,所以我去了商店,買了一個Apple TV,然后我買了一臺三星的智能電視,它們都有 Netflix。
Jason Calacanis:
現在你有兩個遙控器,其中一個三星遙控器上有 Netflix 標志,就像我為什么要買 Apple TV?
Jesse Lyu:
確切如此。然后三星有他們自己的 Chromecast 或其他什么,應該是這樣。如果你想想背后發(fā)生的事情,我們需要所有那些嗎?我們是否真的需要在電視上安裝高通芯片,如果你的電視可以投影東西,那就是電視應該做的事情,所以,這是一個有趣的趨勢,特別是在接下來的幾年里,我們將看到誰能占上風,本地公司與云公司,以及它們的工作方式。
我同意 Elon Musk 和其他一些人的觀點,如果 AI 運行在這種方式下,我們將面臨電力短缺的問題。
Jason Calacanis:
我們將面臨家庭用電和數據中心用電的實際電力短缺問題。我們將需要更多的電,因為這些設備運行得很熱。
Jesse Lyu:
是的。如果我們保持目前的速度,我們真的沒有足夠的晶體管和 Transformer 來處理 GPU 集群,那么很多 Infra 都需要關注。現在如果因為 H100 型號太多而出現能源危機,人們將再次對核能感興趣。所以人們會說,我們只需要在這些數據中心旁邊建一些核反應堆,并建設大規(guī)模的太陽能農場,以獲得更多更便宜的能源。
Jason Calacanis:
這就是,人們一直沒有太多考慮的原因,因為我們一直能夠跟上,但是如果突然間我們無法解決癌癥,因為我們沒有足夠的能源,我們沒有足夠的芯片來治療癌癥,我們有那個軟件,我們有芯片,我們沒有足夠的能源來將這種定制藥物治療的重點放在某個地方。
Jesse Lyu:
對我來說,消費者離實際問題有多遠,對我來說是很重要的,如果你距離問題很遠,你不會關心。但是如果你在旁邊,然后突然間成為一個問題。所以,就像我說的,我們不知道這是否是正確的手機因素。我們不知道,但我們知道這是我們可以承受的最低風險,我們知道 LAM 是最重要的。
Jason Calacanis:
LAM 就像狙擊手一樣,你可以很容易地完成任務。當我們在這個行業(yè)開始時,我記得在 90年代,有家公司叫做 General Magic,他們正在制造一個帶有 Agent 的設備。你會告訴 Agent,我想飛到巴黎。
我的意思是,它會知道你在紐約,然后它會出去,嘗試為你找到機票,然后去找一位旅行代理人,然后試圖找到結果,然后將它們以某種格式放回來,以便你可以說,好的,我喜歡這個行程安排?,F在,2000年、2005年、2015年、2025年,經過了30年,很有趣。
Jesse Lyu:
General Magic 是 Apple 的一個內部項目, Apple 并不真正了解它,所以將其分拆出去了,他們的標志是一個帶著帽子的 Rabbit。
Jason Calacanis:
對,我記得那個。Rabbit 會在小動畫中伸出頭。我記得索尼為 General Magic制造了第一臺實際的硬件。
Jesse Lyu:
一些早期版本的 PDA 和其他東西。
Jason Calacanis:
個人數字助理,我記得當 Palm 在紐約推出時,大約在 97、98、99 年左右,人們都有一部 StarTech 手機和一部 Palm,你拿出這兩個設備,然后你學會了 Palm 腳本。
你學會了如何在觸摸屏上進行腳本編寫,而不是發(fā)送錢,那是 Elon 和 Peter Thiel 要做的事情,或者說 Peter Thiel 要用 Paypal 來做的事情,它是用來發(fā)送名片的,而 iPhone 15 的最新功能是通過敲擊兩部手機來發(fā)送名片,這太滑稽了。
Jesse Lyu:
這實際上是一個很好的觀點,因為我深信,人類從來沒有發(fā)明新的需求。我們有一定類別的需求,我們想休息好,我們想吃好喝好,想娛樂,想有動力,想開始工作。
技術并沒有發(fā)明新的需求。技術一次又一次地解決同樣的問題,但每一代都以更直觀的方式來解決。這正是你說的,用 Palm 發(fā)送腳本到名片,與現在的敲擊兩次錯誤放一樣,它是一樣的,更加直觀。
硬件非常有趣,因為如果硬件足夠直觀,那么手機因素會保持很長時間。你永遠不會,我從來沒有聽說過每年有 2000 家公司聲稱他們能制造更好的錘子,為什么?因為它足夠直觀,它只需要你的力量和遵守基本規(guī)則,就是這樣直觀。
如果你考慮一下計算機和移動設備,還有很長,很長的路要走。這就是為什么我們決定向前邁出一小步,我們說,我明白你們對這個或那個持懷疑態(tài)度,但我們必須嘗試,至少我們必須這樣做。
Jason Calacanis:
有一種瞬間的特性,如果你告訴人們,我一直認為,當我尋找要投資的初創(chuàng)公司時,這家初創(chuàng)公司是否在為人們節(jié)省時間?它是否在為人們省錢?或者它是否以某種方式娛樂人們?
如果你看看你的設備,它將會為人們節(jié)省時間,而時間對于一些人來說相當于金錢。有些人比時間多,有些人比金錢多。
總的來說,你的設備是一個節(jié)省時間的設備,它會娛樂人們嗎?當然,可以有娛樂服務,首先是為人們節(jié)省時間,讓他們回到孩子或晚餐或其他事情上,離開他們的設備,這真是不可思議,你的意識到延遲必須改變,毫秒數要降低,人們會搜索更多。如果他們使搜索結果更快,人們會更多地使用 AI。
Jesse Lyu:
我可能可以在你有測試設備的時候得到它。
Jason Calacanis:
這將是令人驚嘆的,只是點餐的能力更快。我為我的家人點的是同一種壽司卷,那種手卷。如果我能重新點那個卷子,秒殺,而且我能越快越好。當這個東西在三個月內推出時,你會再次來嗎?
也許我們可以親自見面,也許我們可以做一些。你知道嗎?當你準備好推出它時,留下一些演示,比如三個,我們可以現場演示。
Jesse Lyu:
我們將創(chuàng)造實時,進行實時演示,為什么不呢?
Jason Calacanis:
我們將親自進行現場演示,我會租一個劇院,我們可以坐在那里聊天,我們可以現場演示一些東西。如果你想了解更多信息,或者如果你想與 Jesse 一起工作,做瘋狂的、令人敬畏的、酷酷的事情,就像喬布斯一樣,人們如何了解你的職位空缺?
Jesse Lyu:
很簡單。我們有一個職業(yè)頁面。我們不斷更新職位。但只需通過 Twitter 聯系我,或者隨時發(fā)送一封 Rabbit 或技術的電子郵件。只需訪問我們的網站,發(fā)送電子郵件,我們的網站是 Rabbit.tech。
Jason Calacanis:
Rabbit.tech,確保查看研究頁面,以獲取有關 LAM 如何工作的詳細說明。
Jason Calacanis:
你們的關于 LAM 工作原理的頁面真的很酷。
Jesse Lyu:
只需給我們發(fā)送一封電子郵件,我們會處理的。你們是在招聘什么職位?
Jason Calacanis:
你們最難招聘哪些職位?
Jesse Lyu:
基本上,我們需要在每個方面擴展大部分與產品相關的職位,因為我們正在努力趕上需求,還有很多我們正在嘗試為未來構建的東西。更重要的是,我們想建立一個 LAM 研究小組,專門致力于未來的 LAM 版本。
Jason Calacanis:
你現在是親自在辦公室嗎?你在圣莫尼卡親自辦公,試圖讓人們來辦公室。
Jesse Lyu:
但如果你很優(yōu)秀,就可以靈活。但是,如果你真的很優(yōu)秀,讓我告訴你一些,住在圣莫尼卡,有很多很棒的餐廳,這是一種令人難以置信的生活方式。搬來和 Jesse 在圣莫尼卡一起玩,這是個很棒的地方。
Reference:
https://www.youtube.com/watch?v=X-MNgciL5hw
作者:有新;來源公眾號:有新Newin
本文由 @有新Newin 翻譯發(fā)布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!