特斯拉Robotaxi發(fā)布后,具身智能話題再引熱議,涉及三大技術派

0 評論 2173 瀏覽 1 收藏 13 分鐘

隨著特斯拉最新發(fā)布的Robotaxi和其Cybercab車型的亮相,自動駕駛和具身智能領域再次成為熱議的焦點。埃隆·馬斯克的這一雄心勃勃的舉措不僅展示了特斯拉在自動駕駛技術上的深入探索,也預示著未來出行方式的重大變革。

近日,特斯拉舉辦了名為”We,Robot”的發(fā)布會,正式揭開了Robotaxi的神秘面紗。在發(fā)布會上,特斯拉CEO埃隆·馬斯克展示了一款專為自動駕駛設計的全新車型——Cybercab。

據了解,Cybercab預計將依賴特斯拉的全自動駕駛(FSD)軟件,可能包括攝像頭和激光雷達技術。此外,在該場發(fā)布會上,特斯拉還展示了一個專門的打車APP,用于召喚和支付Robotaxi服務。

在自動駕駛業(yè)界,F(xiàn)SD頗為知名。一位行業(yè)從業(yè)者稱,國內自動駕駛系統(tǒng)較之還有差距。此輪公開展示,讓人們對自動駕駛引導具身智能的未來展開了想象。

我們認為,F(xiàn)SD下的自動駕駛除駕駛技術高超外,在未來的人形機器人和具身智能領域也可能實現(xiàn)突破。

為此話題,我們找到了國內的一些頂級企業(yè),并就此問題展開了深入討論。多位企業(yè)高管或CEO表示,已經做好了和特斯拉“一起卷”的準備。

雖然對手強大,但幾派掌門仍有勝券在握。

01 Sora派崛起前的靜默

其實,不論是具身智能還是自動駕駛,根本上是機器對3D物理世界的理解??梢哉f,哪種技術能理解真實物理世界、進而進行決策,誰就有可能拿到具身智能的最終入場券。

原理上,在實現(xiàn)決策之前,只有通過精確地感知和理解周圍的環(huán)境,機器才能做出準確的決策并執(zhí)行復雜的任務。

以目前的技術而言,或有三種方向有望成為未來的佼佼者。

其一是以Sora為代表的文生視頻派。其想在機器人植入“腦”。

視頻由一系列幀組成。這一派所秉持的,是讓機器人學習連續(xù)的圖像,并從中獲得關于物體和環(huán)境隨時間變化的豐富信息用以加深機器人的理解。

這一派的貢獻可能是,讓機器人可以在未來具備學習多種操作任務和在多種環(huán)境中泛化的潛能。

國內某家頂級的文生視頻公司對數科星球DigitalPlanet進行了獨家回復。其科學家稱:“本質上這是一個雞生蛋、蛋生雞的問題,要讓機器人更聰明,就要部署更多機器人獲取數據,難點是推動飛輪效應的第一個動力在哪里?!?/p>

他和他的團隊認為,文生視頻是解決上述問題唯一的路。“我們所說的具身智能所面臨的問題,比汽車這種限定場景更為復雜,你可以理解成,他們是大數據集里的一個子集,”他補充。

這家公司解決的方案是,先通過視頻網站采集數據,然后通過視頻生成結果反饋到具身智能中,而通過力學采集、自動駕駛(雷達波)采集數據要在之后作為補充。

在數科星球DigitalPlanet的再三追問下,其表示,最晚將在明年的此時公布和Robotaxi差不多量級的產品發(fā)布。而當下,各家文生視頻公司還處在“蓄力憋大招”的階段。

但好消息是,Sora派已在嘗試將AI大腦植入至機器人中。直到此文寫作之時,對方表示“已經在小數據集中形成了物理規(guī)律的學習”。“這一點,你可以在AI游戲的進展中得知,別的就不方便透露了”,這位企業(yè)家稱。

他的預期是,游戲的scaling law(規(guī)模法則)既已完成,就預示著已經有了在大規(guī)模數據集中部署的可行性。

對于在機器人中植入“腦”,已經很近了。

02 高精度物理模擬派

其二是以英偉達為代表的,在虛擬環(huán)境中測試和優(yōu)化機器人的技術派。他們規(guī)定了機器人的行為動作。

因為,CUDA有著優(yōu)秀的并行計算能力,可提供高精度的物理模擬,可以讓編輯好的行為部署到現(xiàn)實世界中。在英偉達眾多算法框架中,多種產品可以作為機器人動作生成工具。

其中,例如在Omniverse平臺,提供了逼真的物理模擬,這對于訓練機器人理解3D物理世界有所幫助。這一派的優(yōu)勢是,可以通過模擬不同的環(huán)境和情況,讓機器人可以在沒有實際風險的情況下學習和適應。

不過,這一派別極其依賴高質量的3D內容庫。

在數科星球DigitalPlanet此前分析中,對比GPT所依賴的高質量文本數據語料,高質量的3D內容存量僅僅為前者的1/1000,大量數據并未公開且獲取難度大。

也因此,英偉達走上了構建3D市場和數字資產庫、與其他數據庫合作和利用AI生成3D內容的道路。

不過,以一些國內相關公司的進展來看,這條路似乎并不順暢。“一些項目開始做定制項目了,這似乎代表著其商業(yè)潛力沒得到應有的開發(fā)、或是僅此而已了”,一位投資人稱。

在基于數據生成特定動作方面,還需觀察。僅以目前所掌握的情況而言,其作為鮮有服務型機器人的升級版未來可期,但做到極度神似真人,還尚需時間。

03 自動駕駛、車路云協(xié)同派

其三是自動駕駛、車路云派。他們影響著機器人的“場”。

應該說,Robotaxi的具身智能發(fā)展方向有著代表性意義。一位資深從業(yè)者回答數科星球DigitalPlanet:“目前特斯拉FSD進入中國市場,幾乎已成為確定性事件,而這個變局的影響才剛剛開始。”

可以預計的是,F(xiàn)SD將成為鯰魚,再次發(fā)生攪動效應。

在特斯拉發(fā)布會中,幾個要點頗為重要:

其一是,特斯拉的數據訓練規(guī)模龐大,據稱有數百萬車隊在做測試和收集數據;其二是,因技術同源性,其電池、電力電子系統(tǒng)、先進的電驅系統(tǒng)、軟件系統(tǒng)、人工智能計算機,都適用于人形機器人;其三是,特斯拉預計將來實現(xiàn)量產的人形機器人成本大約2萬到3萬美元,可能比一輛車還便宜。

我們得到的資料顯示,此機器人“可以當老師、照顧小孩、遛狗、修剪草坪、購物、幫你倒酒水飲料等等。”

所以,幾乎是在一瞬間,自動駕駛走向具身智能的通路被打開了。

元戎啟行CEO周光稱,“我們正在基于端到端模型和Thor芯片研發(fā)VLA模型”,據了解,VLA(視覺-語言-動作)模型旨在使機器人能夠理解視覺信息、語言指令,并據此執(zhí)行相應的動作。該公司率先提及VLA概念,并因此得到了發(fā)展先機。

結果是,在這家公司所引導的具身智能已初步具備“智慧”。比如,在一些潮汐路段,碰到堵車時,車輛堵著后面的車,自動駕駛系統(tǒng)會自動“向前挪一挪”。這被認為是,系統(tǒng)已初步具備了少許智慧。

在這一派別的競爭中,核心點仍然是擁有海量的數據。

周光稱:“特斯拉未必能成為破局者。”他給出的理由是,F(xiàn)SD入華需要一定時間進行本土化的訓練適配,國內主機廠仍具有一定的本土化優(yōu)勢。他認為,一旦智能駕駛系統(tǒng)在消費市場迅速鋪開,以這家公司為例的本土廠商所獲得的數據量會大大提升,屆時與特斯拉的技術差距會逐漸縮小。

除了端到端,智能網聯(lián)的問題也尤為重要。

中國工程院院士國家智能網聯(lián)汽車創(chuàng)新中心首席科學家李克強認為:“FSD做的實際上是車云協(xié)同,而在這個過程中車路云一體化才是自動駕駛的終極?!保–ICV大會)

蘑菇車聯(lián)的內部員工提及,可以將具身智能看作智能體。在未來,當智能體變多之時,不同智能體之間的協(xié)同問題將會水漲船高。

在智能體變得越來越多的時候,協(xié)同問題或將成為具身智能發(fā)展的關鍵。為了解決這個問題,蘑菇車聯(lián)的方案是“通過建立‘通感算’網絡體系,為車輛(自動駕駛車輛、非自動駕駛車輛)以及各種智能設備(機器人、無人機等)提供系統(tǒng)級實時數字孿生服務?!?/p>

他們還預估,未來將出現(xiàn)兩套網絡,“天網”由衛(wèi)星系統(tǒng)構成,而“地網”就是車路云網絡。原理是,智能體需要接入車路云網絡,因為車路云網絡可以在系統(tǒng)級層面解決群體安全、群體效率與群體博弈問題。

蘑菇車聯(lián)副總裁呂斌認為,類似智能車這類“單點智能”場景會向著系統(tǒng)智能的方向進化。

目前,據數科星球DigitalPlanet所知,蘑菇車聯(lián)車路云一體化項目已在北京、上海、深圳、天津、四川、遼寧、湖南、云南、山東、湖北等多地實現(xiàn)落地運行。

當然,這也為具身智能的大面積應用做好了充分的鋪墊。

結尾

Sora裝腦、Omniverse裝四肢、自動駕駛和路網云做場,已構成一場關于自動駕駛和具身智能的新角斗場。

數科星球DigitalPlanet看到,新的爭奪已悄然開始。而在FSD進入中國市場前夜,“自動駕駛三大家”之一的蘿卜快跑等企業(yè)已摩拳擦掌,靜待競爭來臨。

作為完全對標Robotaxi的企業(yè),自2021年以來已在包括北京、上海、廣州、深圳、重慶、武漢、成都、長沙、合肥、陽泉、烏鎮(zhèn)在內的全國11個城市開放載人測試。

目前,國內的無人車已在成本方面有著巨大優(yōu)勢。而其他自動駕駛公司也已在快速地跑馬圈地。

各路“神仙”似乎已在躍躍欲試。

在不遠的將來,街上遍布人形機器人的情形將不會遙遠??梢源_定的是,在這個過程中,國產Sora、3D大模型、自動駕駛、無人車和車路云企業(yè)將為此不遺余力。

這勢必是一場激烈的戰(zhàn)斗。

作者丨苑晶 編輯丨大兔

本文由人人都是產品經理作者【數科星球】,微信公眾號:【數科星球DigitalPlanet】,原創(chuàng)/授權 發(fā)布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!