端到端, 會『殺死』5萬名自動駕駛工程師嗎?

2 評論 437 瀏覽 2 收藏 21 分鐘

從華為、特斯拉到小鵬汽車,各大車企紛紛投入巨資研發,試圖解鎖自動駕駛的最終形態。本文深入探討了端到端技術如何重塑自動駕駛領域,以及這場變革對工程師們意味著什么。

華為自動駕駛有6千個工程師,主要用來寫各種規則,因為 rule-based (基于規則)環境太復雜,總有新的 task (任務)出現。”一位特斯拉FSD工程師形容華為智駕團隊,為什么規模必須很大時說道。

這也是余承東壓力大的原因,華為自動駕駛團規每年花費10億美元,累計支出早已經超百億,而主要成本就是工程師的薪資等人力成本支出。

不只是華為,對于所有智能駕駛企業來說,一直困在系統中的問題就是:自動駕駛需要窮盡所有的Corner case(特殊情況),這就導致每家智能駕駛團隊的人數基本都不低。

類似比亞迪、百度這些都在3-5千人,獨立智能駕駛公司如Momenta在1300 多人,車企理想年初也是1300人,每類型智駕公司都有五六家,這些人加起來至少有5萬核心的自動駕駛工程師。

他們薪資都很高,有自動駕駛領域獵頭說到:“在自動駕駛賽道,地平線和禾賽這樣的公司,研發團隊的人均薪資基本到百萬了。”他去年就幫一位年薪200萬的獵到了新機會。

但很多家也潛行研發了10年的時間,卻沒有一家敢說能讓L4級別的智能駕駛落地。

而在2024年,特斯拉的FSD v12突然帶火了一個詞『端到端』,一時間仿佛L4級別智能駕駛突然要實現。端到端就像是智能駕駛的ChatGPT時刻,瞬間讓智能駕駛車企都開始布局。

端到端對于大眾來說,還是個不甚了解的詞匯,行業內具體解決方案也并不一致。大家只知道,不再需要窮盡算法解決Corner Case (特殊情況),每家智駕團隊就不要一直擴張算法團隊人數。

燒錢卻無解的情況終于有了改變,資本和企業歡呼自動駕駛有望實現,智能算法人才卻在猶豫,大模型上車,會讓自己丟掉飯碗嗎?

01 端到端還在定義,市場卻都是降臨派

自動駕駛,此前對于各大廠來說,說起來都是個苦命的探索。

自動駕駛國外的領軍企業是Google 的Waymo,國內是大廠百度、以及元戎、小馬(兩家正在上市)等諸多自動駕駛創業企業,還有蔚小理等新勢力。

行業稍早時,發展路線是依賴高精地圖。所以Waymo 以及國內的玩家成本都很貴,每開一個新城都要用自己的車隊去鋪,100 輛車*100 萬人民幣,再加上 operation cost(運營成本),就是一個城市一個億人民幣,從商業模式來看不劃算。

于是在2023年,元戎啟行率先發布了不依賴高精度地圖的智能駕駛解決方案,此后有包括華為、蔚來、小鵬、理想、地平線等超過10家企業明確開始棄用高精地圖的方案。

后來很多車企入局,他們倚重的路線是激光雷達,華為和小米算是這種路線的代表,前者自研,后者投了投資了激光雷達企業禾賽等。

這兩種模式,底層技術都是BEV+transformer,兩年時間不到,轉眼就老套了?,F在以特斯拉和小鵬為代表,都用純視覺占用網絡+大模型,從感知到規劃,端到端成為市場的共識。

端到端具體怎么定義,什么系統才是端到端,市場并沒有明確的定義。如果形象地說,端到端更像是模仿人類的思考方式。

諾貝爾獲得者丹尼爾卡尼曼曾說,人類有兩個系統,分別是系統A和系統B,前者利用直覺和本能,高效處理95%的問題,而系統B則是復雜場景的理解,能處理5%很難的問題。

未來的自動駕駛技術也是如此,用一個傳感器直接到模型的方案,解決日常碰到的絕大部分問題,端到端直接處理。和大模型類似,這種可泛化的 Scaling Law(尺度定律) 大幅度降低了自動駕駛解決各種問題的成本。

而在模型2中構建多模態模型,處理難以特殊場景的復雜問題,解決自動駕駛落地的最后1%難題。

但不是兩個系統就叫端到端,核心得實現輸入圖片、輸出信號,一個大模型解決問題,而不是感知、處理、決策這種多步驟的模塊化系統。因此,有玩家認為真正的One Model端到端屬于生成式大模型,才真正具有顛覆性。

端到端到底有何神奇之處,在美國駕駛過FSD v12版本特斯拉的國內創業者張強告訴AI鯨選社,他啟動autopilot后,無保護左轉的情況下,先禮讓直行來車,對方也讓行的話,直接加速轉向通過?!安皇呛芩腊?,像有經驗的老司機?!?/p>

顛覆性技術來臨之際,也讓各家公司都集體來了個大剎車。2024年本來華為、理想、小鵬都在推進全國無圖駕駛?,F在無圖 NOA 的生命周期即將結束,端到端已經在摩拳擦掌。

小鵬汽車就宣稱,2024年將投入35億元用于智能研發。

在特斯拉內部變化也很大,端到端和之前 rule – base 差異很大,上了端到端之后,團隊變動也很大,Tesla 之前負責 planning control (規劃控制)的負責人就離職了。

特斯拉美國FSD工程師也表示,之前 Tesla 一直不愿意向中國團隊開放代碼閱讀權限,上了端到端之后,已經不需要國內工程師了,國內只需要標注即可。

一塊重石悄然在自動駕駛工程師圈砸下,現在很多智駕團隊的招聘,都是僵尸崗位,市場在衡量未來到底需要多少智駕工程師。

02 CEO集體放話,各大車企爭搶大牛

全國無圖 NOA 熱度才幾個月,馬上端到端的智駕就要來了,大家又回到同一起跑線。

另一方面看,則是自動駕駛終于找到了指數級進化的路線。一直以來,算法覆蓋corner case,根本拉不開各家的實力差距。所以大家都認為,自己和特斯拉處于同一水平。

但端到端技術開啟新的進化大門后,新的競爭又開始了,一兩年內應該就會拉開巨大差距。

華為余承東曾表示,華為團隊去美國舊金山、加拿大多倫多等地進行了測試,從結果來看,等特斯拉FSD入華后,華為有信心干贏對手。

今年年初,小鵬汽車創始人何小鵬也去了美國,親自體驗特斯拉FSD的駕駛感受和落地情況。

測試完,何小鵬說到:『我們跟特斯拉,是唯二端到端的(車企),所以小鵬汽車作為中國最好的智駕廠商,我們也是非常期待特斯拉FSD能夠進入中國,一起互相學習?!?/p>

如果你感覺何小鵬說的比較謙虛,實際上他還說了,并自信提出了『國內路況比美國復雜10倍,小鵬有信心。』

且看5月20日的AI Day,小鵬高調展出了多項第一:國內首個量產上車的端到端大模型:神經網絡XNet+規控大模型XPlanner+大語言模型XBrain。還有全球首個“AI代駕”。AI代駕很有意思,意味著AI駕駛能學習司機的駕駛習慣,更有個性化。

類人類智駕,實際上就是端到端能實現的重要特征。這塊單獨拿出來說,更多宣傳層面考慮。

而華為是在更早的2024年4月24日,發布的ADS3.0,宣布去除了BEV,在決策和控制使用了端到端的人工智能。雖然發布的早,但實際上GOD大網也就是感知模塊,控制模塊也是獨立的,整個還偏模塊化架構,并不能算真正意義上的端到端。

不過,華為和小鵬確實是行動較快的玩家,在今年7月初,華為與小鵬的兩段式端到端智駕方案將推送給車主。蔚來也開始在7月下旬推送端到端的解決方案。

理想汽車CEO李想也表示,三季度將向測試用戶推送端到端+VLM(視覺語言模型)的智駕方案。但對于理想來說,其實時間非常緊迫。

最早行動的蔚來,在年初將感知和規控團隊合并為大模型團隊,集成團隊重組為交付團隊。理想汽車是到了7月份,才組建了“端到端自動駕駛”的實體組織,整體200人出頭。李想調動了理想智能駕駛技術研發負責人賈鵬親自負責“端到端”的研發。

同時,理想公開了其端到端自動駕駛技術方案,其方案分為端到端模型、VLM(即Vision-Language Model,視覺語言模型)視覺語言模型、世界模型三部分。

雖然發布時間較晚,但理想大聲宣布自己才是真正的OneModel 端到端,難度也不是一般的大?!皬膫鞲衅鬏斎氲叫旭傑壽E輸出只經過一個模型?!崩硐胫悄荞{駛技術研發負責人賈鵬在發布會上曾說。

有行業人士指出,跟華為、小鵬的分段式端到端方案相比,理想的方案確實更激進,可視為分段式端到端的下一站。

趨勢并不是只有華為和蔚小理等新勢力會跟進,一項認為自動駕駛有點扯的比亞迪創始人王傳福,此前曾公開說:我是實實在在搞戰略的,我看的比誰都清,我們有幾萬名工程師在探索這個東西(自動駕駛)到底行不行,這條路到底通不通,我不清楚嗎?

最近一改往日言論,也在調兵遣將跟進。

7月份,引入百度艙駕融合智駕技術負責人周鵬,負責比亞迪的端到端大模型規控算法開發,而且是獨立于比亞迪規劃院智能駕駛研發中心,新設立的300人部門。

一個現象值得關注,如理想、蔚來、比亞迪等主流車企智駕部門都成立了獨立的端到端團隊,并派遣大將坐鎮,都是200-300人團隊即可。相比原來幾千人甚至上萬人的智駕團隊,不可謂不精簡。

傳統做Rule-Basd算法的人員,盡管目前還沒有發生大規模裁員事件。很大程度上是因為端到端還處于ChatGPT-2時刻,距離ChatGPT-4時刻還有距離。

一位自動駕駛企業HR告訴AI鯨選社:“新成立的端到端部門都還剛起步,目前還需要傳統智駕部門做算法場景覆蓋,保證自動駕駛安全的下限,未來會不會形成沖擊不好說。”

端到端容易出現下限問題,是大模型初級階段的核心問題。張強就提到,他在美國開車時,十字路口的直行道排隊較長,特斯拉的autopilot直接拐到左轉道,然后紅綠燈一亮,直接又加速斜插回直行道?!安铧c和直行車撞上,還好一腳剎車踩住了。”
類似場景是大模型還沒學明白的地方,這就需要算法覆蓋,保證下限問題。但端到端進化速度很快,未來會學習到人類甚至超過人類的水平。

03 馬斯克還是鯰魚,普通工程師受傷

現在,小鵬在國內自動泊車、潮汐車道等場景中,表現也是超越特斯拉的存在。華為和小鵬實際都有本地化的優勢,利用高精地圖或者雷達等加持下,確實即便FSD v12現在版本真正進入國內,也很難短期打敗國內對手。

但未來發展看,技術底層邏輯會導致變化。“絕大部分車企,其實都是在「模型化」,「模塊化端到端」,真正的 OneModel 端到端,可能只有特斯拉?!币晃恍袠I認識評價道。”

因此可以說,特斯拉改變了自動駕駛團隊的工作模式。此前,“在模塊化的架構下,一位工程師一天只能處理10多個case,效率不高?!眹鴥茸钤缏涞囟说蕉朔桨傅淖詣玉{駛企業元戎啟行CEO周光曾公開說道。

現在,通過用海量數據去訓練大模型,讓機器擁有自主學習、思考和分析的能力,能更好地處理復雜的駕駛任務。所以,對于真正的端到端系統真正的三要素,第一是團隊帶頭人(決定端到端模型高度),第二是數據,第三是算力。

在各家爭搶完牛人后,大規模、高質量的訓練數據重要性開始顯現。

根據特斯拉的計算,完成一個端到端自動駕駛的訓練至少需要100萬個、分布多樣、高質量的 clips (視頻片段)才能正常工作。“毫不夸張地說,數據會占據端到端自動駕駛開發中80%以上的研發成本?!?lt;毫末智行數據智能科學家賀翔曾如此表示數據的重要性。

近期,蔚來開始推送的最新 OTA 。包含了業內首個應用端到端技術的 AEB,蔚來用了 20 億公里的數據集,來訓練這個端到端模型。

何小鵬最近在公開節目上透露,基于折算10億+里程的視頻訓練、超646萬累計公里數的實車測試、超2.16億累計公里數的仿真測試,小鵬汽車端到端大模型能夠做到“兩天迭代一次”,在未來18個月內智駕能力提升30倍。

數字之所以如此重要,正是因為現在端到端大模型的Scaling Law效應。此前也需要數據,但rule – base更需要的人才是用算法去覆蓋場景,所以對數據需求沒那么渴求。

第三是算力訓練卡,理想有五千張A100、A800這樣等同的訓練卡數量,是小鵬的兩倍。“如果租卡的話,一年需要10億,需要有健康的利潤來提供支持?!?/p>

拼人力的時代已經過去,各家團隊也在發生改變,6月8日,理想汽車CEO李想在中國汽車重慶論壇上發表演講。

他認為所有自動駕駛團隊,每天干的活都是靠人工去調試各種各樣的corner case,而且放的人越多,corner case越多,和真正的自動駕駛就越遙遠。

“當人工智能技術在不斷的發展的時候,我們會發現,其實人類開車的方式,不是過去那么多年里我們用的自動駕駛研發的一個方式。這是一個根本的不同。因為人開車沒那么辛苦,沒那么累,不需要養幾千人的團隊去搞corner case。

這也是端到端到來的改變,很多人說理想是因為Mega失利,所以開啟了大裁員。但起碼在智能駕駛團隊情況并不一樣。正如李想所說,不需要養幾千人的團隊去搞corner case,才是最重要的一點。

同時,不需要人為定義這些 task。這也是為什么現在 FSD v12 可以做到每周更新,每次都是三五倍能力的提升。而對于特斯拉來說,端到端帶來的另一大機遇是 Robotaxi。

據行業研究員木頭姐的研報估算,支持 Robotaxi(自動駕駛機器人出租車)之后的特斯拉車隊規??赡艹^ 1 億,而且每量車具備 1000 瓦的高效推理算力,總共就是 100 千兆瓦的 Edge AI 算力,讓特斯拉有機會新增類似 AWS 的邊緣 AI 云業務,讓特斯拉車輛除了在車主不使用時可以自動加入 Robotaxi 賺錢,還能在靜止停放時自動加入邊緣 AI 云服務來賺錢,全時段飽和運轉。

自動駕駛和 Robotaxi 能在 5 年后(2029)讓特斯拉市值翻 10 倍達到 5-7 萬億刀,Elon Musk 認為這是市面上最準確的預測。

所以,大家都十分關注,特斯拉在國內的落地的時間點。

馬斯克永遠是那條鯰魚,FSD年底進入國內時間,不知道那時候已經憑借端到端,進化成什么樣子。

就像特斯拉的上海超級工廠落成之際,讓國內新能源市場直接洗牌,這次FSD進入國內,會不會殺死部分自動駕駛企業,讓更多的普通工程師失業?

參考內容:
自動駕駛領域的GPT時刻來了-硅谷101

2024-端到端研究報告-辰韜資本

作者 | 楊曉鶴

本文由 @AI鯨選社 原創發布于人人都是產品經理。未經作者許可,禁止轉載

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 還是沒懂什么叫「端到端」

    來自北京 回復
  2. 對于AI技術與自動駕駛行業未來發展,特別是關于AI技術是否將取代大量自動駕駛工程師,我們是否應該思考如何在技術飛速發展的今天,平衡好人與機器的關系?

    來自廣東 回復