車企也要搞大模型,但他們基本還在第一層
車企也開始學起互聯網企業搞起大模型了,而大多數車企目前只規劃了座艙的語音功能,部分車企則開始結合大模型做智駕系統。具體如何解讀當下車企投入大模型的發展現狀?一起來看看本文的分析。
最近這段時間,車企們也開始學互聯網企業,玩起大模型了。
比如理想的自研大模型 Mind GPT ,廣汽的 AI 大模型平臺,以及吉利的全棧自研全場景 AI 大模型等等。
甚至自己做不了的,也得找人去合作。像是東風日產、紅旗、長城這些,就宣布接入百度的 “ 文心一言 ”。
不過,這些車企們到底是純純搞營銷還是真的有東西,脖子哥還得仔細看看。
就目前而言,大多數車企還只規劃了座艙的語音功能,說白了,就是做 ChatGPT 的語音版。
用上的話,語音助手確實會比以往更聰明一點。
比如百度的文心一言,據說搭載上車之后,可以一邊在車上電話開會,一邊自動記錄會議紀要,并且完成簡單的 PPT 制作。
那么……打工人就算開車也沒理由不干活了,百度是懂加班的。
而吉利的這個全場景 AI 大模型就更有意思了,說是有主動搭訕、自動唱歌以及哄娃等能力。
但,用車機語音搭訕和自我營銷,真的有人會用這個功能嗎?他的精神狀態真的還好嗎……
相比他們,一些車企已經到了第二層,開始用大模型做智駕了。
這里面可就大有說法了。目前比較普遍的做法,是將大模型作為工具,輔助汽車的智駕訓練,其中關鍵是訓練智駕系統的應變能力。
目前智駕系統還不能保障 100% 的自動駕駛安全性,是因為存在 AI 還沒見過的場景,一旦遇到這種情況, AI 就容易 “ 把 CPU 給干燒了 ” ,大多數自動駕駛的安全事故都是這樣發生的,這個情況被稱作 Corner case 。
為了解決一個 Corner case ,必須得經歷數據預處理、數據標注、模型訓練和模型仿真等過程,需要用上萬的樣本數據以及數周時間進行測試,費時費力。
過去用來訓練 AI 的數據基本來自真實數據,但是由于 Corner case 發生的概率非常低,要找到世界各地出現的相同 Corner case 并不容易。
用上大模型之后,AI 就可以幫助構建虛擬空間,自動生成訓練場景,可以大幅縮減成本。
比如華為的盤古大模型,會根據路采數據進行重建,生成可編輯的虛擬空間,將原來兩周左右的 Corner case 處理過程縮減到兩天內。
但這還不夠,另一些車企選擇了更為激進的做法,直接選擇用大模型開干智駕。
這就不得不提到特斯拉的 FSD 。
早在 2021 年,特斯拉就采用了 BEV (鳥瞰圖)+ Transformer 的智駕算法,可以說是在車企里用大模型做智駕最早的一批。
咱先不說這套智駕系統的原理是啥,先看這個 Transformer ,其實指的就是大模型架構, ChatGPT 就是基于這個架構生成的。
Transformer 模型架構和傳統神經網絡的區別在于,加入了 “ 注意力機制 ” ,舉個例子,咱們在讀一句話的時候,有些字很關鍵,有些字不關鍵,只要看這些關鍵字,就容易 get 到整個句子的含義,即使個別字寫反,也不影響最終理解的結果。
因此 Transformer 就會對一句話中的每個字設置權重,最后對全文的理解根據每個字加權平均算得,準確性就相對更高了。
這套模型架構將主要用于 FSD 的純視覺感知算法,幫助系統將 2D 的攝像頭視頻數據融合轉化成 3D 的鳥瞰圖,從而自行判斷合理的行駛路線。
然而,就算這套大模型智駕方案擁有更高的泛化能力(舉一反三的能力),特斯拉的 FSD 還是會遇到了各種 Corner case 。
比如在今年的 8 月 26 日,馬斯克在直播測試自動駕駛時,AI 把左轉車道的綠燈當成前進的綠燈,打算筆直穿過路口,此時的老馬不得不主動介入剎停,才避免釀成事故。
要知道這可是當眾直播??!先不說觀眾對 FSD 系統的質疑,就算評論問起應如何解決故障時,老馬也只能說 “ 將投喂更多樣本數據 ” 。
因為壓根沒有什么直接了當的解決辦法,畢竟模型是一個黑箱,沒有人能在里面微操,除了繼續訓練還真沒有什么別的辦法了。
所以,大模型做智駕的主要問題,依然是處理不完的各種 Corner case ,未來的智駕大模型還得繼續在泛化能力上進行升級。
不僅如此,大模型做智駕的另一個難處就是錢。
特斯拉之所以能用上 Transformer ,關鍵是有 72 TOPS 算力的 HW3.0 芯片作為支撐。而現在一些車企用的都是英偉達orin 芯片,它的算力更是達到 254 TOPS,今后隨著模型越來越大,對智駕芯片的算力要求也會越來越高,這意味著車主就要為智駕掏更多的錢。
在研發方面,之前一些企業訓練大模型用的都是 GPU 芯片,但現在都開始用上 TPU 了,功能越強的大模型研發難度越大,普通車企恐怕很難保持長時間的自研過程,與互聯網巨頭合作說不定會更加現實。
不過特斯拉在這上面算是鐵了心,最近, FSD 又進行了一次全面的算法更新,打造了一個 “ 端到端 ” 的智駕模型,把整個智駕過程融入到一個算法和模型里面,這可能是未來各大車企做智駕大模型的一個方向。
要知道,過去的智駕算法是分成三個部分的,感知、決策和執行各司其職,如果將其整合在一起,那么成本會更低,智駕反應也會更快。
隨著技術一次次迭代,也真說不好,什么時候就能把智駕大模型最后的安全難關給攻破了。
但在此之前,一定是一段非常艱難且痛苦的過程。
要脖子哥說, “ 大模型上車 ” 這玩意兒確實有用,但能發揮出幾分功力,還得看各家車企的實力了吧。
圖片資料來源:
- 從乘用車到商用車,不搞大模型的車企不是好車企?
- 華為、特斯拉帶頭,車企卷入「大模型」軍備競賽
- AIGC|萬字長文!帶你了解AI大模型技術演進
- 自動駕駛攻入大模型
作者:TC,編輯:脖子右擰 & 面線
來源公眾號:差評(ID:chaping321),Debug the World。
本文由人人都是產品經理合作媒體 @差評 授權發布,未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!