GPT上車只為人車交互?車企還在憋大招
隨著ChatGPT等AI人工智能技術的快速發展,許多行業也開始將相關技術融入應用場景中,比如汽車廠商就將GPT能力集成到了人車交互場景上,并進一步推動了自動駕駛解決方案的進展。具體如何理解?不妨來看看作者的解讀。
ChatGPT改造汽車的序幕已經拉開,奔馳率先出手。
不久前,梅賽德斯-奔馳將ChatGPT集成到了車機上,開啟了為期三個月的測試,結果顯示,它的語音助手不僅可以完成簡單地指令,還能進行連續多輪對話,理解能力和響應質量都有較大提升。
理想、創維、蔚來等汽車廠商隨即蜂擁而入,用前沿的GPT能力讓車機智能化程度更上一層樓。車機也徹底從最初的“收音機”變成了功能豐富的智能終端,加上GPT“大腦”后,又開始從木訥、雞肋的機器向行車伙伴轉變。
而人車交互不是AI上車的盡頭,自動駕駛才是未來。以往的自動駕駛解決方案過于依賴高精地圖,一旦地圖更新跟不上瞬息萬變的路況,行車安全將受到威脅。AI大模型的進化升級,讓車企們看到了機會。
讓AI主動感知和決策,放棄對高精地圖的依賴,正在成為一種主流趨勢。幾天前,理想汽車開啟城市NOA(導航輔助駕駛)內測,它將BEV(Bird’s eye view,鳥瞰圖)大模型作為主要解決方案,讓汽車模仿人類“腦回路”駕車。通過連續學習,城市NOA還能被訓練成用戶通勤路線上“代駕”。
接棒互聯網,AI正在對汽車進行更深層次的改造,四個輪子的大家伙越來越神似變形金剛。
一、車機+GPT,奔馳先出手??
一場由內而外的“變形記”正在席卷汽車圈,從傳統燃油動力到新能源,從駕駛工具到智能化產品。多年以來,科技驅使下,汽車不斷變幻著外貌和內在,互聯網改造汽車后,人工智能又來了。
梅賽德斯-奔馳在這股新浪潮中一馬當先,要把ChatGPT移植進車機。
6月16日,奔馳為期3個月的ChatGPT測試計劃在美國啟動,它與微軟合作,通過Azure OpenAI服務將ChatGPT集成到車機中。車主可以通過Mercedes me APP選擇使用ChatGPT,還有更直觀測試方式——直接在車內使用語音命令“Hey Mercedes,我想加入測試計劃”,奔馳的MBUX信息娛樂系統就會將語音助手“Hey Mercedes”自動接入ChatGPT。
過往,Hey Mercedes可以提供體育、天氣等信息,并回答有關車輛周圍環境的問題,還能控制用戶的智能家居,這都是制式化的。ChatGPT加入把問答變靈活了,用戶能詢問目的地詳細信息,獲得晚餐建議,可以不斷提出問題,連續收到回復。這是ChatGPT的看家本領。
當前,僅在美國地區約90萬輛配備MBUX的奔馳汽車可以優先測試ChatGPT,奔馳打算利用這個初始測試期深入了解用戶提出的請求,來確定未來開發的優先事項,以及調整不同市場和語言的推出策略。
關于接入ChatGPT這事兒,奔馳給了一個充滿感性的聲明,“一切目標都圍繞著重新定義您與梅賽德斯的關系?!北捡Y要讓ChatGPT重塑人車交互體驗,更形象的類比是,車機從一個木訥的注重功能性的機器“活”起來了,向著車內生活伙伴的角色轉變。
奔馳之后,國內的汽車廠商率先跟上。
6月19日,理想汽車推出了自研的認知大模型“Mind GPT”,這個大模型由理想的空間算法團隊研發。據說大模型訓練的開始日期早在ChatGPT發布之前,MindGPT基于數10 TB的原始訓練數據,使用了1.3萬億個Token進行基座模型訓練,能識別聲紋和語音內容,還能聽懂方言,同時能為車主提供出行規劃,甚至具備AI繪畫和AI計算等功能。
理想透露,Mind GPT發布后,理想汽車將新增LUI(用戶語言界面)交互方式,“比如你想吃個火鍋,只需要呼叫理想同學,車機界面就會生成火鍋的圖片供你選擇,隨后自動算好出行路線?!?/p>
創維汽車也在近日宣布,旗下兩款車型創維EV6Ⅱ及創維HT-iⅡ在智能車機上集成了ChatGPT,此外,長城汽車、蔚來汽車、小鵬汽車、奇瑞汽車四家車企都在上個月申請了GPT相關商標。
GPT上車成為一股潮流。奧緯咨詢董事合伙人張君毅認為,GPT技術的接入能夠提升車的人機交互能力和綜合環境問題的互動能力。今后車企在同一價位段的硬件方面的品牌差異會越來越小,當舒適性、安全性、動力和續航里程上競爭難以產生太大的差異時,卷智能就成了必然選擇。
二、給智能座艙裝上“大腦”
ChatGPT上車又是汽車進化史上可書的一筆,最前沿的自然語言處理大模型應用到了人類的出行工具上,更豐富的車內生活體驗將會出現。
回望30多年前,車載娛樂功能和車機智能化,尚是一片空白。第一代車機誕生于上世紀80-90年代,當時人們普遍的關注點還是汽車的發動機、底盤和變速箱“三大件”,突然有一些車型不僅能聽收音機,還能吞進磁帶,自由播放音樂,汽車有了一些第二生活空間的影子。
第二代車機則加入了DVD播放、MP3,娛樂性凸顯的同時,汽車又向駕駛體驗邁了一步,加入了車載導航。此時,解決“路盲”問題成為一個主流趨勢。許多老司機一定記得,在沒有車聯網的時代,凱立德車載導航成了高端車型的標配,它使用GPS衛星定位和存在車機里的地圖包數據,實現相對準確的導航精度。
但除了導航和聽歌、收音之外,當時的人們并不對車機抱有太多期待,車機也往往不是決定購車與否的主要因素。
進入21世紀,電子數碼技術不斷發展,手機的形態先變了。循著這個進化思路,車機上出現大屏,智能化成為新賣點。基于linux、WinCE、安卓等系統的車機陸續被汽車廠商采用,而后汽車不僅可以免費實時導航,還具備全景可視系統、汽車駕駛輔助系統,比如360度影像等。
當汽車連了網,一切由變得更不一樣。在線觀影、路書、語音控制、預約保養、遠程診斷等功能被加入車機,中控臺的屏幕越來越大,功能越來越多,一些廠商直接在駕駛室裝上了比平板電腦還大的顯示屏,甚至廠商們近來卷起了“全面屏”,就連副駕和后排都要裝上屏幕。
終于,“第三塊屏”的概念越來越顯眼,主機廠們希望,車機能夠成為繼電腦和手機之后,影響人類生活的第三代智能終端。用富含科技感的車機占領用戶心智,拓展更多的商業模式,成為現在的車企們攻堅的方向。
現在,“車機”這一原始概念逐漸被“智能座艙”所替代。蔚來甚至造出了“第二起居室”的新詞,不僅車機越來越智能化,車企們開始卷內飾用料、音響系統、燈光系統,蔚來還發布了一款AR眼鏡,支持隨車巨幕觀影;理想L9甚至配備了一個后排冰箱,讓汽車成了可移動的房子。
但無論是車機還是智能座艙,語音對話一直都是發展相對滯后的功能,考慮到駕駛安全性,語音操控又十分必要。
過去近十年來,幾乎所有車企和大量的AI創業公司,在自然語言處理領域投入頗多,希望優化車內的語音交互體驗。許多車機都能回答簡單的預設命令,比如調高溫度、預報天氣等,升級和創新圍繞拓寬自然語言口令展開,比如當用戶說“有點熱”后,車機可以打開空調制冷或調低溫度。
但想讓車機聽懂更多“人話”,比如用各種方言規劃路線、甚至找餐館,可能還真不如車主自己用手機地圖和大眾點評來得有效,更豐富的語音式人車交互陷入瓶頸,直到ChatGPT出現。
自然語言大模型產品(ChatGPT、文心一言、通義千問等)直接開放給C端使用,使智能座艙的開發者們看到了曙光。強大的理解能力和邏輯推理能力,有望讓車機成為行車助手,暗藏商業可能。
比如,車主可以告訴語音助手,“幫我找出目的地附近有團購優惠、評分超過4.5的火鍋店,一會有5個人用餐,給我預定一下位置,再看一下哪里停車方便?!狈旁谝郧?,車機絕對無法一次性理解如此多的信息,但對ChatGPT來說,這只是它的基操,只要實時數據源足夠多,需求被滿足的可能性能夠無限大。
GPT的加入并不只是讓對話更流暢了,而是讓車機具有了“大腦”,不僅能回答問題,還能理解需求并生成答復。至于智商有多高、反應有多快,取決于汽車廠商對上車大模型的訓練能力,以及敢不敢“氪”金上更牛的硬件(芯片)。
三、AI如何讓自動駕駛“腦回路”更像人?
車內生活的豐富,讓汽車逐漸成長為一個充滿溫情的載體,它不再是枯燥、冰冷的代步工具,轉而成為一個舒適的生活空間。
而AI主導的汽車進化還不止于GPT上車,它對自動駕駛的技術推動更加意義重大。
傳統的自動駕駛研究方法是通過采集大規模的駕駛數據、測試更長的駕駛里程來覆蓋所有可能的駕駛場景,以確保發生突發狀況時汽車有預先設定的應對方案。但突發狀況的復雜程度往往難以預料,一旦系統中沒有應對某種特殊突發狀況的預案,駕駛安全就將受到極大的威脅。
這也是為什么當前的輔助駕駛系統,必須要求駕駛員手扶方向盤以應對實時突發情況。而AI的學習能力將有可能改變這個現狀。
不久前,清華大學研究團隊提出了自動駕駛“可信持續進化”技術,該技術是基于動態評估AI的可信賴程度進行學習訓練,保證自動駕駛汽車在遇到陌生新場景時,其駕駛能力可從基礎性的主動避讓開始持續提升,在確保安全前提下達到更好的駕駛表現。
簡單理解,利用AI,自動駕駛功能的汽車能主動學習、熟悉各種新遇到的場景,進行持續進化,隨著駕駛里程與數據量的累積,性能得到持續提升。
理想汽車正將AI大模型用到自動駕駛領域。6月17日,理想宣布開啟城市NOA(導航輔助駕駛)內測,并將在下半年向用戶開放通勤NOA功能。與常規解決方案不同的是,理想采用了BEV(Bird’s eye view,鳥瞰圖)大模型,來實時感知和理解環境中的道路結構信息,讓汽車更能模仿人類駕駛員的操作習慣。
以往多數汽車上的輔助駕駛系統,大多是采用高精地圖方案,相當于實時把路況投喂給自動駕駛系統,讓其做出決策。但在復雜的城市道路中,總會有高精地圖無法覆蓋和無法及時更新的區域,這成為了該方案的一大缺點。而采用BEV大模型后,相當于AI主動感知實時路況,自主決策駕駛操作。
當然,BEV也有缺點,例如在一些跨度較大的路口,通行車輛較多,傳感器視野容易被遮擋,導致車端實時感知的結果會丟失局部的信息。為了彌補這一不足,理想據稱搭配了神經先驗網絡(NeuralPriorNet,簡稱NPN)和端到端的信號燈意圖網絡,前者的作用相當于每當車走過自動駕駛車隊走過的路口,都有圖像參考;后者則是學習大量人類司機在路口對于信號燈變化的反應,幫助自動駕駛系統理解交通信號。
使用NPN網絡彌補BEV模型缺陷
根據實際的測試反饋,理想城市NOA還不能夠完全實現自動駕駛,它存在轉彎不夠及時和不擅長超車的問題,此外,面對一些特殊障礙物,算法無法做出決策,必須進行人工接管。
不過,相比于傳統的訓練方式,大模型的引入最大的改變還是讓自動駕駛系統有了更強的學習能力,這意味著自動駕駛能力會逐漸提升。典型的案例是,理想汽車推出了通勤NOA功能,在開啟該功能之前,車主需要先設定通勤路線,通過日常通勤時的自動化訓練積累NPN特征,大約1至3周時間后,AI可以成長為通勤路段的“代駕”。
這個過程體現了AI大模型加持下的自動駕駛汽車操作思路:先學習和熟悉路況,再進行輔助駕駛,“腦回路”更像人類了。
用AI大模型研發自動駕駛鼻祖不是理想,而是特斯拉。早在2021年,特斯拉就曾推出基于Transformer架構的BEV感知方案,隨后華為、百度等企業也在“BEV+Transformer”上展開布局,目前,特斯拉、小鵬汽車、問界汽車等都在落地和不斷優化類“城市NOA”功能。
大模型的持續進化,很可能讓車企們找到了自動駕駛技術的突破方向,擺脫對高精度地圖的依賴是第一步?,F在的自動駕駛還停留在“輔助駕駛”階段,未來,你很有可能會將你的車交給AI接管。
作者:凱爾,編輯:文刀
來源公眾號:元宇宙日爆(ID:yuanyuzhouribao),在這里,看見未來。
本文由人人都是產品經理合作媒體 @元宇宙日爆 授權發布,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!