国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

藍(lán)海情報(bào)網(wǎng)

加入端到端競(jìng)賽,理想智駕的快與慢

藍(lán)海情報(bào)網(wǎng) 751

加入端到端競(jìng)賽,理想智駕的快與慢

文|劉俊宏

一向強(qiáng)調(diào)產(chǎn)品大于技術(shù)的理想汽車(下面簡稱理想),也加入了智能駕駛的端到端競(jìng)賽。

就在7月5日的智駕發(fā)布會(huì)上,理想一反常態(tài),先宣布了全國無圖NOA全量推送。隨后,理想宣布,下一版本即將落地的大模型端到端智駕。

這意味著,從2023年才開始將智駕領(lǐng)先作為核心戰(zhàn)略目標(biāo)的理想,不僅追平了高階智駕落地,更是在端到端的技術(shù)路線上,比已經(jīng)落地的華為和小鵬還要激進(jìn)。

一年來,理想在智駕技術(shù)的追趕中幾次經(jīng)歷變動(dòng)。

在2023年5月時(shí),理想汽車智能駕駛副總裁郎咸朋在一次采訪中還表示,理想還在做無圖化的BEV+OCC智駕架構(gòu)。而在今年的中國汽車藍(lán)皮書論壇上,郎咸朋就一步跨為了端到端賽道的擁護(hù)者,端到端+大模型,是更接近于人類駕駛的智能駕駛方案。

除了郎咸朋,理想智駕端到端背后的核心研發(fā)人員,包括智能駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬和高級(jí)算法專家詹錕。

無論是理想、華為、小鵬還是長城汽車,中國智駕玩家們普遍采用分段式的路線,與特斯拉FSD一步到位的跨越式端到端方案,形成了鮮明的對(duì)壘。

不過,對(duì)于理想這家善于用產(chǎn)品定義智能汽車的公司而言,智駕最大的意義在于理想拿下了智能汽車設(shè)計(jì)工具箱的最后一環(huán)。在理想MEGA失利后,理想真正意義上的下一代產(chǎn)品快要來了。

全國都能開,追平一線智駕水平

我們很羨慕理想,能在批量交付的車主中,選擇種子用戶來實(shí)驗(yàn)智駕。一位傳統(tǒng)車企的智能化負(fù)責(zé)人對(duì)光錐智能表示。

相比去年就開放全國都能開的鴻蒙智行,理想的城市NOA落地節(jié)奏還是稍微慢了一步,智駕能力顯然和銷量不成正比。

2024年,整個(gè)行業(yè)的高階智駕落地再向前推進(jìn)了一大步,理想也跟上了節(jié)奏。

在7月5日的智能駕駛夏季發(fā)布會(huì)上,理想終于結(jié)束了今年5月開始的城市NOA測(cè)試體驗(yàn)。在智駕OTA6.0的升級(jí)中,面向AD MAX版本的用戶全量推送了城市無圖NOA功能。

本次升級(jí),理想智駕通過行業(yè)內(nèi)比較成熟的BEV+OCC+Transformer技術(shù),實(shí)現(xiàn)了理想車主期盼已久的城市NOA。針對(duì)具體能力,理想還總結(jié)出了哪里都能開、繞行絲滑、路口輕松、默契安心的四大特色。

其中,哪里都能開是智駕行業(yè)去高精地圖的成果。在普通導(dǎo)航地圖的指引下,智駕有路就能開。路口輕松和默契安心,主要基于BEV+OCC技術(shù)的應(yīng)用,智駕系統(tǒng)能夠認(rèn)識(shí)到外部環(huán)境,并做出相應(yīng)的反應(yīng)。

在我并線時(shí),我看到了一個(gè)對(duì)象,汽車也看到并立即作出響應(yīng),這就是一種默契和安心,智駕順暢通行的能力,理想汽車產(chǎn)品部高級(jí)副總裁范皓稱。

加入端到端競(jìng)賽,理想智駕的快與慢

具體的特色功能,主要聚焦在繞行絲滑上。

在老城區(qū)場(chǎng)景中,經(jīng)常會(huì)遇到前方車輛突然停下接人的情況。對(duì)于這種情況,行業(yè)內(nèi)不少智駕玩家的決策是等待前車再次啟動(dòng)(或等一會(huì)再繞行)。而理想的繞行絲滑,則是與人類司機(jī)一樣,等一秒鐘便立刻打一把方向盤繞開。

加入端到端競(jìng)賽,理想智駕的快與慢

不磨嘰繞行的背后,是理想在BEV中添加了時(shí)序概念。讓傳統(tǒng)BEV視角下,只能感受單幀圖像內(nèi)障礙物的智駕系統(tǒng),擁有了預(yù)判未來的能力。

智駕理解時(shí)間的重要性,恰如人類的時(shí)間知覺。就像是人類結(jié)合自身位置和飛行軌跡接飛盤一樣,在多幀畫面的綜合理解下,智駕也能明白事物的延續(xù)性和順序性。對(duì)應(yīng)到具體操作上,是預(yù)測(cè)自車與他車的空間交互關(guān)系,規(guī)劃未來時(shí)間窗口內(nèi)的所有可行駛軌跡,進(jìn)而無需觀望果斷繞行。

通過這四大功能,理想智駕已經(jīng)能夠適應(yīng)絕大部分場(chǎng)景,保障行車安全。但安全只是智駕最基礎(chǔ)的能力,通過部分演示看到,理想智駕在邏輯決策上存在著短板。

例如在轉(zhuǎn)向中,面對(duì)斑馬線上加速通過的小孩,理想智駕起初仍選擇正常通過,隨后觸發(fā)AEB緊急剎停。誠然在結(jié)果上,理想智駕沒有發(fā)生事故。但若是真人司機(jī)操刀,是看到異常情況立即減速觀望,而非繼續(xù)嘗試通過。

加入端到端競(jìng)賽,理想智駕的快與慢

出現(xiàn)如此情況,意味著理想智駕在邏輯決策與智駕控制能力的兩個(gè)層面上,并未完全對(duì)齊。

邏輯問題,有望在落地端到端大模型后,在下一個(gè)版本中得到優(yōu)化。

大模型的快與慢

理想的智駕團(tuán)隊(duì)和馬斯克一樣,都喜歡從本體論視角拆解目標(biāo)。

馬斯克從亞里士多德的第一性原理上,認(rèn)識(shí)到能源的重要性。而理想智駕團(tuán)隊(duì)從《思考,快與慢》中認(rèn)識(shí)到,學(xué)習(xí)人類的思維邏輯,是智駕達(dá)到人類水平的關(guān)鍵。

為了模擬人類的下意識(shí)反應(yīng)和深思熟慮操作,理想智駕團(tuán)隊(duì)沒有選擇類似特斯拉FSD的跨越式方案,而是搭建了快慢雙系統(tǒng)(對(duì)應(yīng)系統(tǒng)一和系統(tǒng)二)。

加入端到端競(jìng)賽,理想智駕的快與慢

其中,系統(tǒng)一是完全的端到端架構(gòu)。與特斯拉FSD一樣,都是在收到傳感器信息后,直接操作汽車。就像是人類面對(duì)正常路況一樣,加減速不需要思考太多。這部分的訓(xùn)練,理想選擇了與特斯拉類似的訓(xùn)練方式,讓智駕直接學(xué)習(xí)五星好司機(jī)的真實(shí)駕駛視頻。并添加強(qiáng)化學(xué)習(xí),讓智駕在模仿之余,找到更優(yōu)的解法。

在系統(tǒng)一的基礎(chǔ)上,理想將大模型(主要是VLM)作為高級(jí)規(guī)控的方式,控制整個(gè)智駕系統(tǒng)的邏輯決策能力。系統(tǒng)二的底層技術(shù)原理,可以理解為參考人類的綜合信息理解能力。理想在傳統(tǒng)智駕的Transformer框架下,將視頻、汽車狀態(tài)等信息統(tǒng)一扔進(jìn)一個(gè)編碼器。從而讓智駕獲得深思熟慮的能力,避免鬧出白馬非馬的笑話。

加入端到端競(jìng)賽,理想智駕的快與慢

具體而言,在路口等待的場(chǎng)景中,行業(yè)不少解決方案只能認(rèn)出紅綠燈,但具體的讀秒需要導(dǎo)航地圖的反饋,無法實(shí)現(xiàn)智駕自動(dòng)起步。而智駕有了理解能力之后,智駕不僅能認(rèn)出紅綠燈,還能明白讀秒的含義。更進(jìn)一步,當(dāng)導(dǎo)航地圖不夠精確的時(shí)候,系統(tǒng)二會(huì)根據(jù)實(shí)際需要糾正導(dǎo)航地圖的錯(cuò)誤,避免汽車跟著導(dǎo)航開到輔路上。

加入端到端競(jìng)賽,理想智駕的快與慢

可以看到,大模型在更好地應(yīng)對(duì)路況的同時(shí),也萌生出了按照自己理解開車的想法。為了放大模型能力的上限,理想也給出了更符合大模型體質(zhì)的訓(xùn)練方法。

在自動(dòng)駕駛領(lǐng)域中,單靠真實(shí)數(shù)據(jù)訓(xùn)練智駕遠(yuǎn)遠(yuǎn)不夠。為了讓智駕學(xué)到現(xiàn)實(shí)難以遇上的Corner Case,需要在仿真環(huán)節(jié)中讓智駕模擬訓(xùn)練。

2021年,特斯拉分享了一套基于3D虛擬+現(xiàn)實(shí)重建的仿真技術(shù)。通過對(duì)現(xiàn)實(shí)數(shù)據(jù)采集,特斯拉在虛擬世界模擬重構(gòu)一些如高速上有人奔跑、馬路上擠滿人等超現(xiàn)實(shí)場(chǎng)景。雖說這套方案促成了今天的FSD,但缺點(diǎn)也非常明顯。在極大的信息標(biāo)注量和算力需求下,馬斯克買不到足夠訓(xùn)練用的GPU,只能干看著。

理想的解決方案,也是行業(yè)內(nèi)目前普遍使用的,是將現(xiàn)實(shí)重建與Diffusion技術(shù)相結(jié)合。以真實(shí)數(shù)據(jù)為基礎(chǔ),畫出想象中可能遇到的具體路況。例如在一段汽車駕駛的畫面中,理想的仿真方案能根據(jù)提示詞生成晴天、陰天、雨天、雪天等多種場(chǎng)景用于訓(xùn)練。

15秒經(jīng)歷一年四季,遍覽世間繁華,理想汽車智能駕駛技術(shù)負(fù)責(zé)人賈鵬表示。

加入端到端競(jìng)賽,理想智駕的快與慢

如今,伴隨著理想城市NOA落地,和即將開啟的端到端大模型智駕測(cè)試,或許,理想能夠憑借智駕能力,跳出理想ONE的圍城。

跳出理想ONE的圍城

理想可能是所有造車新勢(shì)力們最羨慕的樣子,但也是理想最想擺脫的樣子。

羨慕的部分,是理想以單月超4萬的銷量,以實(shí)力碾碎市場(chǎng)上關(guān)于增程落后、創(chuàng)新全靠冰箱彩電沙發(fā)的爭議。憑借對(duì)汽車產(chǎn)品理解,理想不僅成為了第一個(gè)盈利的造車新勢(shì)力,更是以理想ONE開創(chuàng)了中國全新的汽車文化。

汽車工業(yè)過往時(shí)期,巨頭們的崛起主要靠大時(shí)代下的錯(cuò)位競(jìng)爭。在福特汽車制霸時(shí)期,是標(biāo)準(zhǔn)化生產(chǎn)讓汽車走下奢侈品神壇;在日系車拿下美國市場(chǎng)時(shí)期,靠的是石油危機(jī)時(shí)提供的低出行成本;在中國自主品牌興起的現(xiàn)在,一是靠供給側(cè)降本實(shí)現(xiàn)低價(jià)對(duì)標(biāo)合資車,二是通過電動(dòng)化、智能化彎道超車。

但理想成功的路線,并非承接時(shí)代的機(jī)遇,只靠低價(jià)卷。而是從需求側(cè)出發(fā),以產(chǎn)品經(jīng)理思維重塑了汽車行業(yè)過往從供給側(cè)設(shè)計(jì)產(chǎn)品的模式。

在理想ONE上,理想基于用戶畫像、需求痛點(diǎn)、市場(chǎng)研究、用戶體驗(yàn)等邏輯,給出了上市即交付、盡量少的選配、新能源與續(xù)航兼得(增程)、座艙空間享受等綜合特性的汽車產(chǎn)品。在理想的一攬子產(chǎn)品思路下,汽車行業(yè)的后來者們紛紛開始效仿學(xué)習(xí),理想也從理想ONE中差異化裂變出整個(gè)L系列。

但在此之后,理想真正意義上的下一代產(chǎn)品卻始終沒有到來。理想MEGA的受挫,完全可以認(rèn)為是進(jìn)軍純電賽道時(shí)選擇了保守策略,以大型MPV的標(biāo)簽將自己限定在了一個(gè)相對(duì)小眾的市場(chǎng)?;蛟S,理想下一次產(chǎn)品的發(fā)力點(diǎn),還得看今年未發(fā)的三款純電產(chǎn)品。

但是,由高階智駕帶動(dòng)的新一輪智能汽車需求,已經(jīng)在揭開汽車市場(chǎng)的下一幕了。

隨著2024年越來越多的車企宣布落地高階智駕,在蔚來、理想、小鵬、小米、廣汽、長城等車企,華為、毫末、Momenta、元戎啟行、商湯絕影等頭部智駕供應(yīng)商的共同表態(tài)下,智駕端到端的技術(shù)架構(gòu)也被提到了臺(tái)前。

甚至,英偉達(dá)汽車事業(yè)部副總裁吳新宙還稱,端到端,正是智駕三部曲的最終曲。

智駕玩家們?nèi)绱丝春枚说蕉耍⒉恢皇强吹搅颂厮估璅SD的成功經(jīng)驗(yàn)、技術(shù)架構(gòu)對(duì)信息的處理能力,或是大模型訓(xùn)練下的迭代速度。最核心的看好的,是端到端帶來的主動(dòng)智能。

正如長城汽車智能平臺(tái)開發(fā)中心的高級(jí)總監(jiān)姜海鵬所言,真正智能駕駛終點(diǎn)一定像人一樣有思考,對(duì)場(chǎng)景有理解,基于對(duì)場(chǎng)景有理解基礎(chǔ)之上做智駕的動(dòng)作,端到端的路線,讓機(jī)械的智駕有了媲美人類思維的可能。

不過,目前國內(nèi)已經(jīng)(或準(zhǔn)備)落地玩家的情況,大多都是部分端到端的分段式方案,而非特斯拉FSD的跨越式架構(gòu)。

其中,華為和小鵬的架構(gòu)比較類似,大致方向是將之前智駕中感知、規(guī)劃、控制三部曲,拆分成感知、規(guī)控兩個(gè)端到端模型。長城的SEE大模型是將感知部分進(jìn)行端到端處理,規(guī)控階段有專家策略參與。理想的方案,則是用VLM充當(dāng)完整端到端架構(gòu)的高級(jí)規(guī)控,方案最激進(jìn)。

國內(nèi)智駕玩家采用分段式端到端架構(gòu)的原因,可以參考李想在今年汽車重慶論壇上對(duì)于系統(tǒng)二用途的解釋,用于端到端的訓(xùn)練,大概一個(gè)月十輪左右的訓(xùn)練,基本就可以完成一個(gè)無圖 NOA 的上限水平。但是面對(duì)中國的復(fù)雜路況,只有端到端不夠,我們要思考什么是系統(tǒng)二。系統(tǒng)二的啟發(fā)在于,解決各種各樣的Corner Case和各種泛化的問題。

換句話說,國內(nèi)智駕系統(tǒng)們對(duì)于當(dāng)前大模型能力的不足,在想辦法通過更強(qiáng)規(guī)控的工程化方式去落地。

當(dāng)數(shù)據(jù)達(dá)到特斯拉級(jí)別的百萬量級(jí)以上,通過對(duì)模型的強(qiáng)訓(xùn)練,智駕可學(xué)習(xí)視頻流,就能直接告訴司機(jī)駕駛的方向,像當(dāng)下流行的ChatGPT一樣,曾在特斯拉主導(dǎo)建立機(jī)器學(xué)習(xí)團(tuán)隊(duì)的谷俊麗在WAIC上如此表示。

但正所謂羅馬不是一天建成的,李想在端到端智駕的變革中也找到了自己的方向,我們認(rèn)為端到端 + VLM + 生成式的驗(yàn)證系統(tǒng),也會(huì)是未來整個(gè)物理世界機(jī)器人最重要技術(shù)架構(gòu)和技術(shù)體系。

看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽:

ad2

推薦內(nèi)容