文/樸晉澤
4 月 8 日,在 2025 首爾國際車展(Seoul Mobility Show 2025)期間,擁有第一代 AI 專業(yè)博士背景的周光,受邀在首爾國際車展論壇(Seoul Mobility Show Forum)發(fā)表了題為《端到端大模型,驅動智能駕駛全球化快速部署》的主題演講,深入剖析了 VLA 模型的技術進展。
周光身后是其在2019年創(chuàng)立的元戎啟行(DeepRoute.ai)。演講中,周光還分享了元戎啟行在規(guī)?;慨a落地方面的實踐經驗,并對行業(yè)未來趨勢作出展望。
此次亮相首爾車展,是元戎啟行正式進軍韓國市場的關鍵之舉。周光在演講中提及的視覺語言動作模型(Vision - Language - Action 模型,簡稱 VLA 模型),融合純視覺與激光雷達方案,可適配多種計算平臺,靈活性極高,能夠全方位滿足全球汽車制造商的多樣化需求,極大地加速智能駕駛技術的規(guī)?;涞剡M程。
作為行業(yè)前沿模型,VLA 模型今年將在超過五款車型上實現落地應用,助力全球汽車制造商快速邁入 AI 驅動的智能出行新時代。
中國首款搭載元戎啟行 VLA 模型的智能駕駛汽車,預計于 2025 年年中正式投放消費市場?;?VLA 模型的端到端推理能力可達幾十秒,長時序推理能力越強,對實時復雜路況的應對處理能力就越出色,且能通過思維鏈逐步展現系統(tǒng)的決策過程,涵蓋周圍環(huán)境感知、預測結果以及行駛規(guī)劃等環(huán)節(jié)。憑借更卓越的駕駛性能和高度透明的智能決策機制,該模型能夠切實增強用戶對智能駕駛技術的信任度。
周光介紹道:我們正面向韓國當地客戶展示端到端 2.0 版本,也就是視覺語言動作(VLA)模型。自今年年初起,中國的智能駕駛行業(yè)便開啟了對端到端模型的探索。鑒于視覺語言動作(VLA)模型與端到端 1.0 版本存在顯著差異,我們期望將這項最新技術引入韓國市場。此技術超越了以往的專用智能系統(tǒng),具備更高的安全性。目前,我們所采用的架構與特斯拉的完全自動駕駛(FSD)V13 版本極為相近。
阿里領投,與中國企業(yè)廣泛合作對于韓國車企而言,元戎啟行還是個陌生名字。但在中國市場,其核心技術已與長城、Smart 等多家主流車企達成量產合作。
其中,與中國頭部智能車企品牌長城汽車合作的新款車型,于 2024 年 8 月正式下線。在 2024 年第四季度,元戎啟行憑借單款車型斬獲超 15% 的市場份額。隨著智能駕駛成為日常出行剛需,行業(yè)即將迎來爆發(fā)式增長,技術護城河正成為企業(yè)搶占市場的關鍵。
圖:元戎啟行(DeepRoute.ai)CEO 周光發(fā)表演講。
2021 年,元戎啟行獲得阿里巴巴 3 億美元戰(zhàn)略投資,阿里成為其最大股東。阿里看重其純 AI 技術路線,認為其原生 AI 思維更具商業(yè)化潛力。這筆融資讓元戎啟行估值突破 10 億美元,躋身獨角獸行列。
對于阿里為何闊綽出手領投元戎啟行,周光有自己的見解。他認為,大多數自動駕駛公司成立于 2016 年到 2019 年期間,那時多數人對人工智能認識模糊,大多公司采用編程、基于即時定位與地圖構建(SLAM)技術、編寫代碼等方式。我覺得我們最大優(yōu)勢在于公司完全基于人工智能。像阿里巴巴這樣的互聯(lián)網巨頭,認為我們的人工智能基因和原生 AI 思維模式,更易取得成功。
圖:智能駕駛系統(tǒng)的發(fā)展
在周光眼中,元戎啟行優(yōu)勢顯著。周光指出:我們擁有頂尖的人工智能技術。我們是中國研發(fā)視覺語言動作(VLA)模型的領先企業(yè),也是率先開發(fā)早期融合技術的公司。我認為視覺語言動作(VLA)模型將是自動駕駛的下一個發(fā)展方向。
海外擴張為何首站選韓國?韓國為何成為元戎啟行出海首站?實際上,韓國國土面積雖小,在汽車領域卻是當之無愧的 大國。作為世界第五大汽車生產國,韓國在全球影響力巨大。近年來,現代、起亞等整車企業(yè)在智能駕駛與電動化轉型方面投入巨大,韓國車企加快自動駕駛技術研發(fā)與實際部署,L2 級輔助駕駛已逐漸成為新車型標配,部分車企還積極推進更高階自動駕駛能力。隨著全球智能出行趨勢加速,韓國本土市場對 AI 驅動的智能駕駛解決方案高度關注,車企期望借助全球前沿技術加速智能化升級,這為元戎啟行等技術供應商創(chuàng)造了良好合作契機。
圖:VLA智能駕駛系統(tǒng)的思維鏈展示
由此可見,韓國在電動化及智能駕駛領域的迅猛發(fā)展使其成為國際焦點,這也是元戎啟行全球戰(zhàn)略的核心市場之一。
周光也認為:韓國汽車制造商一直走在智能駕駛創(chuàng)新前列,并將最新技術應用于量產車型。元戎啟行在中國市場積累了豐富的智能駕駛量產經驗,我們期待與韓國車企深度合作,共同推動 AI 驅動的智能出行發(fā)展。
對于目前元戎啟行與車企開展的合作,周光表示:具體合作車企暫不方便透露,但我們確實有海外運營計劃。我們已在德國進行智能駕駛路測。日韓、歐洲是我們重點關注的市場。商業(yè)進展目前不便透露,韓國是今年海外拓展的第一站。借此次參展機會,我們將與韓國車企深入交流溝通,未來也不排除開展本地路測。
智駕行業(yè)內卷,勇敢者先出海近年來,智能駕駛行業(yè)競爭愈發(fā)白熱化,頭部企業(yè)在算法研發(fā)、場景落地與商業(yè)模式探索等方面不斷加大投入。特別是在自動駕駛這一技術門檻高、投入大、回報周期長的領域,行業(yè) 內卷 現象愈演愈烈。國內企業(yè)不僅在有限的測試資源和政策紅利激烈競爭,還在加速探尋商業(yè)化落地的突破口。
圖:元戎啟行在首爾國際車展的展臺
在此背景下,元戎啟行較早開啟 出海 戰(zhàn)略布局。作為中國智能駕駛企業(yè)中的先鋒,元戎啟行已在德國和新加坡展開業(yè)務部署,并且率先在德國成功開展測試工作 。與專注國內市場的企業(yè)相比,其海外布局不僅有助于規(guī)避單一政策或市場波動帶來的不確定性,還為獲取多元應用場景與客戶資源、塑造國際化品牌形象提供了戰(zhàn)略支撐。
在當下的智能駕駛競爭格局中,元戎啟行面臨著諸多強勁對手,其中包括致力于研發(fā)智能駕駛系統(tǒng)的華為 ADS、特斯拉 FSD 等業(yè)內知名企業(yè) 。這些企業(yè)在技術路線和商業(yè)化模式上各有優(yōu)勢,但共同面臨行業(yè)性難題,即盈利模式尚不清晰。
所以,元戎啟行的 出海 并非只是業(yè)務拓展嘗試,更是一種理性的風險對沖策略。盡管海外市場同樣充滿變數,但作為先行者,有助于其積累應對多元場景與跨國法規(guī)體系的經驗,為未來技術與商業(yè)模式在全球復制奠定基礎。
圖:元戎啟行與高通技術公司簽訂合作協(xié)議
在自動駕駛技術演進方面,多數企業(yè)仍在端到端 1.0 階段探索,而元戎啟行已實現 VLA 架構的實際應用,具備一定先發(fā)優(yōu)勢。尤其在無高精地圖路線探索上,其方案通用性更強,為解決傳統(tǒng)路徑在海外適配難題提供了可能。通過提前布局海外市場,企業(yè)不僅獲得更多維度的實測數據,也進一步提升了抵御國內市場風險的能力。
然而,元戎啟行能否在這場全球化競爭中持續(xù)領先,仍取決于其在產品可靠性、商業(yè)落地能力及跨國適配能力上的長期考驗 。之后《華爾街科技眼》對周光進行了專訪。以下是專訪實錄。
專訪部分:
1.華爾街科技眼:目前智能駕駛系統(tǒng)有基于激光雷達,也有基于攝像頭的,元戎啟行(DeepRoute.ai)的系統(tǒng)是如何運行的呢?
周光:在我看來,基于激光雷達還是基于攝像頭來構建系統(tǒng),并非關鍵要點。人工智能系統(tǒng)的重中之重,在于其人工智能架構。激光雷達和攝像頭本身并未發(fā)生本質改變,它們僅僅是在感知層面,為系統(tǒng)提供了額外的數據采集渠道。在面對未知物體時,增加激光雷達或許能夠提升感知性能。但在大量其他場景下,激光雷達所能發(fā)揮的作用相當有限。尤其是在類似視覺語言動作(VLA)這樣關乎行為決策的層面,激光雷達的作用更是微乎其微 。
2.華爾街科技眼:如果一家外國汽車制造商打算挑選自動駕駛技術,你覺得元戎啟行能吸引他們的最突出優(yōu)勢是什么?
周光:我們的技術性能處于領先地位。舉例來說,當前多數競爭對手仍在全力研發(fā)端到端 1.0 版本技術,而我們的端到端 1.0 系統(tǒng)早已成功部署并應用于量產汽車。由此可見,相較于其他競爭對手,我們的技術領先優(yōu)勢在一年左右。這一領先優(yōu)勢使得產品性能表現截然不同。搭載我們系統(tǒng)的汽車,其駕駛體驗如同人類駕駛一般自然流暢,并且具備極高的安全性。此外,我們的系統(tǒng)還擁有推理能力,能夠讓消費者在選購汽車時更添信心。
3.華爾街科技眼:你們的系統(tǒng)兼容性如何?你們能將其應用到其他平臺上嗎?
周光:能的,我們支持的平臺不止一個。我們可以支持英偉達(NVIDIA)、高通(Qualcomm)以及其他系統(tǒng)級芯片(SoC)平臺。
4. 華爾街科技眼:海外國家和地區(qū)的交通法規(guī)差異很大。那么在進入韓國市場時,要如何進行本地化呢?
周光:首先,不同國家所使用的導航地圖存在差異。以中國為例,我們常用百度地圖或高德地圖,而在韓國,可能就得依靠 Naver 地圖或者 HERE 地圖。不過,一旦完成地圖適配工作,便會發(fā)現韓國的整體交通狀況與中國極為相似,二者均為右舵駕駛,且都有掉頭和環(huán)島等路況,可能僅在交通信號燈設置上存在些許細微差別。因此,從整體來看,針對韓國市場的適配工作量并不大。
其次,我們運用的是端到端模型。該模型具備強大的泛化能力,屬于通用型人工智能系統(tǒng)。
當前,我們正在德國開展道路測試。德國與中國在交通狀況等方面的差異,遠比韓國與中國之間的差異大得多。所以,只要完成地圖適配,基本上就等同于完成了本地化工作的絕大部分。鑒于韓國路況與中國路況差距極小,我相信我們在韓國市場將會有更為出色的表現。
5.華爾街科技眼:元戎啟行的其他競爭對手的競爭力強嗎?跟你們相比,他們有沒有明顯的優(yōu)勢?
周光:部分公司高度依賴強大的基礎設施來支撐其業(yè)務。例如,他們會增添額外的地圖圖層,或是針對特定道路進行過度擬合操作。然而,這種模式在海外部署時往往會遭遇阻礙。究其原因,是由于在海外構建自身基礎設施極為困難,畢竟這些公司的運作高度依賴當地的地理信息,而獲取并搭建相應地理信息基礎設施并非易事。
與之不同的是,我們采用的解決方案完全基于人工智能技術,能夠實現實時推理,不受地理信息基礎設施限制,可靈活適應不同地區(qū)的復雜情況 。
6. 華爾街科技眼:有沒有計劃與韓國的汽車制造商或機器人公司合作,共同開發(fā)人工智能星火(AI Spark)平臺或視覺語言動作(VLA)模型呢?
周光:我們十分樂意開展合作。在我看來,這個行業(yè)需要構建一個生態(tài)系統(tǒng)。我們在人工智能模型方面具有專長,因此會專注于自身的人工智能系統(tǒng),與生態(tài)系統(tǒng)中的不同合作伙伴攜手協(xié)作,以達成商業(yè)化目標,這是我們秉持的原則。
從自動駕駛演進至道路通用人工智能(RoadAGI),這一歷程映射出技術從 弱專家系統(tǒng) 向 通才系統(tǒng) 的進階軌跡。大語言模型的發(fā)展同樣歷經了三個階段,即從弱專家系統(tǒng)起步,發(fā)展至通才系統(tǒng),最終邁向強專家系統(tǒng)。
如今,我們所談及的垂直大模型,像科學、醫(yī)療保健等領域的人工智能,均屬于強專家系統(tǒng)。一年前,市面上還都是通才人工智能模型。我認為自動駕駛技術的發(fā)展進程相較之大語言模型滯后一年。我們期望重構這項技術,使我們的人工智能模型具備通用性,能應用于各類機器人。如此一來,我們才能擁有適用于機器人的基礎模型,進而實現 L5 級自動駕駛。L5 級屬于強專家系統(tǒng),意這味著車輛在道路上可完全無需駕駛員操作。
我認為技術發(fā)展也有其自身的周期,而一個周期就代表著一次代際迭代。
7. 華爾街科技眼:阿里巴巴是你們最大的股東,那么在他們眼中,你們的優(yōu)勢是什么呢?
周光:大多數自動駕駛公司成立于 2016 年至 2019 年期間。彼時,多數人對人工智能缺乏清晰認知。那時,大多數公司采用編程、基于即時定位與地圖構建(SLAM)技術以及編寫代碼等方式開展業(yè)務。而我認為,我們公司最大的優(yōu)勢在于,從創(chuàng)立之初就完全基于人工智能。我從 2011 年開始攻讀人工智能專業(yè)博士學位,當時正值第一代人工智能時期。像阿里巴巴這樣的互聯(lián)網巨頭,看中的正是我們公司所具備的人工智能基因,以及原生的人工智能思維模式,他們認為這讓我們在行業(yè)競爭中更具成功的可能性。
過去幾年間,實踐不斷證明,我們在無地圖解決方案、端到端模型以及視覺語言動作(VLA)模型等方面所踐行的技術路線是正確的。反觀一些專注于即時定位與地圖構建(SLAM)技術,或是單純依賴編寫代碼的公司,在實際落地應用環(huán)節(jié)遭遇諸多困難。因此,我認為我們是少數幾家擁有純正人工智能背景的自動駕駛公司之一,在技術路線和發(fā)展方向上具備獨特優(yōu)勢。
8.華爾街科技眼:阿里巴巴也提供了各種各樣的人工智能模型。你們也會使用其中的一些模型嗎?
周光:目前,我們并不使用他們的模型。大模型屬于數字人工智能范疇,而我們從事的是物理人工智能領域的工作。新范式的物理AI確實會借鑒數字人工智能的技術,但數據閉環(huán)方式有所不同。比如說,物理人工智能對于人工智能安全性的容忍度更低。如果你向 ChatGPT 提問,它給出了一個錯誤答案,可能不會造成太大的危害。但如果同樣的情況發(fā)生在智能駕駛汽車上,就有可能引發(fā)交通事故。整體的后果是不一樣的。所以物理人工智能對安全性更為敏感。除此之外,我們確實會使用阿里云等服務。阿里巴巴在大語言模型方面也非常強大。
9.華爾街科技眼:你們的解決方案在市場上的反響如何?
周光:我認為市場對我們的解決方案深感新穎。特別是近兩年來,大語言模型蓬勃發(fā)展,在此背景下,人工智能的影響力已毋庸置疑??傮w而言,市場對我們的解決方案反響極佳,因為我們獨辟蹊徑,摒棄傳統(tǒng)方法,轉而運用人工智能技術來實現自動駕駛 。
10.華爾街科技眼:既然你無法透露與當地汽車制造商的詳細合作情況,那能否向我們介紹一下你們針對韓國市場的整體規(guī)劃呢?作為自動駕駛領域的專業(yè)企業(yè),下一項關鍵技術會出現在哪里呢?
周光:對于韓國市場,我們確實期望能與當地汽車制造商和機器人公司展開深度合作。但現階段,具體細節(jié)暫不方便透露。
如我之前所說,實體人工智能的發(fā)展進程相比大語言模型大約滯后一年。其發(fā)展軌跡是從弱專家系統(tǒng)邁向通才系統(tǒng),最終進階為強專家系統(tǒng)。目前,我們正處在從弱專家系統(tǒng)向通才系統(tǒng)過渡的的首個階段。一旦在這一過渡階段取得良好進展,元戎啟行(DeepRoute.ai)便能夠為所有智能體構建道路通用人工智能(RoadAGI)。后續(xù)目標是打造出具備強專家系統(tǒng)的 L5 級自動駕駛系統(tǒng),依我看,我們有望在三到五年內達成這一目標。鑒于當下快速的發(fā)展勢頭,我們滿懷信心,借助全新的人工智能架構實現 L5 級自動駕駛。就像特斯拉發(fā)布完全自動駕駛(FSD)V13 版本時,整體安全水平實現大幅躍升一樣 。
看完覺得寫得好的,不防打賞一元,以支持藍海情報網揭秘更多好的項目。