專家多模態(tài)大模型將會重寫自動駕駛系統(tǒng)，無需再重新掃描新城市

藍海情報網(wǎng) 2024-04-29 06:07:20 207

專家：多模態(tài)大模型將會重寫自動駕駛系統(tǒng)，無需再重新掃描新城市

圖片來源：攝圖網(wǎng)

2024年亞布力中國企業(yè)家論壇第24屆年會于2月21日-23日舉行，美國國家工程院外籍院士，北京智源研究院學術顧問委員會主任張宏江出席閉幕式并演講。張宏江在演講中分享了他對大模型發(fā)展的觀察。

關于自動駕駛方面，張宏江談到，我們有理由相信在AI1.0的時代，在深度學習已經(jīng)快速發(fā)展15年的時候，自動駕駛還依然沒法落地，但是大模型的落地一定會比AI1.0來得快，而且快很多。

張宏江表示，多模態(tài)最好的方式是把多模態(tài)的數(shù)據(jù)，包括視頻、語音、圖像也做成token，從而跟語言一起來做訓練，能夠訓練出能夠理解物理世界的大模型。今天我們看到Sora是一個文生視頻的模型，但事實上多模態(tài)遠遠超越文生圖、文生視頻，包括圖生文，更包括視頻的理解，一反一正是非常非常重要的，這是我們對于物理世界理解的核心的核心的一點。

張宏江指出，過去這些年來，所有的自動駕駛的公司，每到一個新的城市必須得花3到6個月重新掃描這個城市的街道，這件事也許就不需要做了，也許大模型就能夠幫你解決了。所以，多模態(tài)將會重寫自動駕駛的系統(tǒng)。

隨著人工智能技術的深度發(fā)展，大模型已成為研究和應用的熱點。大模型在自然語言處理、計算機視覺和強化學習等領域展現(xiàn)出巨大潛力，能夠更準確地理解和處理復雜數(shù)據(jù)。然而，大模型也帶來了巨大的計算和存儲壓力，需要龐大的計算資源來訓練和部署。因此，如何有效地優(yōu)化大模型的計算效率、減少資源消耗成為當前研究和實踐的重要方向。

——AI大模型是一種新的智能計算范式

超大規(guī)模智能模型，簡稱大模型，是近年興起的一種新的人工智能計算范式。和傳統(tǒng)AI模型相比，大模型的訓練使用了更多的數(shù)據(jù)，具有更好的泛化性，可以應用到更廣泛的下游任務中。按照應用場景劃分，AI大模型主要包括語言大模型、視覺大模型和多模態(tài)大模型等。業(yè)界典型的自然語言大模型有GPT-3、源、悟道和文心等。視覺大模型也已廣泛應用于自動駕駛、智能安防、醫(yī)學影像等領域?；诙嗄B(tài)大模型的以文生圖技術也迅速發(fā)展，AI內(nèi)容生成(AI Generated Content，AIGC)已成為下一個AI發(fā)展的重點領域。

專家：多模態(tài)大模型將會重寫自動駕駛系統(tǒng)，無需再重新掃描新城市

——AIGC多行業(yè)滲透，滲透度高

據(jù)IDC，2022年中國人工智能行業(yè)應用滲透度排名前五的行業(yè)依次為互聯(lián)網(wǎng)、金融、政府、電信和制造。另外，AI為自動駕駛、交通物流所賦予的價值也不容忽視，據(jù)麥肯錫預計，AI為交通領域創(chuàng)造3800億元的經(jīng)濟價值。

專家：多模態(tài)大模型將會重寫自動駕駛系統(tǒng)，無需再重新掃描新城市

平安證券分析師閆磊表示，當前，全球范圍內(nèi)大模型領域的競爭依然白熱化，這將持續(xù)提升大模型的整體能力水平。大模型需要大算力，大模型算法的迭代升級將為全球和中國AI算力市場的增長提供強勁動力。在應用端，我國國產(chǎn)大模型能力持續(xù)升級，AIGC產(chǎn)業(yè)未來發(fā)展前景廣闊。

經(jīng)濟學人APP資訊組

看完覺得寫得好的，不防打賞一元，以支持藍海情報網(wǎng)揭秘更多好的項目。

標簽：模型駕駛多模隨筆