圖片來源:攝圖網(wǎng)
2024年亞布力中國企業(yè)家論壇第24屆年會于2月21日-23日舉行,美國國家工程院外籍院士,北京智源研究院學術顧問委員會主任張宏江出席閉幕式并演講。張宏江在演講中分享了他對大模型發(fā)展的觀察。
關于自動駕駛方面,張宏江談到,我們有理由相信在AI1.0的時代,在深度學習已經(jīng)快速發(fā)展15年的時候,自動駕駛還依然沒法落地,但是大模型的落地一定會比AI1.0來得快,而且快很多。
張宏江表示,多模態(tài)最好的方式是把多模態(tài)的數(shù)據(jù),包括視頻、語音、圖像也做成token,從而跟語言一起來做訓練,能夠訓練出能夠理解物理世界的大模型。今天我們看到Sora是一個文生視頻的模型,但事實上多模態(tài)遠遠超越文生圖、文生視頻,包括圖生文,更包括視頻的理解,一反一正是非常非常重要的,這是我們對于物理世界理解的核心的核心的一點。
張宏江指出,過去這些年來,所有的自動駕駛的公司,每到一個新的城市必須得花3到6個月重新掃描這個城市的街道,這件事也許就不需要做了,也許大模型就能夠幫你解決了。所以,多模態(tài)將會重寫自動駕駛的系統(tǒng)。
隨著人工智能技術的深度發(fā)展,大模型已成為研究和應用的熱點。大模型在自然語言處理、計算機視覺和強化學習等領域展現(xiàn)出巨大潛力,能夠更準確地理解和處理復雜數(shù)據(jù)。然而,大模型也帶來了巨大的計算和存儲壓力,需要龐大的計算資源來訓練和部署。因此,如何有效地優(yōu)化大模型的計算效率、減少資源消耗成為當前研究和實踐的重要方向。
——AI大模型是一種新的智能計算范式
超大規(guī)模智能模型,簡稱大模型,是近年興起的一種新的人工智能計算范式。和傳統(tǒng)AI模型相比,大模型的訓練使用了更多的數(shù)據(jù),具有更好的泛化性,可以應用到更廣泛的下游任務中。按照應用場景劃分,AI大模型主要包括語言大模型、視覺大模型和多模態(tài)大模型等。業(yè)界典型的自然語言大模型有GPT-3、源、悟道和文心等。視覺大模型也已廣泛應用于自動駕駛、智能安防、醫(yī)學影像等領域?;诙嗄B(tài)大模型的以文生圖技術也迅速發(fā)展,AI內(nèi)容生成(AI Generated Content,AIGC)已成為下一個AI發(fā)展的重點領域。
——AIGC多行業(yè)滲透,滲透度高
據(jù)IDC,2022年中國人工智能行業(yè)應用滲透度排名前五的行業(yè)依次為互聯(lián)網(wǎng)、金融、政府、電信和制造。另外,AI為自動駕駛、交通物流所賦予的價值也不容忽視,據(jù)麥肯錫預計,AI為交通領域創(chuàng)造3800億元的經(jīng)濟價值。
平安證券分析師閆磊表示,當前,全球范圍內(nèi)大模型領域的競爭依然白熱化,這將持續(xù)提升大模型的整體能力水平。大模型需要大算力,大模型算法的迭代升級將為全球和中國AI算力市場的增長提供強勁動力。在應用端,我國國產(chǎn)大模型能力持續(xù)升級,AIGC產(chǎn)業(yè)未來發(fā)展前景廣闊。
經(jīng)濟學人APP資訊組
看完覺得寫得好的,不防打賞一元,以支持藍海情報網(wǎng)揭秘更多好的項目。