圖片來源:攝圖網(wǎng)
隨著人工智能技術(shù)的深入發(fā)展,大模型成為各企業(yè)競相追逐的熱門賽道。大模型在語音識別、自然語言處理、圖像識別等領(lǐng)域展現(xiàn)出巨大潛力,各大科技巨頭紛紛加大投入,競相研發(fā)更強(qiáng)大的大模型,以提升人工智能系統(tǒng)的性能和智能化水平。
當(dāng)?shù)貢r(shí)間4月18日,meta在官網(wǎng)上宣布公布了旗下最新開源大模型Llama 3。目前,Llama 3已經(jīng)開放了80億(8B)和700億(70B)兩個(gè)小參數(shù)版本。根據(jù)meta官方介紹,Llama 3在兩個(gè)定制的24K GPU集群上基于超過15T的數(shù)據(jù)進(jìn)行了訓(xùn)練——這比Llama 2使用的數(shù)據(jù)集大7倍,多4倍的代碼,并且Llama 3支持8K上下文長度,是Llama 2容量的兩倍。
未來,meta將推出Llama 3的更大參數(shù)版本,其將擁有超過4000億參數(shù)。業(yè)界指出,這是目前為止最先進(jìn)的開源模型,將對包括OpenAI在內(nèi)的大模型公司形成強(qiáng)力競爭。
對于meta推出最新開源大模型,業(yè)界對開源大模型看法不一。百度CEO李彥宏曾公開表示,開源模型會越來越落后。他認(rèn)為,大家以前用開源覺得開源便宜,其實(shí)在大模型場景下,開源是最貴的。所以開源模型會越來越落后。
而360集團(tuán)的創(chuàng)始人周鴻祎卻表達(dá)了不同看法。周鴻祎表示,自己一直相信開源的力量,至于說網(wǎng)上有些名人胡說八道,你們別被忽悠了。他說開源不如閉源好?連說這話的公司自己都是借助了開源的力量才成長到今天。周鴻祎認(rèn)為,開源是科技發(fā)展的重要推動力。沒有開源就沒有Linux,而沒有Linux就沒有今天的互聯(lián)網(wǎng)。他鼓勵企業(yè)和開發(fā)者們充分利用開源資源,共同推動科技進(jìn)步。
從meta推出最新開源大模型回看AIGC行業(yè)發(fā)展情況:
——AI大模型是一種新的智能計(jì)算范式
AIGC全稱為AI-Geneated Content,指基于大型預(yù)訓(xùn)練模型、生成對抗網(wǎng)絡(luò)GAN等人工智能技術(shù),通過已有數(shù)據(jù)尋找規(guī)律,并通過適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù)。
超大規(guī)模智能模型,簡稱大模型,是近年興起的一種新的人工智能計(jì)算范式。和傳統(tǒng)AI模型相比,大模型的訓(xùn)練使用了更多的數(shù)據(jù),具有更好的泛化性,可以應(yīng)用到更廣泛的下游任務(wù)中。按照應(yīng)用場景劃分,AI大模型主要包括語言大模型、視覺大模型和多模態(tài)大模型等。業(yè)界典型的自然語言大模型有GPT-3、源、悟道和文心等。視覺大模型也已廣泛應(yīng)用于自動駕駛、智能安防、醫(yī)學(xué)影像等領(lǐng)域?;诙嗄B(tài)大模型的以文生圖技術(shù)也迅速發(fā)展,AI內(nèi)容生成(AI Generated Content,AIGC)已成為下一個(gè)AI發(fā)展的重點(diǎn)領(lǐng)域。
——預(yù)訓(xùn)練大模型成為人工智能領(lǐng)導(dǎo)者的競爭焦點(diǎn)
預(yù)訓(xùn)練大模型是人工智能產(chǎn)業(yè)發(fā)展的必然選擇,基于海量行業(yè)數(shù)據(jù)和知識,通過強(qiáng)大算力集群,預(yù)先訓(xùn)練基礎(chǔ)模型,并結(jié)合應(yīng)用場景的數(shù)據(jù)和各類需求,通過預(yù)訓(xùn)練大模型+任務(wù)微調(diào)的方式,進(jìn)行工業(yè)化的高效率開發(fā)。開發(fā)者利用預(yù)訓(xùn)練大模型,只需要少量數(shù)據(jù),就可以快速開發(fā)出精度更高、泛化能力更強(qiáng)的行業(yè)模型。預(yù)訓(xùn)練大模型可以提升人工智能項(xiàng)目開發(fā)效率,降低研發(fā)成本,縮短研發(fā)時(shí)間,解決人工智能項(xiàng)目碎片化的問題。
根據(jù)Omdia的數(shù)據(jù),中國開發(fā)者對基于昇思MindSpore打造的盤古NLP大模型最感興趣。首先,盤古NLP大模型在技術(shù)上處于領(lǐng)先地位,千億參數(shù)模型,學(xué)習(xí)了40TB的中文文本數(shù)據(jù),在中文領(lǐng)域有天生優(yōu)勢;其次,盤古NLP大模型可覆蓋多個(gè)場景下語言處理的任務(wù)和需求,泛化能力強(qiáng),在知識問答、知識檢索、知識推理等文本生成領(lǐng)域有廣泛應(yīng)用前景;另外,盤古NLP大模型對開發(fā)者友好,可以讓開發(fā)者能用拖拉拽的方式使用大模型,開發(fā)和生產(chǎn)成本低。這也從另外一個(gè)角度驗(yàn)證了盤古大模型的開放性,開發(fā)者可以跨平臺快速調(diào)用盤古大模型,與其他工具和應(yīng)用結(jié)合使用。
——AIGC行業(yè)主要企業(yè)關(guān)鍵技術(shù)成果(大模型)及競爭力評價(jià)
中國AIGC行業(yè)的頭部代表性企業(yè)中,目前互聯(lián)網(wǎng)大廠的業(yè)務(wù)布局最廣,主要分布在一線城市和新一線城市,且紛紛在各賽道進(jìn)行宏觀戰(zhàn)略布局。但其他初創(chuàng)企業(yè)也有自身的優(yōu)勢,在細(xì)分賽道也有一番成績。目前國內(nèi)已經(jīng)出現(xiàn)了多家從事大模型開發(fā)及延展應(yīng)用的公司,目前尚未普遍形成對外開放的生態(tài),需要進(jìn)一步關(guān)注相關(guān)機(jī)構(gòu)的后續(xù)動態(tài)。
產(chǎn)業(yè)研究院分析認(rèn)為,2023-2025年是我國AIGC產(chǎn)業(yè)市場規(guī)模增長的第一階段,增長率維持在25%左右,2025年市場規(guī)模達(dá)到約260億人民幣。2025年開始,由于行業(yè)生態(tài)完善(特別是底層大模型完成對外開放),應(yīng)用層蓬勃將帶動產(chǎn)業(yè)快速增長,年復(fù)合增長率將超過70%。預(yù)計(jì)2027年我國AIGC產(chǎn)業(yè)規(guī)模超600億人民幣,2028年開始,AIGC產(chǎn)業(yè)將延展出完整產(chǎn)業(yè)鏈,并在商業(yè)化場景上持續(xù)拓寬加深,深入變革行業(yè)。2028年起,我國AIGC產(chǎn)業(yè)規(guī)模將持續(xù)保高速增長,2030年市場規(guī)模超萬億。
經(jīng)濟(jì)學(xué)人APP資訊組
看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。