全球最強(qiáng)開源大模型易主！Mate推出最新開源大模型Llama 3，有望趕超OpenAI

藍(lán)海情報(bào)網(wǎng) 2024-04-29 09:06:11 1003

圖片來源：攝圖網(wǎng)

隨著人工智能技術(shù)的深入發(fā)展，大模型成為各企業(yè)競相追逐的熱門賽道。大模型在語音識別、自然語言處理、圖像識別等領(lǐng)域展現(xiàn)出巨大潛力，各大科技巨頭紛紛加大投入，競相研發(fā)更強(qiáng)大的大模型，以提升人工智能系統(tǒng)的性能和智能化水平。

當(dāng)?shù)貢r(shí)間4月18日，meta在官網(wǎng)上宣布公布了旗下最新開源大模型Llama 3。目前，Llama 3已經(jīng)開放了80億(8B)和700億(70B)兩個(gè)小參數(shù)版本。根據(jù)meta官方介紹，Llama 3在兩個(gè)定制的24K GPU集群上基于超過15T的數(shù)據(jù)進(jìn)行了訓(xùn)練——這比Llama 2使用的數(shù)據(jù)集大7倍，多4倍的代碼，并且Llama 3支持8K上下文長度，是Llama 2容量的兩倍。

未來，meta將推出Llama 3的更大參數(shù)版本，其將擁有超過4000億參數(shù)。業(yè)界指出，這是目前為止最先進(jìn)的開源模型，將對包括OpenAI在內(nèi)的大模型公司形成強(qiáng)力競爭。

對于meta推出最新開源大模型，業(yè)界對開源大模型看法不一。百度CEO李彥宏曾公開表示，開源模型會越來越落后。他認(rèn)為，大家以前用開源覺得開源便宜，其實(shí)在大模型場景下，開源是最貴的。所以開源模型會越來越落后。

而360集團(tuán)的創(chuàng)始人周鴻祎卻表達(dá)了不同看法。周鴻祎表示，自己一直相信開源的力量，至于說網(wǎng)上有些名人胡說八道，你們別被忽悠了。他說開源不如閉源好？連說這話的公司自己都是借助了開源的力量才成長到今天。周鴻祎認(rèn)為，開源是科技發(fā)展的重要推動力。沒有開源就沒有Linux，而沒有Linux就沒有今天的互聯(lián)網(wǎng)。他鼓勵企業(yè)和開發(fā)者們充分利用開源資源，共同推動科技進(jìn)步。

從meta推出最新開源大模型回看AIGC行業(yè)發(fā)展情況：

——AI大模型是一種新的智能計(jì)算范式

AIGC全稱為AI-Geneated Content,指基于大型預(yù)訓(xùn)練模型、生成對抗網(wǎng)絡(luò)GAN等人工智能技術(shù)，通過已有數(shù)據(jù)尋找規(guī)律，并通過適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù)。

超大規(guī)模智能模型，簡稱大模型，是近年興起的一種新的人工智能計(jì)算范式。和傳統(tǒng)AI模型相比，大模型的訓(xùn)練使用了更多的數(shù)據(jù)，具有更好的泛化性，可以應(yīng)用到更廣泛的下游任務(wù)中。按照應(yīng)用場景劃分，AI大模型主要包括語言大模型、視覺大模型和多模態(tài)大模型等。業(yè)界典型的自然語言大模型有GPT-3、源、悟道和文心等。視覺大模型也已廣泛應(yīng)用于自動駕駛、智能安防、醫(yī)學(xué)影像等領(lǐng)域?；诙嗄B(tài)大模型的以文生圖技術(shù)也迅速發(fā)展，AI內(nèi)容生成(AI Generated Content，AIGC)已成為下一個(gè)AI發(fā)展的重點(diǎn)領(lǐng)域。

全球最強(qiáng)開源大模型易主！Mate推出最新開源大模型Llama 3，有望趕超OpenAI

——預(yù)訓(xùn)練大模型成為人工智能領(lǐng)導(dǎo)者的競爭焦點(diǎn)

預(yù)訓(xùn)練大模型是人工智能產(chǎn)業(yè)發(fā)展的必然選擇，基于海量行業(yè)數(shù)據(jù)和知識，通過強(qiáng)大算力集群，預(yù)先訓(xùn)練基礎(chǔ)模型，并結(jié)合應(yīng)用場景的數(shù)據(jù)和各類需求，通過預(yù)訓(xùn)練大模型+任務(wù)微調(diào)的方式，進(jìn)行工業(yè)化的高效率開發(fā)。開發(fā)者利用預(yù)訓(xùn)練大模型，只需要少量數(shù)據(jù)，就可以快速開發(fā)出精度更高、泛化能力更強(qiáng)的行業(yè)模型。預(yù)訓(xùn)練大模型可以提升人工智能項(xiàng)目開發(fā)效率，降低研發(fā)成本，縮短研發(fā)時(shí)間，解決人工智能項(xiàng)目碎片化的問題。

根據(jù)Omdia的數(shù)據(jù)，中國開發(fā)者對基于昇思MindSpore打造的盤古NLP大模型最感興趣。首先，盤古NLP大模型在技術(shù)上處于領(lǐng)先地位，千億參數(shù)模型，學(xué)習(xí)了40TB的中文文本數(shù)據(jù)，在中文領(lǐng)域有天生優(yōu)勢;其次，盤古NLP大模型可覆蓋多個(gè)場景下語言處理的任務(wù)和需求，泛化能力強(qiáng)，在知識問答、知識檢索、知識推理等文本生成領(lǐng)域有廣泛應(yīng)用前景;另外，盤古NLP大模型對開發(fā)者友好，可以讓開發(fā)者能用拖拉拽的方式使用大模型，開發(fā)和生產(chǎn)成本低。這也從另外一個(gè)角度驗(yàn)證了盤古大模型的開放性，開發(fā)者可以跨平臺快速調(diào)用盤古大模型，與其他工具和應(yīng)用結(jié)合使用。

全球最強(qiáng)開源大模型易主！Mate推出最新開源大模型Llama 3，有望趕超OpenAI

——AIGC行業(yè)主要企業(yè)關(guān)鍵技術(shù)成果(大模型)及競爭力評價(jià)

中國AIGC行業(yè)的頭部代表性企業(yè)中，目前互聯(lián)網(wǎng)大廠的業(yè)務(wù)布局最廣，主要分布在一線城市和新一線城市，且紛紛在各賽道進(jìn)行宏觀戰(zhàn)略布局。但其他初創(chuàng)企業(yè)也有自身的優(yōu)勢，在細(xì)分賽道也有一番成績。目前國內(nèi)已經(jīng)出現(xiàn)了多家從事大模型開發(fā)及延展應(yīng)用的公司，目前尚未普遍形成對外開放的生態(tài)，需要進(jìn)一步關(guān)注相關(guān)機(jī)構(gòu)的后續(xù)動態(tài)。

全球最強(qiáng)開源大模型易主！Mate推出最新開源大模型Llama 3，有望趕超OpenAI

產(chǎn)業(yè)研究院分析認(rèn)為，2023-2025年是我國AIGC產(chǎn)業(yè)市場規(guī)模增長的第一階段，增長率維持在25%左右，2025年市場規(guī)模達(dá)到約260億人民幣。2025年開始，由于行業(yè)生態(tài)完善(特別是底層大模型完成對外開放)，應(yīng)用層蓬勃將帶動產(chǎn)業(yè)快速增長，年復(fù)合增長率將超過70%。預(yù)計(jì)2027年我國AIGC產(chǎn)業(yè)規(guī)模超600億人民幣，2028年開始，AIGC產(chǎn)業(yè)將延展出完整產(chǎn)業(yè)鏈，并在商業(yè)化場景上持續(xù)拓寬加深，深入變革行業(yè)。2028年起，我國AIGC產(chǎn)業(yè)規(guī)模將持續(xù)保高速增長，2030年市場規(guī)模超萬億。

經(jīng)濟(jì)學(xué)人APP資訊組

看完覺得寫得好的，不防打賞一元，以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽：模型開源盤古隨筆