国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

藍(lán)海情報(bào)網(wǎng)

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

藍(lán)海情報(bào)網(wǎng) 548

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

瞻觀前沿

6月5日,《自然》發(fā)表的一篇論文報(bào)道了一個(gè)meta人工智能(AI)模型的底層技術(shù)。該模型能翻譯200種不同語(yǔ)言,增加了機(jī)器翻譯的語(yǔ)言數(shù)量。神經(jīng)機(jī)器翻譯模型利用人工神經(jīng)網(wǎng)絡(luò)翻譯各種語(yǔ)言。這些模型通常需要大量可在線獲取的數(shù)據(jù)加以訓(xùn)練,但并非所有語(yǔ)言數(shù)據(jù)都是公開(kāi)、低成本或是普遍可及的,這類語(yǔ)言被稱為低資源語(yǔ)言。一味地增加模型翻譯語(yǔ)言數(shù)量,可能會(huì)影響模型的翻譯質(zhì)量。

此次,meta的法國(guó)研究團(tuán)隊(duì)和不落下任何語(yǔ)言(NLLB)團(tuán)隊(duì)開(kāi)發(fā)了一種跨語(yǔ)言技術(shù),能讓神經(jīng)機(jī)器翻譯模型學(xué)習(xí)如何利用翻譯高資源語(yǔ)言的預(yù)存能力,實(shí)現(xiàn)對(duì)低資源語(yǔ)言的翻譯。研究團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)在線多語(yǔ)言翻譯工具,名為NLLB-200。該工具能容納200種語(yǔ)言,其低資源語(yǔ)言數(shù)量是高資源語(yǔ)言數(shù)量的3倍,翻譯表現(xiàn)則比當(dāng)今已有系統(tǒng)高44%。

研究團(tuán)隊(duì)指出,這個(gè)工具可以幫助很少被翻譯的那些語(yǔ)言的使用者,讓他們也能用上互聯(lián)網(wǎng)和其他技術(shù)。此外,教育是一個(gè)非常重要的應(yīng)用,因?yàn)檫@個(gè)模型可以幫助低資源語(yǔ)言使用者獲取更多圖書(shū)和研究文章。但團(tuán)隊(duì)也表示,目前誤譯的情況仍有可能出現(xiàn)。

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

圖片來(lái)源:攝圖網(wǎng)

技術(shù)價(jià)值觀察

人工智能產(chǎn)業(yè)鏈上游為硬件設(shè)備和數(shù)據(jù)設(shè)備,其中包括芯片、傳感器、大數(shù)據(jù)、云計(jì)算服務(wù)等,為人工智能提供數(shù)據(jù)服務(wù)和算力支持;中游是人工智能產(chǎn)業(yè)的技術(shù)核心,包括通用技術(shù)、算法模型、開(kāi)發(fā)平臺(tái)三個(gè)方面,涵蓋了機(jī)器感知、自然語(yǔ)言理解、機(jī)器學(xué)習(xí)、圖譜、基礎(chǔ)開(kāi)源框架等核心技術(shù);下游是人工智能的應(yīng)用產(chǎn)品和場(chǎng)景,涉及交通、醫(yī)療、安防、金融、家居、制造等多個(gè)領(lǐng)域。

meta研究團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)在線多語(yǔ)言翻譯工具,該AI工具能容納200種語(yǔ)言,可以幫助很少被翻譯的那些語(yǔ)言的使用者。因此,從人工智能產(chǎn)業(yè)鏈上看,該技術(shù)處于產(chǎn)業(yè)鏈的下游應(yīng)用層環(huán)節(jié)。

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

宏觀市場(chǎng)觀察

——AI大模型是一種新的智能計(jì)算范式

超大規(guī)模智能模型,簡(jiǎn)稱大模型,是近年興起的一種新的人工智能計(jì)算范式。和傳統(tǒng)AI模型相比,大模型的訓(xùn)練使用了更多的數(shù)據(jù),具有更好的泛化性,可以應(yīng)用到更廣泛的下游任務(wù)中。按照應(yīng)用場(chǎng)景劃分,AI大模型主要包括語(yǔ)言大模型、視覺(jué)大模型和多模態(tài)大模型等。業(yè)界典型的自然語(yǔ)言大模型有GPT-3、源、悟道和文心等。視覺(jué)大模型也已廣泛應(yīng)用于自動(dòng)駕駛、智能安防、醫(yī)學(xué)影像等領(lǐng)域?;诙嗄B(tài)大模型的以文生圖技術(shù)也迅速發(fā)展,AI內(nèi)容生成(AI Generated Content,AIGC)已成為下一個(gè)AI發(fā)展的重點(diǎn)領(lǐng)域。

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

——生成式AI行業(yè)技術(shù)圖譜

生成式AI(GenAI)是計(jì)算機(jī)科學(xué)的一個(gè)分支,涉及無(wú)監(jiān)督和半監(jiān)督算法,使計(jì)算機(jī)能夠使用之前創(chuàng)建的內(nèi)容(如文本、音頻、視頻、圖像和代碼)來(lái)創(chuàng)建新內(nèi)容,以響應(yīng)簡(jiǎn)短的提示問(wèn)題。AI大模型為生成式AI提供了技術(shù)基礎(chǔ)和能力,而生成式AI則展示了大模型在實(shí)際應(yīng)用中的潛在價(jià)值。

生成式AI進(jìn)入探索爆發(fā)期,某些細(xì)分技術(shù)經(jīng)過(guò)爆發(fā)開(kāi)始走向落地,某些細(xì)分技術(shù)還處于培育期有待挖掘潛力。生成式AI技術(shù)圖譜主要評(píng)估了當(dāng)前市場(chǎng)上技術(shù)的成熟度與發(fā)展?jié)摿?。從下到上,代表?dāng)前采用度越高;從左到右的3條曲線,代表當(dāng)前對(duì)于整體市場(chǎng)規(guī)模的影響。一定程度上,左側(cè)曲線當(dāng)前的滲透率較高,右側(cè)的曲線未來(lái)的增長(zhǎng)潛力更高。

技術(shù)圖譜展示了三種類型的技術(shù),其中變革性技術(shù)將徹底重塑市場(chǎng)和投資戰(zhàn)略,可能創(chuàng)造新的業(yè)務(wù)和市場(chǎng)機(jī)會(huì),并為企業(yè)和消費(fèi)者市場(chǎng)帶來(lái)新能力。遞增性技術(shù)在現(xiàn)有技術(shù)的基礎(chǔ)上進(jìn)行了重大改進(jìn),以提供更好的業(yè)務(wù)結(jié)果。機(jī)會(huì)性技術(shù)將根據(jù)具體的使用情況而發(fā)展,其改進(jìn)現(xiàn)有技術(shù)/流程的能力尚未確定或有限。

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

——大模型的應(yīng)用已經(jīng)不局限于NLP(自然語(yǔ)言處理) 領(lǐng)域

目前大模型的應(yīng)用已經(jīng)不局限于NLP(自然語(yǔ)言處理)領(lǐng)域,包括圖片、語(yǔ)音、視頻、代碼等多種模態(tài)的應(yīng)用開(kāi)始涌現(xiàn),而大模型、生成算法與多模態(tài)等底層技術(shù)的突破成為了生成式AI的質(zhì)變的關(guān)鍵。一方面,目前大模型可以廣泛適用于各類下游任務(wù),當(dāng)前已經(jīng)成為了生成式AI的底層框架。許多跨領(lǐng)域的AI應(yīng)用均是構(gòu)建于大模型之上,能夠解決多任務(wù)、多場(chǎng)景、多功能需求,支撐各種模態(tài)的生成;另一方面,包括生成對(duì)抗網(wǎng)絡(luò)(GAN)、變分自編碼器(VAE)、擴(kuò)散模型(DiffusionModel)、神經(jīng)輻射場(chǎng)(Nerf)等快速涌現(xiàn)的生成算法,以大模型為基礎(chǔ),能夠創(chuàng)造出文字、圖片、語(yǔ)音、視頻、代碼等各種模態(tài)的內(nèi)容,而基于此之上的多模態(tài)應(yīng)用開(kāi)始涌現(xiàn)。此外,超級(jí)深度學(xué)習(xí)近年來(lái)的快速發(fā)展帶來(lái)了深度神經(jīng)網(wǎng)絡(luò)技術(shù)在大模型和多模態(tài)兩個(gè)方向上的不斷突破,并為AIGC技術(shù)能力的升級(jí)提供了強(qiáng)力的支撐和全新的可能性。

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

——全球生成式AI行業(yè)競(jìng)爭(zhēng)格局

目前,在生成式AI這條細(xì)分賽道,全球已經(jīng)誕生了13家獨(dú)角獸公司(估值達(dá)到10億美元以上),其中Open AI的估值及融資額排名第一,其估值將達(dá)到800億美元。2023年以來(lái)新增的5家AI獨(dú)角獸中,包括Cohere和Runway兩家新晉生成式AI獨(dú)角獸。這13家生成式AI公司成為獨(dú)角獸的平均時(shí)間僅為3.6年,過(guò)去企業(yè)成為獨(dú)角獸的平時(shí)時(shí)間需要7年,從時(shí)間上來(lái)說(shuō)幾乎縮短了一半。

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

——2023年中國(guó)生成式AI市場(chǎng)規(guī)模約為14.4萬(wàn)億元

2023年以來(lái),由ChatGPT掀起的人工智能熱潮席卷全球,帶動(dòng)AI產(chǎn)業(yè)取得了空前發(fā)展。其中,生成式AI(也稱AIGC)這一分支備受投資者和科技巨頭青睞,各類AIGC大模型紛紛面世,收獲了數(shù)億級(jí)以上的用戶量,其影響力、應(yīng)用范圍和迭代速度尤為令人矚目。因此,2023年被業(yè)界內(nèi)外譽(yù)為生成式AI元年。

據(jù)工信部測(cè)算數(shù)據(jù),2023年我國(guó)生成式AI的市場(chǎng)規(guī)模約為14.4萬(wàn)億元;同時(shí),預(yù)計(jì)到2035年將突破30萬(wàn)億元,在全球總市場(chǎng)規(guī)模中占比超過(guò)35%,成為全球AI產(chǎn)業(yè)鏈的重要一環(huán)。

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

——中國(guó)10億參數(shù)規(guī)模以上大模型數(shù)量已超100個(gè)

生成式人工智能的快速發(fā)展對(duì)算力提出了更高、更迫切的需求,全國(guó)一體化算力體系建設(shè)的必要性愈益突出。截至2024年3月,中國(guó)10億參數(shù)規(guī)模以上大模型數(shù)量已超100個(gè),行業(yè)大模型深度賦能電子信息、醫(yī)療、交通等領(lǐng)域,形成上百種應(yīng)用模式,賦能千行百業(yè)。

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

——全球生成式AI行業(yè)市場(chǎng)規(guī)模及預(yù)測(cè)

隨著ChatGPT的火爆出圈,生成式AI成為各行各業(yè)關(guān)注和熱議的話題。全球科技巨頭和AI廠商紛紛下場(chǎng),唯恐錯(cuò)過(guò)此番科技盛宴。行業(yè)翹楚和媒體將生成式AI浪潮類比昔日的移動(dòng)互聯(lián)網(wǎng)機(jī)遇,認(rèn)為它將對(duì)全球經(jīng)濟(jì)和各個(gè)行業(yè)帶來(lái)深遠(yuǎn)影響,企業(yè)也將迎來(lái)重大變革機(jī)遇,同時(shí),根據(jù)Bloomberg Intelligence披露的數(shù)據(jù),2023年全球生成式AI市場(chǎng)整體規(guī)模約為670億美元,預(yù)計(jì)2029年及2032年將分別達(dá)到7280億美元和1.3萬(wàn)億美元,2022-2032年復(fù)合增長(zhǎng)率高達(dá)42%。

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

中國(guó)人工智能技術(shù)賽道熱力圖

翻譯表現(xiàn)提升44!神經(jīng)機(jī)器翻譯模型能翻譯200種語(yǔ)言

根據(jù)產(chǎn)業(yè)熱力圖顯示,與人工智能關(guān)鍵技術(shù)強(qiáng)關(guān)聯(lián)的城市集群主要集中在華南和西北地區(qū),并且以廣東、陜西省為重點(diǎn)發(fā)展區(qū)域,未來(lái)布局人工智能技術(shù)及其他相關(guān)技術(shù)的發(fā)展路徑,極大可能性在于華南、西北地區(qū)優(yōu)先導(dǎo)入,其中可重點(diǎn)關(guān)注廣東省廣州市天河區(qū)、廣東省深圳市福田區(qū)及陜西省西安市雁塔區(qū)所處的人工智能相關(guān)企業(yè),以及該地方對(duì)于人工智能產(chǎn)業(yè)發(fā)展投資環(huán)境、供給市場(chǎng)的潛力空間。

經(jīng)濟(jì)學(xué)人APP資訊組

看完覺(jué)得寫(xiě)得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽:

ad2

推薦內(nèi)容