大模型的百模競(jìng)爭(zhēng)進(jìn)入淘汰賽，是時(shí)候打掃戰(zhàn)場(chǎng)了！

藍(lán)海情報(bào)網(wǎng) 2024-04-28 21:27:22 804

在最近的一次活動(dòng)上，周鴻祎拋出了去年看大模型像原子彈，今年年初再看大模型就跟茶葉蛋似的的論調(diào)，如其所言，開源大模型、大模型超市層出不窮，行業(yè)模型、小參數(shù)模型也開始百花齊放，百度也逐漸把重心轉(zhuǎn)移到了應(yīng)用生態(tài)以及付費(fèi)商業(yè)化工作當(dāng)中。

但是從GPT-3到GPT-4的能力躍升，到GPT-5可能帶來的迅猛發(fā)展來看，水哥以為，大模型通用能力還在以指數(shù)級(jí)別的速度進(jìn)化著，現(xiàn)在打掃戰(zhàn)場(chǎng)恐怕為時(shí)尚早，對(duì)于被圍追堵截的中國(guó)以及中國(guó)企業(yè)而言，更是如此。

與GPT深度捆綁的微軟創(chuàng)始人比爾·蓋茨在年初也發(fā)聲，強(qiáng)調(diào)大模型這款人工智能技術(shù)在未來五年內(nèi)將實(shí)現(xiàn)顯著的變革。

Sam Altman也透露了GPT-5的最新進(jìn)展，很可能已經(jīng)大幅超越了GPT-4的能力范圍，他認(rèn)為，如果 GPT-4 目前解決了人類任務(wù)的 10%，GPT-5 應(yīng)該是 15% 或者 20%。他還用初代 iPhone 和最新 iPhone15的對(duì)比，來形容AI未來所能實(shí)現(xiàn)的進(jìn)步。

從這種走向來看，大模型還在朝著通用人工智能的道路迅速挺進(jìn)。

事實(shí)上，也是人工智能打開的可能性，讓美國(guó)鐵了心對(duì)中國(guó)圍追堵截，拜登政府已經(jīng)提議要求美國(guó)云服務(wù)公司進(jìn)行自查，以確定外國(guó)實(shí)體是否正在訪問美國(guó)數(shù)據(jù)中心以訓(xùn)練人工智能模型，防止中國(guó)利用美國(guó)技術(shù)進(jìn)行人工智能的發(fā)展。

今天的中國(guó)發(fā)展通用人工智能，是勢(shì)在必行的事，宜將剩勇追窮寇，不可沽名學(xué)霸王。在劉慶峰看來，今天，大模型絕不是像茶葉蛋一樣不值錢，通用人工智能的自主可控，既決定了產(chǎn)業(yè)鏈安全，也決定了國(guó)家安全。如果中國(guó)沒有大模型，那么工業(yè)、民生、科研以及各個(gè)專用領(lǐng)域都會(huì)極大地落后于世界。

那么，大模型真的到了打掃戰(zhàn)場(chǎng)的時(shí)候嗎？這個(gè)掀起了全球新一輪風(fēng)險(xiǎn)投資熱潮的產(chǎn)品創(chuàng)新，到底是茶葉蛋，還是原子彈？

中國(guó)第一個(gè)基于國(guó)產(chǎn)算力的大模型，到底能不能打？能夠真正對(duì)標(biāo)美國(guó)最先進(jìn)技術(shù)的大模型，全中國(guó)將來沒有幾個(gè)，訊飛星火一定是其中之一，科大訊飛這種自信的底氣來自于何處？

一、通用人工智能時(shí)代，中國(guó)更需要wintel組合

大模型當(dāng)然不是茶葉蛋，相反它是通用人工智能的曙光，就好像，互聯(lián)網(wǎng)發(fā)展到今天，是一系列科技創(chuàng)新所促成的，互聯(lián)協(xié)議只是打開了一個(gè)技術(shù)的潘多拉魔盒。

互聯(lián)網(wǎng)的發(fā)明最早是為了在科學(xué)和軍事計(jì)算機(jī)之間共享文件，但是今天它在一系列創(chuàng)新技術(shù)的推動(dòng)下，從根本上改變了娛樂、商業(yè)、制造業(yè)和個(gè)人通信。

大模型打開另一個(gè)通用人工智能系列技術(shù)創(chuàng)新的潘多拉盒子，與人類第一次使用蒸汽機(jī)、電燈泡一樣，都是新一輪創(chuàng)新浪潮的開端。

這種可能性，正是美國(guó)不擇手段圍堵中國(guó)的根本動(dòng)機(jī)。

美國(guó)的圍追堵截，也堅(jiān)定了很多中國(guó)企業(yè)家通過自主創(chuàng)新實(shí)現(xiàn)人工智能產(chǎn)業(yè)突圍的決心，已經(jīng)被美國(guó)拉入實(shí)體黑名單的科大訊飛危機(jī)意識(shí)就非常強(qiáng)烈，在科大訊飛創(chuàng)始人劉慶峰看來：當(dāng)前，發(fā)展通用人工智能是我們必須要做的事情，否則工業(yè)、科研、民生等各個(gè)專用領(lǐng)域都會(huì)極大落后于世界，而中國(guó)是世界唯一有望成為智慧涌現(xiàn)第二極的國(guó)家。

在前幾天科大訊飛發(fā)布會(huì)的大模型升級(jí)效果來看，從智能算力底層開始，實(shí)現(xiàn)自主創(chuàng)新的國(guó)產(chǎn)替代也并非沒有可能的。

2023年10月，科大訊飛攜手華為，基于首個(gè)支撐萬(wàn)億參數(shù)大模型訓(xùn)練的萬(wàn)卡國(guó)產(chǎn)算力平臺(tái)飛星一號(hào)，啟動(dòng)了對(duì)標(biāo)GPT-4的更大參數(shù)規(guī)模的大模型訓(xùn)練。

雖然訓(xùn)練時(shí)間還不到一百天，訊飛星火V3.5的邏輯推理、語(yǔ)言理解、文本生成、數(shù)學(xué)答題、多模態(tài)等核心能力已經(jīng)實(shí)現(xiàn)了顯著提升，接近了GPT-4水平，其中語(yǔ)言理解、數(shù)學(xué)能力超過GPT-4 Turbo，代碼達(dá)到GPT-4 Turbo 96%，多模態(tài)理解達(dá)到GPT-4V 91%。

互聯(lián)網(wǎng)的發(fā)展出現(xiàn)了軟件與硬件的廠商產(chǎn)業(yè)聯(lián)盟wintel 組合，算力的進(jìn)步，與軟件是相輔相成的，Wintel聯(lián)盟依靠英特爾摩爾定律的算力升級(jí)和微軟Windows系統(tǒng)的升級(jí)換代，雙方彼此支撐推動(dòng)了個(gè)人電腦長(zhǎng)達(dá)二十多年的迅速進(jìn)化。

今天華為、訊飛的算力與大模型組合，作為中國(guó)大模型產(chǎn)業(yè)的產(chǎn)業(yè)聯(lián)盟，一方面為中國(guó)解決算力自主問題提供了產(chǎn)業(yè)落地空間，另一方面，也為軟硬一體化的中國(guó)人工智能發(fā)展開辟了道路。

除了自主安全這項(xiàng)其他國(guó)產(chǎn)大模型沒有的優(yōu)勢(shì)，事實(shí)上，在語(yǔ)音交互這項(xiàng)通用能力上，科大訊飛已經(jīng)實(shí)現(xiàn)了對(duì)GPT-4的反超。據(jù)劉慶峰介紹，國(guó)內(nèi)首個(gè)語(yǔ)音大模型星火語(yǔ)音大模型，中文、英語(yǔ)、法語(yǔ)、俄語(yǔ)等首批37個(gè)主流語(yǔ)種的語(yǔ)音識(shí)別效果超過OpenAI Whisper V3。

語(yǔ)音大模型的優(yōu)勢(shì)，為科大訊飛在未來打開機(jī)器人產(chǎn)業(yè)的未來空間，也讓科大訊飛在語(yǔ)音賽道二十多年的能力優(yōu)勢(shì)，在大模型時(shí)代，能夠進(jìn)一步放大。

不過，當(dāng)前訊飛星火V3.5在小樣本快速訓(xùn)練、多模態(tài)深度學(xué)習(xí)訓(xùn)練、超復(fù)雜深度理解等領(lǐng)域距離GPT-4的最好水平還有差距，劉慶峰認(rèn)為，我們要清醒理智看到差距，一定要在通用大模型的底層能力上持續(xù)對(duì)標(biāo)國(guó)際最先進(jìn)水平，從算法研究包括更小的算力上做出相對(duì)更優(yōu)效果。

不論國(guó)產(chǎn)與美國(guó)的差距，還是大模型今天的水平與通用人工智能的差距，都決定了這依然是一場(chǎng)長(zhǎng)跑，只有看到遠(yuǎn)景并堅(jiān)持下去，才有可能贏得最終的勝利。

二、落地大考：跨越技術(shù)與市場(chǎng)的創(chuàng)新鴻溝

大模型打開的通用人工智能道路還有很遠(yuǎn)的路要走，眾所周知，人們往往在短期高估技術(shù)的發(fā)展，而在長(zhǎng)期低估了技術(shù)的發(fā)展，今天大模型也差不多，短期淘汰賽會(huì)非常慘烈，站住腳就已經(jīng)很難。

根據(jù)技術(shù)的擴(kuò)散周期，大模型創(chuàng)業(yè)競(jìng)賽正進(jìn)入沖刺淘汰賽段，大模型逐漸形成專門的早期市場(chǎng)，能否贏得早期市場(chǎng)，站穩(wěn)腳跟，獲取下一步的入場(chǎng)券，成為每個(gè)公司必須面對(duì)的首要問題。

在這個(gè)階段，只有同時(shí)擁有遠(yuǎn)大愿景、與豐富產(chǎn)業(yè)數(shù)據(jù)與經(jīng)驗(yàn)的公司，才有進(jìn)一步跑出的希望。

但是這些恰恰是科大訊飛的優(yōu)勢(shì)所在，教育、醫(yī)療、消費(fèi)者、智慧城市、運(yùn)營(yíng)商、汽車等多個(gè)G/B領(lǐng)域是科大訊飛根據(jù)地業(yè)務(wù)，二十多年積累的人工智能行業(yè)認(rèn)知、技術(shù)以及數(shù)據(jù)，都是今天其大模型深度差異化的能力來源。

為什么訊飛大模型能快速進(jìn)行大規(guī)模產(chǎn)業(yè)落地？舉一個(gè)例子：通用技術(shù)的比拼，如同射箭比賽，比拼行業(yè)大模型，除了技術(shù)能力之外，還要拼對(duì)行業(yè)的畫靶子能力。以教育為例，有關(guān)小學(xué)生英語(yǔ)學(xué)習(xí)的大模型，首先需要了解小學(xué)英語(yǔ)的學(xué)習(xí)目標(biāo)，還要定義小學(xué)生英語(yǔ)學(xué)習(xí)的范圍，不能超綱，并要找到適合孩子學(xué)習(xí)習(xí)慣和學(xué)習(xí)階段的方法——這些標(biāo)準(zhǔn)，都要先定義，這就是畫靶子的能力。

每個(gè)行業(yè)都有著長(zhǎng)鏈條的價(jià)值鏈，復(fù)雜的上下游以及復(fù)雜的專業(yè)領(lǐng)域數(shù)據(jù)與知識(shí)，很多廠商沒有做過行業(yè)，是不具備畫靶子的能力的，沒有辦法深入行業(yè)的本質(zhì)。但是訊飛在多個(gè)領(lǐng)域都深耕多年，不僅能畫靶子，也有專業(yè)的團(tuán)隊(duì)和數(shù)據(jù)積累——這樣才能做出行業(yè)真正適用的大模型。

從人才培養(yǎng)角度來說，行業(yè)+技術(shù)的復(fù)合人才很短缺，而訊飛做了人工智能行業(yè)25年，能穿透行業(yè)的人有很多，頭部、腰部力量很強(qiáng)。

在技術(shù)頂天、應(yīng)用落地的戰(zhàn)略下，科大訊飛這么多年在行業(yè)應(yīng)用上，已經(jīng)形成了成熟的GBC聯(lián)動(dòng)模式。

把大模型技術(shù)的創(chuàng)造力，轉(zhuǎn)化為促進(jìn)產(chǎn)業(yè)增長(zhǎng)的新質(zhì)生產(chǎn)力，正在成為千行百業(yè)的共同選擇?；谌珖?guó)產(chǎn)化算力打造的訊飛星火V3.5支持異構(gòu)算力調(diào)度，可實(shí)現(xiàn)行業(yè)大模型訓(xùn)練提效90%，支持23個(gè)企業(yè)應(yīng)用場(chǎng)景的敏捷優(yōu)化。星火大模型還與奇瑞汽車、太平洋保險(xiǎn)、交通銀行、國(guó)家能源集團(tuán)等企業(yè)，打造千行百業(yè)的大模型應(yīng)用標(biāo)桿。

隨著數(shù)學(xué)和推理能力的升級(jí)，多模態(tài)能力逐步進(jìn)階，通用大模型能力的升級(jí)，決定了落地生產(chǎn)力的提升級(jí)別，放大了科大訊飛GBC聯(lián)動(dòng)的市場(chǎng)優(yōu)勢(shì)。

多年推動(dòng)行業(yè)AI化的努力，為科大訊飛大模型商業(yè)模式找到了最好的落地方向，為科大訊飛切取更大份額的GBC端的應(yīng)用和終端硬件產(chǎn)品市場(chǎng)，打開了空間。

贏得早期市場(chǎng)，也意味著贏得了進(jìn)入下一輪競(jìng)賽的入場(chǎng)券。

三、百模大戰(zhàn)的泡沫中，會(huì)有偉大的公司從中崛起

通用人工智能這條道路，其實(shí)已經(jīng)經(jīng)歷了多次熱潮與漫長(zhǎng)的冬季。

大模型的出現(xiàn)，讓通用人工智能看到了曙光，也讓堅(jiān)持通用人工智能路線的公司看到了曙光。

人工智能的來路比大模型更久遠(yuǎn)，其未來也更長(zhǎng)遠(yuǎn)，只有一直深耕這條賽道的人才、公司，才有可能抓住偶然出現(xiàn)的技術(shù)創(chuàng)新以及時(shí)代機(jī)遇。

今天，決定輸贏的不是公司體量的大小，這就是為什么OpenAI能夠率先跑出，它當(dāng)然也需要微軟的資金加持，但是這不是簡(jiǎn)單的資金算力問題，更重要的團(tuán)隊(duì)多年的積累跟長(zhǎng)期的技術(shù)研發(fā)，帶來的技術(shù)人類反饋機(jī)制的技術(shù)新突破，無(wú)論大廠、小廠的努力，在這場(chǎng)技術(shù)長(zhǎng)跑當(dāng)中，每一個(gè)關(guān)鍵技術(shù)突破，都會(huì)壯大其繼續(xù)前行的技術(shù)底座，憑借這些積累，OpenAI、谷歌、科大訊飛這些持續(xù)深耕技術(shù)企業(yè)也都成為了大模型競(jìng)賽的關(guān)鍵角色。

在多次迭代、2023年5月正式發(fā)布的認(rèn)知大模型之后，劉慶峰就很驕傲地說：這次大模型攻關(guān)，90后帶隊(duì)，項(xiàng)目中也大都是90后。老中青傳幫帶的扎實(shí)人才梯隊(duì)與技術(shù)的厚積薄發(fā)相輔相成。

在劉慶峰看來，認(rèn)知大模型本質(zhì)上是一次對(duì)話式的通用智慧的涌現(xiàn)，語(yǔ)音和語(yǔ)言的核心能力是基礎(chǔ)條件，科大訊飛是中國(guó)該領(lǐng)域的國(guó)家隊(duì)。

在強(qiáng)大的人才團(tuán)隊(duì)努力下，科大訊飛在認(rèn)知智能領(lǐng)域早已取得一系列全球領(lǐng)先成果。2019年，在斯坦福大學(xué)發(fā)起的國(guó)際著名的SQuAD機(jī)器閱讀理解比賽中，在英文閱讀理解中首次超過了人類平均水平。2022年在艾倫研究院組織的OpenBookQA科學(xué)常識(shí)推理比賽中，單模型首次超過了人類平均水平。

科大訊飛在過去24年一直專注在人工智能，擁有關(guān)鍵算法創(chuàng)新的兩個(gè)核心策源地——認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室、語(yǔ)音及語(yǔ)言信息處理國(guó)家工程研究中心，有充分的技術(shù)積累。這次星火大模型的每一行代碼、每一個(gè)算法模塊都是自己做的，而不是拿第三方的開源平臺(tái)訓(xùn)練的。

科大訊飛通過算力端與華為合作，率先解決了算力國(guó)產(chǎn)化的問題，同時(shí)在人工智能算法方面二十多年的技術(shù)人才積累，以及硬件終端多年的市場(chǎng)積累帶來的從教育、醫(yī)療到政務(wù)優(yōu)質(zhì)且獨(dú)特的細(xì)分行業(yè)市場(chǎng)數(shù)據(jù)，讓它在互聯(lián)網(wǎng)巨頭的刺刀叢中，依然游刃有余。

更重要的是通用人工智能的信仰，對(duì)大模型通用能力持續(xù)迭代的堅(jiān)持，很可能會(huì)讓這家AI公司走得更遠(yuǎn)。

隨著大模型通用能力的指數(shù)級(jí)強(qiáng)化，機(jī)器人、具身智能以及在千行百業(yè)進(jìn)行深度應(yīng)用的市場(chǎng)空間，都已經(jīng)逐漸打開。

今天的大模型特別是人工智能，都還處于早期創(chuàng)業(yè)創(chuàng)新階段，對(duì)此，劉慶峰也強(qiáng)調(diào)，今天的通用大模型并不一定就代表人工智能的全部未來，還有很多創(chuàng)新要做，比如跟腦科學(xué)的互動(dòng)、跟對(duì)抗網(wǎng)絡(luò)的深度連接，我們要做的工作非常之多，需要一整個(gè)創(chuàng)新生態(tài)。但是，我們一定要有勇氣和信心在底層的大模型上持續(xù)對(duì)標(biāo)。

大模型魔力的全部發(fā)揮，還有待需要更多的技術(shù)突破，比如更強(qiáng)大的通用智能算法，更多的感知算法，譬如具身智能，這需要更多具有通用人工智能信仰的、以及市場(chǎng)嗅覺的人才以及公司去攻關(guān)突破。

重復(fù)造輪的百模大戰(zhàn)，當(dāng)中肯定有泡沫的成分，但是，如果把時(shí)間拉長(zhǎng)，這種泡沫式的繁榮就像互聯(lián)網(wǎng)網(wǎng)頁(yè)時(shí)代的千禧年創(chuàng)業(yè)一樣，是必經(jīng)之路，但是泡沫當(dāng)中，一定會(huì)有偉大的公司從中崛起，中國(guó)絕對(duì)不能缺席。

看完覺得寫得好的，不防打賞一元，以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽：模型人工智能通用隨筆