在最近的一次活動(dòng)上,周鴻祎拋出了去年看大模型像原子彈,今年年初再看大模型就跟茶葉蛋似的的論調(diào),如其所言,開源大模型、大模型超市層出不窮,行業(yè)模型、小參數(shù)模型也開始百花齊放,百度也逐漸把重心轉(zhuǎn)移到了應(yīng)用生態(tài)以及付費(fèi)商業(yè)化工作當(dāng)中。
但是從GPT-3到GPT-4的能力躍升,到GPT-5可能帶來的迅猛發(fā)展來看,水哥以為,大模型通用能力還在以指數(shù)級(jí)別的速度進(jìn)化著,現(xiàn)在打掃戰(zhàn)場(chǎng)恐怕為時(shí)尚早,對(duì)于被圍追堵截的中國(guó)以及中國(guó)企業(yè)而言,更是如此。
與GPT深度捆綁的微軟創(chuàng)始人比爾·蓋茨在年初也發(fā)聲,強(qiáng)調(diào)大模型這款人工智能技術(shù)在未來五年內(nèi)將實(shí)現(xiàn)顯著的變革。
Sam Altman也透露了GPT-5的最新進(jìn)展,很可能已經(jīng)大幅超越了GPT-4的能力范圍,他認(rèn)為,如果 GPT-4 目前解決了人類任務(wù)的 10%,GPT-5 應(yīng)該是 15% 或者 20%。他還用初代 iPhone 和最新 iPhone15的對(duì)比,來形容AI未來所能實(shí)現(xiàn)的進(jìn)步。
從這種走向來看,大模型還在朝著通用人工智能的道路迅速挺進(jìn)。
事實(shí)上,也是人工智能打開的可能性,讓美國(guó)鐵了心對(duì)中國(guó)圍追堵截,拜登政府已經(jīng)提議要求美國(guó)云服務(wù)公司進(jìn)行自查,以確定外國(guó)實(shí)體是否正在訪問美國(guó)數(shù)據(jù)中心以訓(xùn)練人工智能模型,防止中國(guó)利用美國(guó)技術(shù)進(jìn)行人工智能的發(fā)展。
今天的中國(guó)發(fā)展通用人工智能,是勢(shì)在必行的事,宜將剩勇追窮寇,不可沽名學(xué)霸王。在劉慶峰看來,今天,大模型絕不是像茶葉蛋一樣不值錢,通用人工智能的自主可控,既決定了產(chǎn)業(yè)鏈安全,也決定了國(guó)家安全。如果中國(guó)沒有大模型,那么工業(yè)、民生、科研以及各個(gè)專用領(lǐng)域都會(huì)極大地落后于世界。
那么,大模型真的到了打掃戰(zhàn)場(chǎng)的時(shí)候嗎?這個(gè)掀起了全球新一輪風(fēng)險(xiǎn)投資熱潮的產(chǎn)品創(chuàng)新,到底是茶葉蛋,還是原子彈?
中國(guó)第一個(gè)基于國(guó)產(chǎn)算力的大模型,到底能不能打?能夠真正對(duì)標(biāo)美國(guó)最先進(jìn)技術(shù)的大模型,全中國(guó)將來沒有幾個(gè),訊飛星火一定是其中之一,科大訊飛這種自信的底氣來自于何處?
一、通用人工智能時(shí)代,中國(guó)更需要wintel組合大模型當(dāng)然不是茶葉蛋,相反它是通用人工智能的曙光,就好像,互聯(lián)網(wǎng)發(fā)展到今天,是一系列科技創(chuàng)新所促成的,互聯(lián)協(xié)議只是打開了一個(gè)技術(shù)的潘多拉魔盒。
互聯(lián)網(wǎng)的發(fā)明最早是為了在科學(xué)和軍事計(jì)算機(jī)之間共享文件,但是今天它在一系列創(chuàng)新技術(shù)的推動(dòng)下,從根本上改變了娛樂、商業(yè)、制造業(yè)和個(gè)人通信。
大模型打開另一個(gè)通用人工智能系列技術(shù)創(chuàng)新的潘多拉盒子,與人類第一次使用蒸汽機(jī)、電燈泡一樣,都是新一輪創(chuàng)新浪潮的開端。
這種可能性,正是美國(guó)不擇手段圍堵中國(guó)的根本動(dòng)機(jī)。
美國(guó)的圍追堵截,也堅(jiān)定了很多中國(guó)企業(yè)家通過自主創(chuàng)新實(shí)現(xiàn)人工智能產(chǎn)業(yè)突圍的決心,已經(jīng)被美國(guó)拉入實(shí)體黑名單的科大訊飛危機(jī)意識(shí)就非常強(qiáng)烈,在科大訊飛創(chuàng)始人劉慶峰看來:當(dāng)前,發(fā)展通用人工智能是我們必須要做的事情,否則工業(yè)、科研、民生等各個(gè)專用領(lǐng)域都會(huì)極大落后于世界,而中國(guó)是世界唯一有望成為智慧涌現(xiàn)第二極的國(guó)家。
在前幾天科大訊飛發(fā)布會(huì)的大模型升級(jí)效果來看,從智能算力底層開始,實(shí)現(xiàn)自主創(chuàng)新的國(guó)產(chǎn)替代也并非沒有可能的。
2023年10月,科大訊飛攜手華為,基于首個(gè)支撐萬(wàn)億參數(shù)大模型訓(xùn)練的萬(wàn)卡國(guó)產(chǎn)算力平臺(tái)飛星一號(hào),啟動(dòng)了對(duì)標(biāo)GPT-4的更大參數(shù)規(guī)模的大模型訓(xùn)練。
雖然訓(xùn)練時(shí)間還不到一百天,訊飛星火V3.5的邏輯推理、語(yǔ)言理解、文本生成、數(shù)學(xué)答題、多模態(tài)等核心能力已經(jīng)實(shí)現(xiàn)了顯著提升,接近了GPT-4水平,其中語(yǔ)言理解、數(shù)學(xué)能力超過GPT-4 Turbo,代碼達(dá)到GPT-4 Turbo 96%,多模態(tài)理解達(dá)到GPT-4V 91%。
互聯(lián)網(wǎng)的發(fā)展出現(xiàn)了軟件與硬件的廠商產(chǎn)業(yè)聯(lián)盟wintel 組合,算力的進(jìn)步,與軟件是相輔相成的,Wintel聯(lián)盟依靠英特爾摩爾定律的算力升級(jí)和微軟Windows系統(tǒng)的升級(jí)換代,雙方彼此支撐推動(dòng)了個(gè)人電腦長(zhǎng)達(dá)二十多年的迅速進(jìn)化。
今天華為、訊飛的算力與大模型組合,作為中國(guó)大模型產(chǎn)業(yè)的產(chǎn)業(yè)聯(lián)盟,一方面為中國(guó)解決算力自主問題提供了產(chǎn)業(yè)落地空間,另一方面,也為軟硬一體化的中國(guó)人工智能發(fā)展開辟了道路。
除了自主安全這項(xiàng)其他國(guó)產(chǎn)大模型沒有的優(yōu)勢(shì),事實(shí)上,在語(yǔ)音交互這項(xiàng)通用能力上,科大訊飛已經(jīng)實(shí)現(xiàn)了對(duì)GPT-4的反超。據(jù)劉慶峰介紹,國(guó)內(nèi)首個(gè)語(yǔ)音大模型星火語(yǔ)音大模型,中文、英語(yǔ)、法語(yǔ)、俄語(yǔ)等首批37個(gè)主流語(yǔ)種的語(yǔ)音識(shí)別效果超過OpenAI Whisper V3。
語(yǔ)音大模型的優(yōu)勢(shì),為科大訊飛在未來打開機(jī)器人產(chǎn)業(yè)的未來空間,也讓科大訊飛在語(yǔ)音賽道二十多年的能力優(yōu)勢(shì),在大模型時(shí)代,能夠進(jìn)一步放大。
不過,當(dāng)前訊飛星火V3.5在小樣本快速訓(xùn)練、多模態(tài)深度學(xué)習(xí)訓(xùn)練、超復(fù)雜深度理解等領(lǐng)域距離GPT-4的最好水平還有差距,劉慶峰認(rèn)為,我們要清醒理智看到差距,一定要在通用大模型的底層能力上持續(xù)對(duì)標(biāo)國(guó)際最先進(jìn)水平,從算法研究包括更小的算力上做出相對(duì)更優(yōu)效果。
不論國(guó)產(chǎn)與美國(guó)的差距,還是大模型今天的水平與通用人工智能的差距,都決定了這依然是一場(chǎng)長(zhǎng)跑,只有看到遠(yuǎn)景并堅(jiān)持下去,才有可能贏得最終的勝利。
二、落地大考:跨越技術(shù)與市場(chǎng)的創(chuàng)新鴻溝大模型打開的通用人工智能道路還有很遠(yuǎn)的路要走,眾所周知,人們往往在短期高估技術(shù)的發(fā)展,而在長(zhǎng)期低估了技術(shù)的發(fā)展,今天大模型也差不多,短期淘汰賽會(huì)非常慘烈,站住腳就已經(jīng)很難。
根據(jù)技術(shù)的擴(kuò)散周期,大模型創(chuàng)業(yè)競(jìng)賽正進(jìn)入沖刺淘汰賽段,大模型逐漸形成專門的早期市場(chǎng),能否贏得早期市場(chǎng),站穩(wěn)腳跟,獲取下一步的入場(chǎng)券,成為每個(gè)公司必須面對(duì)的首要問題。
在這個(gè)階段,只有同時(shí)擁有遠(yuǎn)大愿景、與豐富產(chǎn)業(yè)數(shù)據(jù)與經(jīng)驗(yàn)的公司,才有進(jìn)一步跑出的希望。
但是這些恰恰是科大訊飛的優(yōu)勢(shì)所在,教育、醫(yī)療、消費(fèi)者、智慧城市、運(yùn)營(yíng)商、汽車等多個(gè)G/B領(lǐng)域是科大訊飛根據(jù)地業(yè)務(wù),二十多年積累的人工智能行業(yè)認(rèn)知、技術(shù)以及數(shù)據(jù),都是今天其大模型深度差異化的能力來源。
為什么訊飛大模型能快速進(jìn)行大規(guī)模產(chǎn)業(yè)落地?舉一個(gè)例子:通用技術(shù)的比拼,如同射箭比賽,比拼行業(yè)大模型,除了技術(shù)能力之外,還要拼對(duì)行業(yè)的畫靶子能力。以教育為例,有關(guān)小學(xué)生英語(yǔ)學(xué)習(xí)的大模型,首先需要了解小學(xué)英語(yǔ)的學(xué)習(xí)目標(biāo),還要定義小學(xué)生英語(yǔ)學(xué)習(xí)的范圍,不能超綱,并要找到適合孩子學(xué)習(xí)習(xí)慣和學(xué)習(xí)階段的方法——這些標(biāo)準(zhǔn),都要先定義,這就是畫靶子的能力。
每個(gè)行業(yè)都有著長(zhǎng)鏈條的價(jià)值鏈,復(fù)雜的上下游以及復(fù)雜的專業(yè)領(lǐng)域數(shù)據(jù)與知識(shí),很多廠商沒有做過行業(yè),是不具備畫靶子的能力的,沒有辦法深入行業(yè)的本質(zhì)。但是訊飛在多個(gè)領(lǐng)域都深耕多年,不僅能畫靶子,也有專業(yè)的團(tuán)隊(duì)和數(shù)據(jù)積累——這樣才能做出行業(yè)真正適用的大模型。
從人才培養(yǎng)角度來說,行業(yè)+技術(shù)的復(fù)合人才很短缺,而訊飛做了人工智能行業(yè)25年,能穿透行業(yè)的人有很多,頭部、腰部力量很強(qiáng)。
在技術(shù)頂天、應(yīng)用落地的戰(zhàn)略下,科大訊飛這么多年在行業(yè)應(yīng)用上,已經(jīng)形成了成熟的GBC聯(lián)動(dòng)模式。
把大模型技術(shù)的創(chuàng)造力,轉(zhuǎn)化為促進(jìn)產(chǎn)業(yè)增長(zhǎng)的新質(zhì)生產(chǎn)力,正在成為千行百業(yè)的共同選擇?;谌珖?guó)產(chǎn)化算力打造的訊飛星火V3.5支持異構(gòu)算力調(diào)度,可實(shí)現(xiàn)行業(yè)大模型訓(xùn)練提效90%,支持23個(gè)企業(yè)應(yīng)用場(chǎng)景的敏捷優(yōu)化。星火大模型還與奇瑞汽車、太平洋保險(xiǎn)、交通銀行、國(guó)家能源集團(tuán)等企業(yè),打造千行百業(yè)的大模型應(yīng)用標(biāo)桿。
隨著數(shù)學(xué)和推理能力的升級(jí),多模態(tài)能力逐步進(jìn)階,通用大模型能力的升級(jí),決定了落地生產(chǎn)力的提升級(jí)別,放大了科大訊飛GBC聯(lián)動(dòng)的市場(chǎng)優(yōu)勢(shì)。
多年推動(dòng)行業(yè)AI化的努力,為科大訊飛大模型商業(yè)模式找到了最好的落地方向,為科大訊飛切取更大份額的GBC端的應(yīng)用和終端硬件產(chǎn)品市場(chǎng),打開了空間。
贏得早期市場(chǎng),也意味著贏得了進(jìn)入下一輪競(jìng)賽的入場(chǎng)券。
三、百模大戰(zhàn)的泡沫中,會(huì)有偉大的公司從中崛起通用人工智能這條道路,其實(shí)已經(jīng)經(jīng)歷了多次熱潮與漫長(zhǎng)的冬季。
大模型的出現(xiàn),讓通用人工智能看到了曙光,也讓堅(jiān)持通用人工智能路線的公司看到了曙光。
人工智能的來路比大模型更久遠(yuǎn),其未來也更長(zhǎng)遠(yuǎn),只有一直深耕這條賽道的人才、公司,才有可能抓住偶然出現(xiàn)的技術(shù)創(chuàng)新以及時(shí)代機(jī)遇。
今天,決定輸贏的不是公司體量的大小,這就是為什么OpenAI能夠率先跑出,它當(dāng)然也需要微軟的資金加持,但是這不是簡(jiǎn)單的資金算力問題,更重要的團(tuán)隊(duì)多年的積累跟長(zhǎng)期的技術(shù)研發(fā),帶來的技術(shù)人類反饋機(jī)制的技術(shù)新突破,無(wú)論大廠、小廠的努力,在這場(chǎng)技術(shù)長(zhǎng)跑當(dāng)中,每一個(gè)關(guān)鍵技術(shù)突破,都會(huì)壯大其繼續(xù)前行的技術(shù)底座,憑借這些積累,OpenAI、谷歌、科大訊飛這些持續(xù)深耕技術(shù)企業(yè)也都成為了大模型競(jìng)賽的關(guān)鍵角色。
在多次迭代、2023年5月正式發(fā)布的認(rèn)知大模型之后,劉慶峰就很驕傲地說:這次大模型攻關(guān),90后帶隊(duì),項(xiàng)目中也大都是90后。老中青傳幫帶的扎實(shí)人才梯隊(duì)與技術(shù)的厚積薄發(fā)相輔相成。
在劉慶峰看來,認(rèn)知大模型本質(zhì)上是一次對(duì)話式的通用智慧的涌現(xiàn),語(yǔ)音和語(yǔ)言的核心能力是基礎(chǔ)條件,科大訊飛是中國(guó)該領(lǐng)域的國(guó)家隊(duì)。
在強(qiáng)大的人才團(tuán)隊(duì)努力下,科大訊飛在認(rèn)知智能領(lǐng)域早已取得一系列全球領(lǐng)先成果。2019年,在斯坦福大學(xué)發(fā)起的國(guó)際著名的SQuAD機(jī)器閱讀理解比賽中,在英文閱讀理解中首次超過了人類平均水平。2022年在艾倫研究院組織的OpenBookQA科學(xué)常識(shí)推理比賽中,單模型首次超過了人類平均水平。
科大訊飛在過去24年一直專注在人工智能,擁有關(guān)鍵算法創(chuàng)新的兩個(gè)核心策源地——認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室、語(yǔ)音及語(yǔ)言信息處理國(guó)家工程研究中心,有充分的技術(shù)積累。這次星火大模型的每一行代碼、每一個(gè)算法模塊都是自己做的,而不是拿第三方的開源平臺(tái)訓(xùn)練的。
科大訊飛通過算力端與華為合作,率先解決了算力國(guó)產(chǎn)化的問題,同時(shí)在人工智能算法方面二十多年的技術(shù)人才積累,以及硬件終端多年的市場(chǎng)積累帶來的從教育、醫(yī)療到政務(wù)優(yōu)質(zhì)且獨(dú)特的細(xì)分行業(yè)市場(chǎng)數(shù)據(jù),讓它在互聯(lián)網(wǎng)巨頭的刺刀叢中,依然游刃有余。
更重要的是通用人工智能的信仰,對(duì)大模型通用能力持續(xù)迭代的堅(jiān)持,很可能會(huì)讓這家AI公司走得更遠(yuǎn)。
隨著大模型通用能力的指數(shù)級(jí)強(qiáng)化,機(jī)器人、具身智能以及在千行百業(yè)進(jìn)行深度應(yīng)用的市場(chǎng)空間,都已經(jīng)逐漸打開。
今天的大模型特別是人工智能,都還處于早期創(chuàng)業(yè)創(chuàng)新階段,對(duì)此,劉慶峰也強(qiáng)調(diào),今天的通用大模型并不一定就代表人工智能的全部未來,還有很多創(chuàng)新要做,比如跟腦科學(xué)的互動(dòng)、跟對(duì)抗網(wǎng)絡(luò)的深度連接,我們要做的工作非常之多,需要一整個(gè)創(chuàng)新生態(tài)。但是,我們一定要有勇氣和信心在底層的大模型上持續(xù)對(duì)標(biāo)。
大模型魔力的全部發(fā)揮,還有待需要更多的技術(shù)突破,比如更強(qiáng)大的通用智能算法,更多的感知算法,譬如具身智能,這需要更多具有通用人工智能信仰的、以及市場(chǎng)嗅覺的人才以及公司去攻關(guān)突破。
重復(fù)造輪的百模大戰(zhàn),當(dāng)中肯定有泡沫的成分,但是,如果把時(shí)間拉長(zhǎng),這種泡沫式的繁榮就像互聯(lián)網(wǎng)網(wǎng)頁(yè)時(shí)代的千禧年創(chuàng)業(yè)一樣,是必經(jīng)之路,但是泡沫當(dāng)中,一定會(huì)有偉大的公司從中崛起,中國(guó)絕對(duì)不能缺席。
看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。