作者|Cindy
恐怕誰也不會想到,百模大戰(zhàn)進入商業(yè)化下半場,圍繞大模型大規(guī)模、曠日持久的戰(zhàn)爭,竟是開源和閉源路線的交鋒。
最近,在2024世界人工智能大會(WAIC)上,劉慶峰、李彥宏、王堅、朱嘯虎、傅盛等行業(yè)大佬,發(fā)表的截然不同觀點,再次引發(fā)外界對大模型路線的關(guān)注。
比如,持續(xù)輸出開源落后于閉源大模型場景下,開源是最貴的觀點的百度創(chuàng)始人李彥宏,再次直言不諱認(rèn)為,開源是一種智商稅。獵豹移動董事長兼CEO傅盛,則繼王小川、周鴻祎之后,直接不客氣反駁李彥宏,稱付費閉源大模型才是智商稅。谷歌前董事長施密特甚至在近日表示,中國AI發(fā)展基本靠西方開源,因此必須限制開源模型。
大模型賽道的開源閉源,主要是指模型源代碼、模型權(quán)重、訓(xùn)練數(shù)據(jù)是否公開。這場AI浪潮下科學(xué)界的戰(zhàn)爭,并非僅發(fā)生在中國企業(yè)身上——相比中國企業(yè)家的文明交鋒,國外企業(yè)和大佬更是采用直接短兵相接的肉搏戰(zhàn)方式。
去年2月以來,馬斯克屢屢發(fā)難,稱轉(zhuǎn)向閉源的OpenAI應(yīng)改名為Close AI。今年2月,馬斯克在舊金山法院對OpenAI及CEO阿爾特提起訴訟,要求OpenAI恢復(fù)開源并給予賠償。市場方面,去年7月meta將Llama2(羊駝)開源后,和ChatGPT發(fā)生的一輪輪攻防戰(zhàn),同樣精彩紛呈。
風(fēng)云涌動中,圍繞大模型開閉源的白刃戰(zhàn)超過一年半。但至今誰也說服不了誰,誰也未取得決定性勝利,未來走向撲朔迷離。
唯一能確定的是,對公眾和企業(yè)來說,無論路線如何,解決不了最后一公里難題,開閉源都一文不值。對所有大模型而言,其真正考驗如同科大訊飛創(chuàng)始人劉慶峰所說,在最后一公里的應(yīng)用和商業(yè)化落地上。
01、開閉源路線之爭的本質(zhì)
回顧互聯(lián)網(wǎng)和軟件史,開源和閉源的戰(zhàn)爭一直都在上演。
直到今天,這依然是兩股并行、截然不同的力量。開源方面,以Linux、Android、unix為代表;閉源方面,則有Windows、Mac OS、iOS、WP等等。
戰(zhàn)爭核心,在于技術(shù)進步、安全保障、社會價值與經(jīng)濟效益之間的平衡探索。
開源認(rèn)為,應(yīng)允許任何人獲得并修改軟件的源代碼,如同一座橋梁,分享、融合才是其存在意義。閉源則認(rèn)為,軟件和代碼屬于勞動成果,勞動成果需要保護和用來獲取財富。
客觀看,開源促進軟件繁榮和全球范圍內(nèi)合作,拓寬創(chuàng)新邊界上,居功至偉。但就商業(yè)價值層面來看,此前所有領(lǐng)域都被閉源吊打。
一切技術(shù)路線爭議終點,需要商業(yè)化掙錢。這無可厚非,但需要意識到的是,AI大模型的路線戰(zhàn)爭,和此前任何一次開閉源戰(zhàn)爭都沒可對比性——業(yè)界共識是,大模型本身就是一個黑盒子,外界至今難以徹底揭開它的神秘。
從模型、算法到數(shù)據(jù),如何產(chǎn)生一個可以使用的模型,無人知曉。未來到底是走向中心化,還是去中心化,都是矛盾而又流行的說法。
這種神秘性,造就大模型的獨特性——無論是國外還是國內(nèi),都不是巨頭的一枝獨秀,從科研到創(chuàng)業(yè)者,再到千行百業(yè)開發(fā)者,都可以參與其中,讓大模型呈現(xiàn)百花齊放、百家爭鳴的蓬勃生態(tài)。
技術(shù)實力來看,如果以ChatGPT為標(biāo)尺,那么開源曾很長一段時間落后于閉源——到去年下半年,這種情況已經(jīng)改變,很多超過 ChatGPT 3.5,甚至追趕ChatGPT 4.0能力的大模型陸續(xù)發(fā)布。不過,在Sora發(fā)布后,閉源又獲得一段時間領(lǐng)先。
閉源和開源大模型,很難說誰就會永遠(yuǎn)領(lǐng)先誰,這是一個永遠(yuǎn)在動態(tài)平衡變化的狀態(tài)。多位業(yè)內(nèi)人士就認(rèn)為,其差距取決于,研發(fā)團隊能力的差異,以及背后團隊所持有的資金、算力、數(shù)據(jù)。
非得在開源與閉源之間,做選擇題嗎?顯然不是。
如今,在開閉源陣營之爭外,還有一條技術(shù)路線陣營正迅速擴大——開源和閉源同時并行發(fā)展。在國外,以谷歌為代表;在國內(nèi),則包含科大訊飛、昆侖萬維、零一萬物、百川智能等企業(yè)。
這個陣營的技術(shù)實力,并不遜色任何開源或閉源企業(yè)。比如訊飛星火,V3.0版本在中文上全方位超越Chat GPT,英文上實現(xiàn)對標(biāo)。而在V4.0版本中,在8個國際主流測試集中排名第一,在文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力等方面實現(xiàn)了對GPT-4 Turbo的整體超越。
02、開源與閉源,為何可以兩條腿走路
極點商業(yè)觀察來看,選擇開源、閉源兩條腿走路的企業(yè),布局大多主要遵循以下路徑:在最大模型上選擇閉源,在較小模型上選擇開源。
比如谷歌,就在推出開源大模型Gemma后,走上閉源+開源并行道路。有報道認(rèn)為這代表谷歌大模型策略的轉(zhuǎn)變——開源主打性能最強大的小規(guī)模模型,希望戰(zhàn)勝meta和Mistral AI;閉源則主打規(guī)模大效果最好的大模型,希望盡快追上OpenAI。
在國內(nèi),兩條腿走路的企業(yè)也類似。以科大訊飛為例,整體超越GPT-4 Turbo的訊飛星火V4.0是閉源,通過昇騰AI和訊飛星火的合作,打破大模型訓(xùn)練的瓶頸;而130億參數(shù)的星火開源-13B則是開源,在多項知名公開評測任務(wù)中名列前茅。
其實,大模型不像手機操作系統(tǒng),必須在IOS或安卓之間二選一,對開發(fā)者、用戶、企業(yè)來說,考慮的很直接:這個大模型是否易用好用,又同時具有性價比?穩(wěn)定性、安全性是否可以保證?其生態(tài)和場景打造,又是否滿足用戶需求。
這意味著,讓所有用戶、企業(yè)、開發(fā)者乃至產(chǎn)業(yè),都能選擇合適自己的大模型,就是最好的大模型。
這也是科大訊飛兩條腿走路核心目的,通過閉源+開源完整體系,閉源專注商業(yè)應(yīng)用、產(chǎn)業(yè)落地,開源策略是生態(tài)開放,兩者優(yōu)勢合二為一,激發(fā)中國大模型的產(chǎn)業(yè)、生態(tài)活力。
在閉源部分,基于星火大模型V4.0,科大訊飛有面向TOC的AI應(yīng)用訊飛星火APP/Desk、星火智能批閱機、訊飛AI學(xué)習(xí)機、訊飛曉醫(yī)APP;面向TOB和生態(tài)伙伴,有星火企業(yè)智能體平臺、招采助手、機器人超腦平臺2. 0等等,讓企業(yè)可以構(gòu)建自己的智算底座。
星火開源公開測評數(shù)據(jù)
在開源的星火大模型,科大訊飛的策略是生態(tài)開放,通過免費大模型,為開發(fā)者、學(xué)術(shù)界賦能。
開源+閉源兩條腿想順利走路關(guān)鍵,需要解決幾個關(guān)鍵問題,一是模型架構(gòu)自主可控,有一定技術(shù)優(yōu)勢,二是產(chǎn)業(yè)落地、商業(yè)模式完整,三是通過社區(qū)吸引更多開發(fā)者。
誰控制了過去,誰就控制了未來;誰控制了現(xiàn)在,誰就控制了過去。近年來,被卡脖子事件屢屢在我國科技產(chǎn)業(yè)上演,算力、數(shù)據(jù)是否會卡大模型的脖子,業(yè)界也是議論紛紛。
這意味著,主流國產(chǎn)、自主可控的模型架構(gòu),才可能最大限度發(fā)揮生態(tài)力量,匹配產(chǎn)業(yè)上下游環(huán)境,更好推進開源、閉源的并行融合。
所有算法都是我們自主可控的,大模型的每一行代碼、每一個數(shù)據(jù)都是我們自己編寫、清洗出來的。劉慶峰表示。
而對處于早期的大模型來說,無論是開源、閉源,都需要聚集更多開發(fā)者,參與到開源模型的改進和優(yōu)化。
在國外,包括meta、谷歌和微軟以及第三方開發(fā)者都在社區(qū)內(nèi)發(fā)布模型、參數(shù)、數(shù)據(jù)集;在國內(nèi),訊飛開放平臺之上大模型總開發(fā)者超35萬,其中企業(yè)開發(fā)者超22萬,推動大模型應(yīng)用加速落地。
回顧PC、軟件、手機歷史,其實也有類似案例。比如在數(shù)據(jù)庫市場,Oracle就是開源+閉源兩條腿走路,在開源社區(qū)、商業(yè)應(yīng)用均取得了巨大成功。
谷歌、科大訊飛們的大模型兩條路邏輯其實也類似。一種解讀是,在大模型時代,開源、閉源只是手段,在不同產(chǎn)品和應(yīng)用場景中,兩者本是相輔相成。開源模型和開源社區(qū)可以在上游用免費策略負(fù)責(zé)擴大用戶基數(shù)、拓展產(chǎn)業(yè)生態(tài)、迭代模型技術(shù)。
來自開源部分的經(jīng)驗,也可以復(fù)用到閉源,讓閉源大模型的產(chǎn)業(yè)化、商業(yè)化落地更順暢——最終兩條路線以多元化、靈活化的方式演進,并行甚至融合互補。
實際上這兩塊是相互補充的??拼笥嶏w創(chuàng)始人劉慶峰也認(rèn)為。他以星火開源13B模型為例指出,等650億、1500億、1750億參數(shù)以及更大模型出來,就知道了它的天花板和邊界,再對它進行裁剪、濃縮,就變成13B,那13B的效果也提升了。
如果不做閉源,不探索行業(yè)最高的天花板,開源也做不到最好。劉慶峰就認(rèn)為。
兩條腿走路的互補價值,浙江大學(xué)人工智能研究所所長吳飛一個觀點是,任何開源基座模型,都是千錘百煉而來,不是所有公司和機構(gòu)都具備這樣的能力。在開源之上進行閉源,可以很大程度上降低閉源模型研發(fā)的門檻。
03、最后一公里才是真正挑戰(zhàn)
從劉慶峰、李彥宏、王小川等行業(yè)大佬觀點來看,一個共同之處是:閉源、開源只是手段,關(guān)鍵是讓大模型,如何快速應(yīng)用千行百業(yè)場景里,如何作為生產(chǎn)力工具,更好地普惠,去替代人類完成各類業(yè)務(wù)流的碎片、繁雜工作。
這意味著,對國內(nèi)目前尚處于高速發(fā)展階段的大模型而言,隨著開源、閉源路線的逐漸并行融合,選擇什么路線不是關(guān)鍵問題。
不同場景適配不同的參數(shù)。如同劉慶峰所說,無論大模型如何演進,最后一公里的產(chǎn)品體驗和應(yīng)用落地,才是真正挑戰(zhàn)。
這也是誰能在百模大戰(zhàn)中占有一席之地,擁有更多的話語權(quán)的關(guān)鍵。如果解決不好最后一公里,那么技術(shù)路線將一文不值。當(dāng)前國內(nèi)大模型企業(yè)的應(yīng)用開發(fā)的普遍思路是,并未等到技術(shù)完全成熟再落地應(yīng)用,而是在快速迭代技術(shù)同時,從ToC、ToB兩端入手,相應(yīng)地進行產(chǎn)業(yè)和應(yīng)用落地。
這一點,在剛剛結(jié)束的WAIC上也體現(xiàn)得很明顯??拼笥嶏w、百度、阿里巴巴、騰訊、華為、字節(jié)跳動、快手等行業(yè)巨頭,以及百川、智譜等新銳帶來眾多新技術(shù)和新產(chǎn)品,展現(xiàn)了大模型和金融、醫(yī)療、教育、政務(wù)等多個行業(yè)、產(chǎn)業(yè)的深度融合。
關(guān)于如何更好地解決企業(yè)大模型應(yīng)用的最后一公里問題,科大訊飛經(jīng)過和大量的央國企和行業(yè)合作伙伴的共同探討,他們認(rèn)為用智能體平臺打造每個崗位專屬助手的時間已經(jīng)到了。
在這之前,星火已經(jīng)成功賦能了很多場景,無論是代碼、數(shù)字勞動力,還是評標(biāo)、客戶、APP智能互動??拼笥嶏w與太平洋保險合作是從審計這個崗位做起的,包括客服和評標(biāo);此外,國家能源集團、中國石油等公司選了科大訊飛作為合作伙伴;同時,星火大模型賦能中國移動APP幾億用戶,使中國移動APP更加智能、交互更順暢。
通過這么多的場景可以看到,大模型賦能企業(yè)人工智能+行動有兩個方面:一方面是大模型直接完成任務(wù),訊飛星火一開始啟用,文本生成、語言理解、知識問答、邏輯推理和代碼能力對應(yīng)到下面相關(guān)的各種各樣的工具,它自己就完成了,不需要借助任何外力。
還有一種模式是以認(rèn)知大模型為中心大腦,它調(diào)動各種專用模型,比如說振動的模型、味覺模型、氣體模型,濕度模型等各種模型,然后配合相應(yīng)的工具,再對接內(nèi)外部的各種信源和數(shù)據(jù),打通內(nèi)部的辦公OA、ERP系統(tǒng),再對接外部實時性來聯(lián)合完成任務(wù),相當(dāng)于用大模型來指揮調(diào)度一系列的能力,從而完成一個綜合的任務(wù)。
面向B端,從劉慶峰闡述來看,訊飛星火大模型在最后一公里用智能體平臺打造專屬于每個崗位的工作助手,在智能家電、智能汽車、運營商、機器人等行業(yè)場景實現(xiàn)全面賦能,甚至成為各行各業(yè)創(chuàng)新發(fā)展的重要驅(qū)動力。
面向具身智能和人形機器人企業(yè)需求,目前400+機器人企業(yè)已經(jīng)采用訊飛機器人超腦平臺。另外,星火企業(yè)智能體平臺將圍繞智能體關(guān)鍵能力,覆蓋400+AI原子能力,集成 90+外部信源,打通100+內(nèi)部 IT 系統(tǒng),可供企業(yè)結(jié)合業(yè)務(wù)場景快速構(gòu)建可落地的智能體應(yīng)用。
解決AI+行動的最后一公里的問題,是前所未有的機遇。劉慶峰就表示,星火已經(jīng)成功賦能了很多場景,無論是代碼、數(shù)字勞動力,還是評標(biāo)、客戶、APP智能互動。
不完全統(tǒng)計顯示,訊飛星火大模型正成為國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、海爾集團、美的集團等多領(lǐng)域頭部企業(yè)的首選。
公開招標(biāo)網(wǎng)數(shù)據(jù)就顯示,今年上半年到6月中旬,整個公開招標(biāo)數(shù)量約為234件。其中,60%以上的項目來自央國企。在央國企大模型訂單中標(biāo)企業(yè)中,訊飛星火高居第一。
我們能走多遠(yuǎn),取決于我們是否擁有自主開發(fā)的、可控的基礎(chǔ)能。從劉慶峰表態(tài)來看,這是大模型如何解放生產(chǎn)力、釋放每個人、每家企業(yè),甚至每位開發(fā)者想象力的關(guān)鍵。
合抱之木,生于毫末,九層之臺,起于壘土。如同劉慶峰的說法,這正是大模型能力階段跨越的體現(xiàn)——意味著大模型從技術(shù)附加工具,轉(zhuǎn)向引領(lǐng)行業(yè)變革、助力企業(yè)降本增效、普惠大眾生活的關(guān)鍵階段。而針對更多商業(yè)化模式的探索,也正悄然形成模型越強、落地越多、用戶越廣、算力越大的增長飛輪。
從這個角度看,只要能做大生態(tài),加速產(chǎn)業(yè)最后一公里的落地,無論是大模型技術(shù)路線是閉源,還是開源,其實一點都不重要。
看完覺得寫得好的,不防打賞一元,以支持藍海情報網(wǎng)揭秘更多好的項目。