這場(chǎng)轟轟烈烈的大模型之戰(zhàn),是21世紀(jì)迄今為止最重要的技術(shù)競(jìng)賽,沒(méi)有之一。
這場(chǎng)技術(shù)競(jìng)賽具有強(qiáng)烈的21世紀(jì)的特征:
一、信息公開(kāi)及時(shí),任何參賽選手的動(dòng)作都會(huì)隨時(shí)被全世界的選手了解并跟進(jìn),一個(gè)選手的技術(shù)優(yōu)勢(shì)保持的時(shí)間只能以天計(jì)。
二、上下游高度聯(lián)動(dòng),只是開(kāi)發(fā)出一項(xiàng)絕技是不夠的,還要找到上下游的幫手來(lái)將這個(gè)絕技貫通到用戶(hù)端和上游基建端,一個(gè)維度不夠有優(yōu)勢(shì)都有可能被偷家。
主流視野內(nèi),這場(chǎng)競(jìng)賽已經(jīng)開(kāi)始2年了。我們有必要對(duì)這場(chǎng)競(jìng)賽做一個(gè)復(fù)盤(pán),看看它進(jìn)入哪個(gè)階段了,有哪些還在緊跟和引領(lǐng)的選手,甚至有可能大膽的猜一猜這場(chǎng)競(jìng)賽最終將以何種形式結(jié)束,誰(shuí)是最終的勝出者。
01 三個(gè)階段首先很有必要給這場(chǎng)競(jìng)賽一個(gè)階段性劃分,方便我們有明確的時(shí)間戳來(lái)梳理競(jìng)賽過(guò)程。如果給這場(chǎng)競(jìng)賽一個(gè)階段性劃分,按照傳統(tǒng)的方法,我們可以找個(gè)標(biāo)志性的產(chǎn)品來(lái)粗略判斷,而當(dāng)前有個(gè)最佳參考標(biāo)的:OpenAI旗下的ChatGPT。
它既是這場(chǎng)競(jìng)賽的發(fā)起者,也是截止目前最佳的參賽選手,更是其他選手的追趕和對(duì)齊的目標(biāo)。我們用OpenAI作為參考和分析對(duì)象,觀(guān)察其技術(shù)和產(chǎn)品動(dòng)態(tài)可以大略把迄今為止的競(jìng)賽分為三個(gè)階段——但考慮未來(lái)大模型最重要走入終端應(yīng)用,也可以把這場(chǎng)競(jìng)賽分成四個(gè)階段。
第一階段:參數(shù)比拼,先上牌桌
一個(gè)模型是否好用,沒(méi)有上億個(gè)參數(shù)基本上不了臺(tái)面。
2023年關(guān)于大模型的新聞報(bào)道,參數(shù)指標(biāo)以及大規(guī)模多任務(wù)語(yǔ)言理解基準(zhǔn)測(cè)試的得分基本模型面世的見(jiàn)面禮。GPU成了大廠(chǎng)拼搶的目標(biāo),記得有段時(shí)間GPU倒賣(mài)比挖礦還要火熱。
這個(gè)階段表面是比誰(shuí)家的模型參數(shù)多,誰(shuí)家的模型評(píng)分更高,誰(shuí)家模型效果好。背后何嘗不是算力的比拼,而算力背后又是GPU的比拼。這一層層的比拼中造就了多少的贏家和輸家。
這個(gè)階段的畢業(yè)的贏家,基本會(huì)形成自己的模型調(diào)性和特長(zhǎng)方向。
通過(guò)對(duì)OpenAI的GPT模型的迭代梳理,我們發(fā)現(xiàn)這是一個(gè)需要一步步消除歷史問(wèn)題,并改進(jìn)準(zhǔn)確度,提高智能性并逐漸增加更多模型能力的過(guò)程。
2019年2月,GPT-2發(fā)布,這僅是一款無(wú)監(jiān)督的Transformer語(yǔ)言模型,完整版本的GPT-2僅有15億個(gè)參數(shù),隨后的2020年6月份GPT-3發(fā)布,參數(shù)爆發(fā)性上漲到】1750億個(gè),標(biāo)志著自然語(yǔ)言處理技術(shù)的飛躍,也給之后的大模型設(shè)定了入門(mén)門(mén)檻。
隨后2022年11月,OpenAI發(fā)布了基于GPT-3的對(duì)話(huà)產(chǎn)品ChatGPT,同月發(fā)布了GPT-3的改進(jìn)版本GPT-3.5這個(gè)改進(jìn)版本,具備近似自然人的語(yǔ)言生成能力,隨著ChatGPT的發(fā)布驚艷全球。
2023年3月,OpenAI發(fā)布第四代語(yǔ)言模型GPT-4,其參數(shù)有1.8萬(wàn)億個(gè),甚至媒體報(bào)道訓(xùn)練一次的成本在6300萬(wàn)美元,從這個(gè)版本開(kāi)始ChatGPT具有了圖像作為輸入的處理能力。但用戶(hù)對(duì)ChatGPT啰里啰嗦,編故事的抱怨不斷升級(jí)。
2024年5月,OpenAI發(fā)布了GPT-4o,它可以處理和生成文本、圖像和音頻,從這個(gè)版本開(kāi)始語(yǔ)音加入了大模型擂臺(tái)。GPT-4o在大規(guī)模多任務(wù)語(yǔ)言理解基準(zhǔn)測(cè)試中的得分為88.7%,高于GPT-4的86.5%,用戶(hù)對(duì)ChatGPT胡說(shuō)八道編故事的抱怨大大減少了。
2024年7月,OpenAI發(fā)布了GPT-4omini,這是GPT-4o的較小版本,使用這個(gè)版本可以在犧牲部分模型效果的前提下大大降低應(yīng)用成本。其API每百萬(wàn)輸入令牌成本為0.15美元,每百萬(wàn)輸出Token成本為0.60美元,而GPT-4o的成本分別為5美元和15美元。OpenAI已經(jīng)在考慮讓大模型成為企業(yè)和開(kāi)發(fā)者產(chǎn)品功能的基礎(chǔ)組成部分。
2024年9月,OpenAI發(fā)布了o1-preview和o1-mini模型,進(jìn)一步提高模型的準(zhǔn)確率。
2024年12月,GPT-o1完整版發(fā)布。o1可以根據(jù)不同的prompt有不同的相應(yīng)速度,對(duì)于復(fù)雜的問(wèn)題會(huì)提供更加智能的回應(yīng),我們親測(cè)o1的解答明顯更加具備邏輯性,這意味著大模型幻覺(jué)問(wèn)題得到一定程度解決。同時(shí)o1處理圖像作為輸入時(shí)的準(zhǔn)確度進(jìn)一步提升,測(cè)試一章模糊的柱形圖圖片,o1不僅可以識(shí)別數(shù)字,還會(huì)自行生成對(duì)柱形圖的分析。
OpenAI走過(guò)的這一個(gè)個(gè)階段,幾乎也成了其他廠(chǎng)商模型改進(jìn)的重要參考,OpenAI的改進(jìn)方向也成了其他廠(chǎng)商努力的目標(biāo)。
傳統(tǒng)的互聯(lián)網(wǎng)大廠(chǎng),meta、微軟、谷歌和亞馬遜對(duì)于AI模型的研究并不晚于OpenAI,只是后者最快有了突破。
meta不僅推出了自家的大模型,并且開(kāi)源了。12月9日meta發(fā)布了Llama最新成員:Llama3.370B,該模型能夠以更低的成本擁有Llama3.1405B的性能。該模型優(yōu)化了多語(yǔ)言支持,上下文長(zhǎng)度拓展到了128k。
除了開(kāi)源模型,meta還推出了廣告推薦設(shè)計(jì)的廣告檢索引擎Andromeda。Andromeda通過(guò)利用最先進(jìn)的深度神經(jīng)網(wǎng)絡(luò),結(jié)合ML、系統(tǒng)和硬件的協(xié)同,有效提升了廣告檢索階段的效率,為meta廣告系統(tǒng)提供更個(gè)性化的廣告投放,提升了廣告花費(fèi)回報(bào)率。
谷歌一直在深度學(xué)習(xí)和人工智能方面學(xué)術(shù)研究領(lǐng)先,但在大語(yǔ)言模型方面似乎有些亂了陣腳,初代Gemini給谷歌帶來(lái)的是更多的質(zhì)疑聲。12月12日谷歌發(fā)布Gemini2.0Flash,這是谷歌首款實(shí)現(xiàn)原生多模態(tài)輸入輸出的模型,不僅在模型精準(zhǔn)度方面相比1.5pro完成大跨度提升,還可直接生成圖片。
微軟和亞馬遜自研的大模型進(jìn)度落后,但通過(guò)曲線(xiàn)救國(guó)完成了大模型布局。微軟是OpenAI的最大金主,獲得了OpenAI的大模型獨(dú)家授權(quán),同時(shí)微軟Azure云也是OpenAI的服務(wù)提供者,微軟旗下的Microsoft365商業(yè)軟件、CopilotAI都已經(jīng)上線(xiàn)了基于GPT模型的AI產(chǎn)品,2024年Q3的財(cái)報(bào)前瞻中微軟預(yù)期Azure云營(yíng)收245~250億美元,同比增35%~36%,AI的應(yīng)用對(duì)收入的貢獻(xiàn)約為13個(gè)百分點(diǎn)。
亞馬遜則是通過(guò)多次投資Anthropic進(jìn)入大模型賽場(chǎng),截止目前,亞馬遜的投資金額已經(jīng)達(dá)到了80億美元。
Anthropic旗下的Claude之于Amazon,就像ChatGPT至于微軟,Anthropic成為了亞馬遜在這場(chǎng)競(jìng)賽中對(duì)抗OpenAI和微軟的重要棋子。亞馬遜是一加注重InfoInfra的巨頭,即使在推進(jìn)大模型業(yè)務(wù)方面,亞馬遜也是全鏈條推進(jìn)。12月3日re:Invent大會(huì)上,亞馬遜發(fā)布了6款大模型,并計(jì)劃在2025年再發(fā)布2款大模型,還推出了AI訓(xùn)練芯片Trainum3以及AI服務(wù)器Trn2UltraServer。幾乎是一次性完成了從模型訓(xùn)練到應(yīng)用的布局。
盡管發(fā)布時(shí)間明顯落后,但亞馬遜對(duì)于大模型的應(yīng)用反而是很徹底的。三季度財(cái)報(bào)顯示,面向購(gòu)物者亞馬遜推出了生成式人工智能專(zhuān)家購(gòu)物助手Rufus以及面向B端商家推出了人工智能助手ProjectAmelia。
Anthropic旗下的Claude,在2024年二季度迭代以后,在變成和對(duì)話(huà)方面的能力可以與GPT-4比肩。2022年8月創(chuàng)立的基于大模型的搜索產(chǎn)品PreplexityAI,推翻了傳統(tǒng)搜索引擎超鏈接的展示方式,直接將關(guān)鍵詞的搜索結(jié)果通過(guò)AI總結(jié)摘要展示給用戶(hù),免去了挨個(gè)點(diǎn)擊鏈接并自行判斷的過(guò)程。PreplexityAI甚至在四季度已經(jīng)開(kāi)始嘗試AI結(jié)果頁(yè)面的廣告變現(xiàn)。
馬斯克旗下的xAI推出開(kāi)源大模型產(chǎn)品Grok以及圖像生成模型Aurora……
在2023-2024年這2年內(nèi)不止國(guó)外大模型突飛猛進(jìn),國(guó)內(nèi)也是百模大戰(zhàn)好不熱鬧,一時(shí)間幾乎所有的互聯(lián)網(wǎng)公司都在研發(fā)大模型。
有專(zhuān)注大模型的垂直創(chuàng)業(yè)公司六小龍,智譜AI、MiniMax、月之暗面、百川智能、零一萬(wàn)物和階躍星辰。以及老牌BAT出品的,阿里的通義千問(wèn)、百度的文心一言、騰訊的混元模型。
由于具備豐富的業(yè)務(wù)和數(shù)據(jù)積累,BAT的大模型產(chǎn)品一開(kāi)始就姥姥抓住了用戶(hù),特別百度不僅模型推出的早,還創(chuàng)造性的提出了模型即服務(wù)MAAS概念,一時(shí)間幾乎定義了國(guó)內(nèi)的大模型研發(fā)的范式。
互聯(lián)網(wǎng)新貴字節(jié)和快手分別推出了豆包和可靈大模型。豆包更是后來(lái)居上,據(jù)晚點(diǎn)披露,字節(jié)豆包App今年9月的日活已達(dá)760萬(wàn),MAU超過(guò)4000萬(wàn),成為眾多大模型C端產(chǎn)品中獨(dú)一檔的存在。
不同于通用性大模型,一些互聯(lián)網(wǎng)公司根據(jù)自己業(yè)務(wù)特性開(kāi)發(fā)的針對(duì)性較強(qiáng)的大模型,如B站index大模型、網(wǎng)易的子曰、360的奇元。大廠(chǎng)中尚無(wú)明確大模型產(chǎn)品和策略的只剩下美團(tuán)和拼多多。
對(duì)自家模型功能的描述猶如另一套互聯(lián)網(wǎng)黑話(huà),其用詞堪比房地產(chǎn)公司的宣傳語(yǔ),總結(jié)起來(lái)就是強(qiáng)大,強(qiáng)大還是強(qiáng)大。
王小川曾斷言,未來(lái)國(guó)內(nèi)大模型市場(chǎng)第一梯隊(duì)或僅有五家存活,大廠(chǎng)占據(jù)主導(dǎo)地位,小型創(chuàng)業(yè)公司能存活的寥寥無(wú)幾。今天來(lái)看,這一結(jié)論似乎正一步步驗(yàn)證,缺乏有效的商業(yè)變現(xiàn)機(jī)制以及對(duì)模型訓(xùn)練持續(xù)投入的熱情正在下降,六家公司真正直接依靠大模型能力打正成本的幾乎沒(méi)有。
總體來(lái)看,經(jīng)過(guò)2年的醞釀和淘汰賽,仍然穩(wěn)定在牌桌上的廠(chǎng)商都有過(guò)硬的技術(shù)和產(chǎn)品了。各家面對(duì)的最大問(wèn)題戰(zhàn)略層面是變現(xiàn),技術(shù)層面是向拓展模型邊界,發(fā)展多模態(tài)。樂(lè)觀(guān)的是,這個(gè)階段我們也看到了一個(gè)積極的信號(hào),即大模型不再是贏家通吃的市場(chǎng)了,沒(méi)有一家有能力壟斷技術(shù)和市場(chǎng)。
第二階段:多模態(tài)拓展和變現(xiàn)并行
除了大語(yǔ)言模型(LLM)外,文生圖、文生視頻,語(yǔ)音對(duì)話(huà),甚至3D生成極大的拓展了大模型的應(yīng)用邊界。
多模態(tài)之爭(zhēng)中,最有應(yīng)用前景的當(dāng)屬視頻生成,OpenAI推出了視頻生成模型Sora、圖片生成模型DALL-E、meta發(fā)布文生視頻工具M(jìn)ovieGen、谷歌的Gemni2.0可以直接從文字生成視頻。
國(guó)內(nèi)方面快手正式推出了視頻生成模型可靈AI,字節(jié)推出了視頻生成模型PixelDance和Seaweed,以及基于模型的視頻生成平臺(tái)即夢(mèng)AI,六小龍中MiniMax發(fā)布了其首款A(yù)I高清視頻生成模型技術(shù)abab-video-1。
百度在這場(chǎng)多模態(tài)競(jìng)賽中表現(xiàn)的格外另類(lèi),曾有消息傳出李彥宏并不認(rèn)可像OpenAI一樣去做視頻生成模型Sora,另一方面又強(qiáng)調(diào)百度需要發(fā)展多模態(tài),但百度在這方面的動(dòng)作緩慢。
與多模態(tài)發(fā)展并行的是盡快將大模型能力變現(xiàn)。面向C端用戶(hù)國(guó)內(nèi)外主流的變現(xiàn)方式采用類(lèi)似視頻網(wǎng)站的每日限次使用+會(huì)員訂閱模式,20美金/月成了大部分大模型的入門(mén)價(jià)位。
仍然以O(shè)penAI為例,推出了團(tuán)隊(duì)版Team、每月20美金的Plus版本以及每月200美金的Pro版本。國(guó)內(nèi)Kimi創(chuàng)造性的采用打賞模式,打賞金額不同可獲得不同時(shí)長(zhǎng)的高峰期優(yōu)先使用權(quán)。
B端的變現(xiàn)模式則增加多樣化,也代表著大模型真正發(fā)揮實(shí)力方向。meta、谷歌將大模型能力應(yīng)用在在線(xiàn)廣告業(yè)務(wù)中,通過(guò)驅(qū)動(dòng)廣告業(yè)務(wù)增長(zhǎng)來(lái)拉動(dòng)營(yíng)收。國(guó)內(nèi)除騰訊并未透露大模型的收入提效外,阿里和百度的云業(yè)務(wù)都已經(jīng)應(yīng)用AI大模型,并產(chǎn)生部分受益。
2024年10月31日谷歌發(fā)布三季度財(cái)報(bào),其中谷歌云營(yíng)收從去年同期的84.11億美元增長(zhǎng)至113.53億美元,同比增長(zhǎng)近35%,谷歌將其強(qiáng)勁的云業(yè)務(wù)表現(xiàn)歸因于旗下的AI產(chǎn)品如面向企業(yè)客戶(hù)的訂閱服務(wù)增長(zhǎng)驅(qū)動(dòng)營(yíng)收提速。
另一巨頭meta在同期三季度財(cái)報(bào)中透露,核心廣告業(yè)務(wù)的得益于大模型改進(jìn)打來(lái)收入增長(zhǎng),已有超過(guò)100萬(wàn)廣告主使用meta的生成式AI廣告工具。
大模型創(chuàng)業(yè)公司的營(yíng)收則更為直接的展示了其營(yíng)收能力。從OpenAI和Perplexity AI的收入來(lái)看還遠(yuǎn)遠(yuǎn)不夠驚艷,但巨大的用戶(hù)體量還是給投資人以變現(xiàn)的耐心。
OpenAI目前周活2.5億,C端付費(fèi)用戶(hù)貢獻(xiàn)約75%的營(yíng)收,2024年公司總收入約34億美元,但在刨除運(yùn)營(yíng)、人工和管理成本之后虧損50億美元。6月份其首位CFO到位,其透露OpenAI將努力增加消費(fèi)端訂閱人數(shù),努目標(biāo)是將周活的5%-6%轉(zhuǎn)化為付費(fèi)用戶(hù)。
AI搜索公司Perplexity近期在尋求新一輪融資,據(jù)The Information報(bào)道其在融資材料中披露,預(yù)計(jì)其年化收入將在2025年達(dá)到1.27億美元,較目前水平翻倍。
國(guó)內(nèi)方面,百度在第三季度財(cái)報(bào)中透露文心大模型日均調(diào)用量達(dá)15億次,比2023年四季度的5000萬(wàn)次,增長(zhǎng)了30倍,相比去年Q4披露的5000萬(wàn)次,一年內(nèi)增長(zhǎng)30倍,百度智能云營(yíng)收達(dá)49億元,同比增長(zhǎng)11%,AI相關(guān)收入占比持續(xù)提升至超11%。阿里云季度營(yíng)收增長(zhǎng)至265.49億元人民幣,同比增長(zhǎng)6%。其中,AI相關(guān)產(chǎn)品收入實(shí)現(xiàn)三位數(shù)增長(zhǎng)。
兩年的時(shí)間,對(duì)于一個(gè)技術(shù)應(yīng)用來(lái)說(shuō)還不夠長(zhǎng),最重要的是模型還需要打磨并滲透到現(xiàn)有的業(yè)務(wù)中,推向用戶(hù)。這需要一定的短期的技巧和長(zhǎng)期的耐心。
第三階段:推薦到應(yīng)用層的變革
但如果說(shuō)大模型的牌桌最終可能屬于實(shí)力巨頭,那么在經(jīng)過(guò)3-5年的技術(shù)發(fā)展之后,各家始終要面對(duì)的就是讓更多的下游企業(yè)運(yùn)營(yíng)大模型,實(shí)現(xiàn)成本回收,更重要的是真正讓大模型經(jīng)受來(lái)自最終端用戶(hù)的檢驗(yàn)。
已經(jīng)有多個(gè)模型的實(shí)際應(yīng)用方向吸引眾多公司嘗試,如AI Coding,側(cè)重模型的邏輯思維和編碼能力,大大降低互聯(lián)網(wǎng)產(chǎn)品開(kāi)發(fā)門(mén)檻。
AI Agent,突破Chatbot框架,更廣泛的發(fā)揮大模型的能力走入實(shí)際應(yīng)用中,谷歌的Project Mariner是一個(gè)AI代理,能夠幫助用戶(hù)查找航班和酒店、購(gòu)買(mǎi)家庭用品和尋找食譜。
AI代理概念被業(yè)內(nèi)普遍看好,但具體定義尚未達(dá)成統(tǒng)一共識(shí),一個(gè)普遍的觀(guān)點(diǎn)是,AI代理除了能回答問(wèn)題,還需要能跨越多個(gè)系統(tǒng)執(zhí)行復(fù)雜任務(wù)。AI機(jī)器人,通過(guò)人機(jī)對(duì)話(huà)接口來(lái)輔助失能人群和替代勞動(dòng)密集型崗位。
其中尤其以AI Agent最受關(guān)注,甚至微軟和谷歌也已經(jīng)在進(jìn)行相關(guān)部署。畢竟有了代理,能極大的將用戶(hù)從promptEnginering中解放出來(lái),讓模型能力的發(fā)揮不再受制于輸入方式的限制。
就像一場(chǎng)奧林匹克運(yùn)動(dòng)會(huì),有些賽場(chǎng)會(huì)吸引大多數(shù)人的目光,有些賽場(chǎng)小眾人群關(guān)注,但不管哪個(gè)賽場(chǎng)都可以決出實(shí)實(shí)在在的金牌。
大模型賽場(chǎng)在巨頭你來(lái)我往的爭(zhēng)奪之外,還有一個(gè)應(yīng)用賽場(chǎng)也格外值得關(guān)注。
AI教育,以Duolingo、Speak等明星企業(yè)為藍(lán)本,AI語(yǔ)音+大模型完美替代了外教這一角色,為用戶(hù)提供了完美的口語(yǔ)訓(xùn)練和單詞記憶功能。
AI陪伴成為了收入和用戶(hù)體量上受益最大的賽道。盡管上不了大臺(tái)面,但這個(gè)賽道內(nèi)的公司紛紛賺得盆滿(mǎn)缽滿(mǎn),AI Dating(Rizz、Blush)、Talkie、Character AI名利雙收。
AI營(yíng)銷(xiāo):僅是LLM就足以在投放素材上大大解放營(yíng)銷(xiāo)人員,meta早就在其營(yíng)銷(xiāo)神態(tài)產(chǎn)品中應(yīng)用了AI創(chuàng)意生成,Pinterest也上線(xiàn)了自己的大模型產(chǎn)品PinterseCanvas幫助廣告主進(jìn)行創(chuàng)意和素材生成。
除了生成素材,大模型還可以幫助廣告主從縝密的營(yíng)銷(xiāo)活動(dòng)設(shè)置中解放出來(lái),Applovin和meta的投放流程自動(dòng)化產(chǎn)品已經(jīng)做到了廣告主只需要設(shè)置推廣產(chǎn)品和預(yù)算、投放地區(qū)和人群等基本營(yíng)銷(xiāo)條件,大模型自動(dòng)生成營(yíng)銷(xiāo)活動(dòng)、廣告投放以及最終的投放數(shù)據(jù)分析,甚至連具有一定門(mén)檻的AB測(cè)試都可以用模型實(shí)現(xiàn),大大解放了廣告主的人力配置。
最有錢(qián)景的方向——SAAS。如果要選擇一個(gè)第二賽場(chǎng)的最大受益者,那中小創(chuàng)業(yè)公司必然在列。Reddit論壇和HackerNews上,不斷有個(gè)人開(kāi)發(fā)者個(gè)小團(tuán)隊(duì)利用大模型技術(shù),這類(lèi)應(yīng)用簡(jiǎn)單小巧應(yīng)用覆蓋的范圍窄,一般都是基于成熟大模型,解決特定的效率問(wèn)題,如廣告文案修改和腳本潤(rùn)色、故事思維拓展等。
未來(lái)還可能有第四階段,大模型的應(yīng)用已經(jīng)推進(jìn)到終端,在各種應(yīng)用層面掀起一場(chǎng)自上而下的效率改革,這恐怕不是三五年的時(shí)間可以實(shí)現(xiàn)的了。
02 起飛的枷鎖:算力和成本我們劃分大模型的發(fā)展階段,卻始終沒(méi)提到伴隨這股風(fēng)潮而再次火起來(lái)的算力問(wèn)題。
2023年,OpenAI奧特曼指出,全球AI運(yùn)算量每隔18個(gè)月就會(huì)提升一倍,英偉達(dá)黃仁勛在2024年宣布,摩爾定律已經(jīng)失效,GPU效能每?jī)赡陮⒃黾右槐兑陨稀?br />
除了算力還有模型訓(xùn)練成本問(wèn)題。
大模型訓(xùn)練的成本有多高?根據(jù)報(bào)道2024年,Anthropic的模型訓(xùn)練和擴(kuò)展成本超過(guò)27億美元,盡管大模型相關(guān)的融資屢見(jiàn)不鮮,融資金額也屢創(chuàng)新高,但隨著可預(yù)見(jiàn)的未來(lái)越來(lái)越清晰,以及各大模型廠(chǎng)商幾乎同步的遇到算力和應(yīng)用問(wèn)題,不少企業(yè)無(wú)法再無(wú)門(mén)檻的拿到融資,由此出現(xiàn)了資金吃緊和運(yùn)營(yíng)困難的情況。
文生圖模型StableDiffusion的面世讓StabilityAI廣為認(rèn)知,但在2024年也出現(xiàn)財(cái)務(wù)困境,公司幾乎難以為繼。
隱憂(yōu)之一,漫長(zhǎng)的投入期,要還是不要?
國(guó)內(nèi)的大模型賽場(chǎng)用幾個(gè)詞形容最為合適,起步晚,趕得緊,走得急,落的快。
時(shí)至今日,可以說(shuō)大模型競(jìng)賽進(jìn)入了第三階段,多模態(tài)能力的比拼正在慢慢進(jìn)入尾聲,可以說(shuō)在這個(gè)階段國(guó)內(nèi)廠(chǎng)商并不落后。
但我們同時(shí)又可以看到,國(guó)外即使是基礎(chǔ)的大模型仍然在迭代中,參數(shù)增強(qiáng)、算力優(yōu)化等等。甚至Google在經(jīng)歷了Gemini被各種諷刺后,仍然推出了Gemni2.0,實(shí)現(xiàn)原生多模態(tài)輸入輸出,讓一眾使用者贊嘆不已。
根據(jù)我們多次對(duì)比使用來(lái)看Gemini2.0比1.5完成了質(zhì)的飛躍,甚至在某些應(yīng)用中比ChatGPT-o1更令人滿(mǎn)意,真正讓人體驗(yàn)到了推理模型的魅力,在給出應(yīng)答結(jié)果的時(shí)候還會(huì)同時(shí)給出next level的參考。
回到國(guó)內(nèi)無(wú)論是六小龍還是新舊BAT似乎同步遇到了瓶頸——預(yù)訓(xùn)練還要不要做,推理模型還要投入多久?這漫長(zhǎng)看不到頭的投入期,讓前幾年紛紛降本增效的各大公司猶豫不決。
國(guó)內(nèi)的商業(yè)環(huán)境以及上市公司的股東們是否會(huì)允許大模型近乎看不到回報(bào)的投入?
早在2023年下半年以及2024年上半年的多次財(cái)報(bào)電話(huà)會(huì)議中meta、微軟、谷歌等公司的分析師就多次詢(xún)問(wèn)大模型投入回報(bào)率,以及投入是否足夠的時(shí)候,各個(gè)公司的管理層頂住了投資者的壓力沒(méi)有在預(yù)算上砍價(jià)。
但國(guó)內(nèi)呢,能夠頂住投資者投下來(lái)的壓力嗎?要知道國(guó)內(nèi)至今沒(méi)有一家巨頭在財(cái)報(bào)中明確給出大模型帶來(lái)的收益。
隱憂(yōu)之二,成本回收。
國(guó)內(nèi)市場(chǎng)來(lái)講,大模型訓(xùn)練和應(yīng)用缺乏有效的應(yīng)用場(chǎng)景來(lái)回收投入成本,盡管這點(diǎn)在國(guó)外也并不鮮見(jiàn),但國(guó)內(nèi)成本回收問(wèn)題尤其令人憂(yōu)心。近期百川智能首席營(yíng)銷(xiāo)官洪濤離職可能就是這一隱憂(yōu)的間接體現(xiàn)。
以互聯(lián)網(wǎng)行業(yè)為例,國(guó)內(nèi)缺乏一個(gè)成熟的在線(xiàn)廣告行業(yè)應(yīng)用場(chǎng)景。
meta和Applovin已經(jīng)證明了大模型在廣告營(yíng)銷(xiāo)方面的巨大潛力,并且已經(jīng)在逐漸從底層再次給這個(gè)成熟巨大的市場(chǎng)添一把火。國(guó)內(nèi)首先缺乏一個(gè)有一定覆蓋度的廣告平臺(tái),幾乎都是既當(dāng)運(yùn)動(dòng)員又當(dāng)裁判,營(yíng)銷(xiāo)效果透明性較差。
其次,大模型成效明顯的SAAS行業(yè),在國(guó)內(nèi)的發(fā)展也乏善可陳。
國(guó)外像Salesforce、Snowflake以及剛剛上市的ServiceTitan這樣提供互聯(lián)網(wǎng)云計(jì)算、云存儲(chǔ)和信息數(shù)據(jù)服務(wù)的saas廠(chǎng)商,這類(lèi)toB的公司可以融合和觸達(dá)更多的中小企業(yè)的云服務(wù)和計(jì)算需求,給大模型應(yīng)用提供廣闊的的平臺(tái)。
國(guó)內(nèi)大模型廠(chǎng)商商業(yè)化有幾個(gè)方向:
其一會(huì)員訂閱,即每日免費(fèi)次數(shù)使用完之后,結(jié)果更多次數(shù)需要按月付費(fèi)。
其二,大模型訓(xùn)練,按token收費(fèi)。其他企業(yè)使用大模型廠(chǎng)商的模型接口來(lái)完成自身功能改善,根據(jù)對(duì)話(huà)量向模型廠(chǎng)商付費(fèi)。例如,在社交產(chǎn)品中上線(xiàn)對(duì)話(huà)機(jī)器人,如微博的評(píng)論羅伯特,或者供自家用戶(hù)文生圖或者文生視頻等UGC場(chǎng)景。這些幾乎都依賴(lài)于接口調(diào)用量,這是各大模型廠(chǎng)商競(jìng)爭(zhēng)最激烈的戰(zhàn)場(chǎng)。
價(jià)格戰(zhàn)嘛,并不陌生,這恐怕是國(guó)內(nèi)商戰(zhàn)最簡(jiǎn)單有效的套路了,放到大模型應(yīng)用這也同樣好使。可問(wèn)題是在價(jià)格戰(zhàn)背后,模型的效果的提升還能有保證嗎?甚至于我們認(rèn)為,字節(jié)在大模型戰(zhàn)場(chǎng)起步晚、追趕快,就是趕上了國(guó)內(nèi)大模型價(jià)格刺刀戰(zhàn)中,各家都暫時(shí)把模型質(zhì)量放到一邊這個(gè)時(shí)間窗口。
根據(jù)歷史上各類(lèi)風(fēng)口之戰(zhàn)的經(jīng)驗(yàn),沒(méi)有有效的商業(yè)模式來(lái)收回模型成本,企業(yè)不會(huì)持續(xù)投入,甚至理想情況看,國(guó)內(nèi)的大模型之戰(zhàn)的結(jié)果可能變成另一個(gè)中國(guó)安卓機(jī)市場(chǎng)的現(xiàn)狀。
04 基本結(jié)論以上,總結(jié)下當(dāng)前AI大模型的幾個(gè)基本事實(shí):
1.大模型技術(shù)發(fā)展至今2年的時(shí)間,其應(yīng)用方向已經(jīng)遍布互聯(lián)網(wǎng)的核心行業(yè)中,其中在線(xiàn)廣告、在線(xiàn)教育、受益最大;
2.傳統(tǒng)實(shí)業(yè)也正在以終端接入模型的方式這一技術(shù)革新帶來(lái)的提效;
3.模型進(jìn)一步發(fā)展的瓶頸在于突破算力的束縛,但當(dāng)前算力幾乎集中在英偉達(dá)一家公司,這是不正?,F(xiàn)象;
4.AI訓(xùn)練芯片可能是繞過(guò)算力瓶頸的另一種更直接高效的方式;
5.由于大模型越來(lái)越集中到巨頭手中,且缺乏有效的第三方業(yè)務(wù)平臺(tái),國(guó)內(nèi)的應(yīng)用不會(huì)像美國(guó)那樣普遍,有可能傳統(tǒng)實(shí)業(yè)的應(yīng)用成效比互聯(lián)網(wǎng)更大;
6.國(guó)內(nèi)大模型應(yīng)用最終進(jìn)展,取決于投資人是否有耐心容忍企業(yè)的長(zhǎng)期持續(xù)投入。
大模型競(jìng)賽進(jìn)展到今天,已經(jīng)不是一場(chǎng)算法比拼,肯定會(huì)掀起一場(chǎng)新的產(chǎn)業(yè)變革,這種變革和前段時(shí)間的元宇宙以及WEB3不同,是一場(chǎng)實(shí)實(shí)在在的從上到下又發(fā)起,又從底層到上層應(yīng)用的競(jìng)賽。
比人才、拼技術(shù)、比算力的競(jìng)賽,其發(fā)展目標(biāo)更接近奧林匹克的更快、更高、更強(qiáng),但其中唯一不合理的地方就是這場(chǎng)競(jìng)賽的速度瓶頸——算力至今仍然只掌握在英偉達(dá)一家公司手中。這種現(xiàn)狀肯定不會(huì)為科技巨頭所容忍,AI訓(xùn)練芯片已經(jīng)被亞馬遜和英特爾提到日程上來(lái)了,從芯片層級(jí)來(lái)打破英偉達(dá)的壟斷。
所幸大模型競(jìng)賽已經(jīng)不再是贏家通吃的局面了,甚至擁有某些局部?jī)?yōu)勢(shì)的中小創(chuàng)業(yè)公司也有可能在其中分一杯羹。人們短期內(nèi)高估了大模型的影響而長(zhǎng)期又低估了其影響,這是一場(chǎng)來(lái)勢(shì)洶洶又細(xì)水長(zhǎng)流的競(jìng)賽。
看完覺(jué)得寫(xiě)得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。