大模型廠商價(jià)格戰(zhàn)停不下來,反映的恰恰是對(duì)未來的焦慮。在這場大模型的軍備競賽中,豆包想要上演大力出奇跡的戲碼。
@科技新知 原創(chuàng)
作者丨思原 編輯丨蕨影
大模型賽道打了一年的價(jià)格戰(zhàn),還在繼續(xù)……
就在新年前一天,阿里云宣布2024年度第三輪大模型降價(jià),通義千問視覺理解模型全線降價(jià)超80%。
同樣,前不久火山引擎的Force大會(huì)上,除了大力宣傳豆包外,最值得關(guān)注的還是價(jià)格的再次下降。目前豆包視覺理解模型輸入價(jià)格為0.003元/千tokens,1塊錢可處理284張720P的圖片。
此前去年5月份,豆包通用模型pro-32k版,推理輸入價(jià)格為0.0008元/千tokens,價(jià)格不到1厘。此舉迫使阿里云對(duì)其三款通義千問核心模型進(jìn)行新一輪降價(jià),降幅高達(dá)90%。而百度智能云則更為激進(jìn),宣布文心大模型旗下的兩款主打產(chǎn)品——ENIRE Speed與ENIRE Lite,將全面免費(fèi)開放。
按照火山引擎總裁譚待的說法,市場需要充分競爭,降低成本是技術(shù)優(yōu)化的結(jié)果,做得最好才能活下來。顯然,在這場大模型的軍備競賽中,豆包想要上演大力出奇跡的戲碼。
但在字節(jié)大肆內(nèi)卷之下,也有質(zhì)疑不斷:豆包的價(jià)格真的足夠便宜嗎?為什么大模型要卷價(jià)格?未來價(jià)格還會(huì)成為企業(yè)拿單重點(diǎn)嗎?
想要理解大模型商家的套路,就需要了解大模型的商業(yè)模式。據(jù)遠(yuǎn)川科技評(píng)論梳理,目前來看各家提供的服務(wù)主要可分為三種:
一是包含模型推理的基礎(chǔ)服務(wù),指的是根據(jù)輸入的信息內(nèi)容,給出回答的過程。簡單來說就是實(shí)際使用模型的過程。這部分各家都有不同的模型標(biāo)準(zhǔn)。
二是模型精調(diào),廠商可以根據(jù)客戶需求按token使用量(訓(xùn)練文本*訓(xùn)練迭代次數(shù))計(jì)費(fèi),訓(xùn)練完成后出賬,按量后付費(fèi)。
第三種便是模型部署,就相當(dāng)于一個(gè)客戶獨(dú)占了一部分算力資源,屬于大客戶,其收費(fèi)模式,也是按照消耗的計(jì)算資源或者模型推理的token數(shù)量以量計(jì)價(jià)。
這3種收費(fèi)模式,代表的也是大模型開發(fā)由淺入深的過程。而各大科技公司瘋狂砍價(jià)的,其實(shí)是第一種基礎(chǔ)服務(wù),即標(biāo)準(zhǔn)版模型的推理費(fèi)用。而這部分定價(jià)又分成了輸入和輸出兩部分。簡單來說,輸入就是用戶提問的內(nèi)容,而輸出則是大模型的回答。
在調(diào)用大模型時(shí)往往會(huì)根據(jù)輸入和輸出的token數(shù)量,進(jìn)行雙向計(jì)費(fèi)。這種細(xì)微差異,很容易成為大模型公司的套路。
例如,豆包的通用模型Doubao Pro-32k,輸入價(jià)格為0.8元/百萬tokens,按照官方說法是比行業(yè)便宜了99.3%,一些主流模型也都開始了降價(jià),比如阿里云三款通義千問主力模型Qwen-Turbo價(jià)格較之前直降85%,低至百萬tokens 0.3元,Qwen-Plus和Qwen-Max的輸入價(jià)格分別再降價(jià)80%和50%,分別為0.8元/百萬tokens和20元/百萬tokens。
但輸出價(jià)格方面有所差別,2元/百萬tokens的價(jià)格與Qwen-Plus、DeepSeek-V2等同行持平,甚至比比Qwen-Turbo、GLM-4-9B等一些同行產(chǎn)品價(jià)格更高。
再看最新的豆包視覺理解模型Doubao-vision-pro-32k,輸入化為每百萬tokens的售價(jià)為3元,大概是0.4美元,輸出直接來到了9元,大概為1.23美元。按照豆包說法,這個(gè)售價(jià)比行業(yè)平均價(jià)格便宜85%。
但對(duì)比幾個(gè)直接競爭者:阿里的多模態(tài)模型Qwen-VL系列在最近降價(jià)后與其價(jià)格一致;多模態(tài)的Gemini 1.5 Flash模型每百萬輸入tokens報(bào)價(jià)為0.075 美元、每百萬輸出tokens成本為0.3美元,對(duì)于較小的上下文(小于128k)還另有折扣價(jià);GPT-4o mini則是輸入0.15美元,輸出0.6美元。
不過不止豆包,國內(nèi)其他廠商基本也都有類似的降價(jià)套路。例如百度宣布免費(fèi)的ERNIE-Speed-8K,如果實(shí)際部署,收費(fèi)就變成了5元/百萬tokens。還有阿里的Qwen-Max,實(shí)際與字節(jié)跳動(dòng)的豆包通用模型Pro-32k一樣,只是降低了輸入的價(jià)格。
值得一提的是,標(biāo)準(zhǔn)模型推理的降價(jià)確實(shí)可以讓中小開發(fā)者降低成本,但只要稍微更進(jìn)一步的使用,就涉及到了模型微調(diào)和模型部署,然而這兩項(xiàng)服務(wù)一直都不是價(jià)格戰(zhàn)的主角,并且也沒有太大降價(jià)幅度。
簡單來說,各家降價(jià)最狠的其實(shí)都是輕量級(jí)的預(yù)置模型;相比之下,性能更強(qiáng)悍的超大杯模型,實(shí)際降價(jià)幅度沒有那么夸張。例如精調(diào)的Doubao-pro系列的價(jià)格都在50元/百萬tokens,比阿里、騰訊這些廠商的旗艦主力模型價(jià)格更高。
各大廠商風(fēng)風(fēng)火火的掀起的價(jià)格戰(zhàn),就像是打網(wǎng)游,用各種形式吸引玩家,再在游戲中加上各種玩法,總之就是想要變強(qiáng)就要氪金。當(dāng)然,即便如此,各個(gè)大廠也算是真金白銀的付出很多,那么為什么這些廠商在一直圍繞價(jià)格大費(fèi)周章呢?
縱觀大模型行業(yè),字節(jié)跳動(dòng)一定算不上起跑最快的那一批選手,甚至今年年初,字節(jié)跳動(dòng)CEO梁汝波在內(nèi)部講話中提到遲鈍二字,直指字節(jié)對(duì)大模型的敏感度不如創(chuàng)業(yè)公司。
直到2023年才開始討論GPT,而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司都是在2018年至2021年創(chuàng)立的。他說。
后來者往往是最需要內(nèi)卷的那個(gè),字節(jié)跳動(dòng)也是如此。從今年年中開始,便開始制造一輪又一輪熱度。
除了上文所說的,豆包在B端的讓利降價(jià)意圖明顯外,C端市場豆包也是全力出擊。
面向C端,無論是線上平臺(tái),還是線下公開場所,都能看到豆包的身影。據(jù)連線Insight援引AppGrowing統(tǒng)計(jì),截至11月15日,國內(nèi)十款A(yù)I原生應(yīng)用中,Kimi和豆包是投放最瘋狂的兩個(gè)產(chǎn)品,分別投放了5.4億元和4億元。
拉長時(shí)間線看,豆包的投流顯然更猛烈。據(jù)AppGrowing統(tǒng)計(jì),2024年4月—5月,豆包投放金額預(yù)計(jì)為1500萬元-1750萬元。6月上旬,豆包再次啟動(dòng)新一輪大規(guī)模的廣告投放活動(dòng),投放金額高達(dá)1.24億元。
除了投流外,豆包還有抖音這一流量池,字節(jié)幾乎屏蔽了除了豆包以外所有AI應(yīng)用在抖音上的投放。目的也很明確,就是要徹底解決大模型應(yīng)用的用戶焦慮。
然而,現(xiàn)實(shí)往往事與愿違。據(jù)智能涌現(xiàn)報(bào)道,字節(jié)內(nèi)部反思——豆包目前的用戶活躍度并不算高。豆包每周僅活躍2至3天,且每天用戶發(fā)送消息輪次僅為5到6次,單次2分鐘左右,用戶人均使用時(shí)長僅為10分鐘左右。上述這些數(shù)據(jù)在過去一年中的增長幅度并不顯著。
簡單來說,不計(jì)成本的投流,雖然讓豆包成了國內(nèi)用戶數(shù)量斷層式第一的AI軟件,但仍然算不上是一款killer app。
字節(jié)管理層對(duì)此的判斷是,像豆包這樣的AI對(duì)話類產(chǎn)品可能只是AI產(chǎn)品的中間態(tài)。字節(jié)內(nèi)部判斷,付費(fèi)訂閱模式在中國不太可能走通。而時(shí)長和輪次太低,又導(dǎo)致潛在的廣告空間較小,這都構(gòu)成了這類產(chǎn)品的隱形天花板。
所以長期來看,更低門檻、更多模態(tài)的產(chǎn)品形式更具落地可能,剪映和即夢可能是合適的入口,這也是此次大會(huì)豆包將部分重點(diǎn)放在視頻模型的本質(zhì)原因。
但站在用戶角度,根據(jù)財(cái)經(jīng)雜志報(bào)道,大部分用戶買單的原因是產(chǎn)品和服務(wù)能帶來價(jià)值,價(jià)值不光是解決具體問題,如提升工作效率、提供情感陪伴等,市場上還有一類價(jià)值是符合政策方向。更重要的要具備找到具體客戶并交付的能力,這考驗(yàn)的是AI公司在技術(shù)和產(chǎn)品之外的能力,甚至在很多時(shí)候,這項(xiàng)能力比技術(shù)實(shí)力更能幫助AI公司成長。
中國的AI市場和美國不同,很難通過平臺(tái)銷售軟件的模式打開市場,大部分時(shí)候需要抓住一個(gè)個(gè)的項(xiàng)目和工程來實(shí)現(xiàn)商業(yè)化。而這些項(xiàng)目和工程的來源,往往與自身熱度有關(guān)。
一家成熟的企業(yè)在布局大模型時(shí),很難會(huì)去考慮一個(gè)不成熟的產(chǎn)品或者企業(yè)。在不考慮成本的情況下,大品牌往往是首選,這不僅是技術(shù)上的信任,更多是服務(wù)、整體質(zhì)量的信任,一位科技企業(yè)管理人員向「科技新知」表示,畢竟小廠的風(fēng)險(xiǎn)還是有的,就像買車,開著開著車廠倒閉了,那就損失大了。
初創(chuàng)公司大肆制造熱點(diǎn)新聞,大概率是為了融資,是為了活下去,而豆包這種本就有背景的,則是想要靠著熱度去找到并且固定更多客戶,但圈內(nèi)一個(gè)默認(rèn)的事實(shí)就是,無論是誰、無論技術(shù)多厲害,都要善于保持熱度,畢竟酒好也怕巷子深。
03 淘汰賽,或告別價(jià)格戰(zhàn)其實(shí)不止豆包,目前市面上所有二線及以下的大模型廠商,都處在花錢買流量的階段,為的是留住用戶。因?yàn)檫@一場不折不扣的卷王秀背后,是瘋狂的產(chǎn)品能力和研發(fā)速度,更意味著這場關(guān)于擠泡沫的大模型服務(wù)商淘汰賽,再次吹響了號(hào)角。
2024年已經(jīng)經(jīng)歷了一輪淘汰賽洗禮,讓大模型去九存一,產(chǎn)業(yè)格局更加合理,只留下了約10%的大模型進(jìn)入決賽圈。
然而,這并不是結(jié)束,而是開始。只是在「科技新知」看來,新一輪淘汰賽的重點(diǎn),價(jià)格不再是主導(dǎo)因素而是技術(shù)。
目前科技公司們也開始陸續(xù)意識(shí)到,僅發(fā)布一個(gè)免費(fèi)的應(yīng)用,并不能為公司帶來直接收益,C端用戶量很難增長,獲客成本已經(jīng)明顯提升。更重要的是去直接觸及那些愿意付費(fèi)的B 端客戶,例如金融、政務(wù)、汽車等行業(yè)。
但是通常有大量公司集中進(jìn)入某個(gè)行業(yè)時(shí),會(huì)出現(xiàn)持久的價(jià)格戰(zhàn),因?yàn)楦骷叶夹枰蛟煲粋€(gè)標(biāo)桿客戶,來為之后的市場拓展鋪路。簡單粗暴的價(jià)格戰(zhàn)會(huì)讓一些公司主動(dòng)或被動(dòng)退出,待市場穩(wěn)定后,再將價(jià)格恢復(fù)常態(tài)。
但矛盾之處在于,有錢的領(lǐng)域大家都想進(jìn)入。而長久的價(jià)格戰(zhàn)下,技術(shù)成本變成了制勝關(guān)鍵,簡單來說,同樣的解決方案和報(bào)價(jià)下,誰的技術(shù)成本更低,誰就能虧得更少,活得更久。
而技術(shù)成本取決于企業(yè)的硬件成本和算法邏輯,這點(diǎn)目前國內(nèi)主流的大模型廠商基本處在同一水準(zhǔn),并且迭代和互相追趕的速度也不相上下,但這不代表可以高枕無憂。
今年9月,OpenAI的王炸o1模型的問世也讓各家看到了差距,與現(xiàn)有的大模型相比,o1最大的特點(diǎn)就是推理式AI,它在回答復(fù)雜問題時(shí)會(huì)花費(fèi)更多時(shí)間來逐步推演問題。這種延時(shí)思考并不是缺點(diǎn),反而讓o1更接近人類真實(shí)的邏輯推理方式。
從生成式AI到推理式AI,o1的推出預(yù)示著AI進(jìn)入了一個(gè)全新的階段。而更令人震驚的是,在o1發(fā)布的3個(gè)月后,下一代o系列產(chǎn)品o3便橫空出世,并且o3有完整版和mini版,新功能是可將模型推理時(shí)間設(shè)置為低、中、高,模型思考時(shí)間越高,效果越好。mini版更精簡,針對(duì)特定任務(wù)進(jìn)行了微調(diào),將在1月底推出,之后不久推出o3完整版。
這也意味著快速迭代下,目前主流的生成式AI,即將成為歷史產(chǎn)品。
價(jià)格是影響大模型企業(yè)的因素,但更重要的還是技術(shù)能力,一位大模型應(yīng)用開發(fā)者向「科技新知」表示,目前國內(nèi)如阿里、昆侖萬維等企業(yè)也都推出類o1模型,雖然有差距,但也代表了他們也都認(rèn)同這一趨勢。
一位業(yè)內(nèi)專家也表示,國內(nèi)企業(yè)走的思路是集成思維鏈、用搜索方式提升深度推理能力、加入反思策略和算法提升邏輯推理性能,但目前還未完全超過OpenAI。
值得一提的是,國內(nèi)最近比較火的DeepSeek-V3,采用的蒸餾技術(shù)給行業(yè)提供了新思路,但同時(shí)也陷入優(yōu)化GPT的爭論。
而針對(duì)AI訓(xùn)練可能使用合成數(shù)據(jù)(大模型生成數(shù)據(jù))這一話題,倫敦大學(xué)學(xué)院(UCL)名譽(yù)教授和計(jì)算機(jī)科學(xué)家彼得·本特利表達(dá)了擔(dān)憂,稱如果繼續(xù)在其他AI的輸出上訓(xùn)練AI,結(jié)果可能是模型崩潰。確保高質(zhì)量AI的唯一方法是,為其提供人類的高質(zhì)量內(nèi)容。
缺乏參照的現(xiàn)成開源架構(gòu),不清楚o1模型做后訓(xùn)練時(shí)強(qiáng)化學(xué)習(xí)的方式以及使用的數(shù)據(jù)集,樹搜索、COT未開源,訓(xùn)練數(shù)據(jù)污染、國產(chǎn)模型推理性能提升困難,這些都是目前國內(nèi)企業(yè)的難點(diǎn),該專家補(bǔ)充道,不過若有支持o1架構(gòu)的開源模型出現(xiàn)會(huì)加速這一過程,過程中會(huì)有兩三家先跑,其他家后跟進(jìn)。
如果根據(jù)以往GPT系列的發(fā)展節(jié)奏,全廠商跟上o系列的步伐大概率會(huì)在2025年上半年到來,而在這之后,目前的技術(shù)也將逐漸退出歷史舞臺(tái),所以對(duì)于大模型廠商來說,與其坐等被淘汰,不如在淘汰之前讓迭代技術(shù)發(fā)揮更大作用。
總的來看,未來價(jià)格雖仍會(huì)是影響企業(yè)拿單的因素之一,但隨著技術(shù)的快速迭代和行業(yè)的發(fā)展,技術(shù)能力將越發(fā)關(guān)鍵,只有不斷提升技術(shù)、降低成本、優(yōu)化服務(wù),大模型廠商才能在即將到來的淘汰賽中存活下來。
看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。