DeepSeek，做AI競爭的破局者

藍(lán)海情報(bào)網(wǎng) 2025-02-07 12:56:34 576

DeepSeek，做AI競爭的破局者

來源 | 伯虎財(cái)經(jīng)（bohuFN）

作者 | 森系

中美大模型的差距在1-2年。起碼在今年春節(jié)之前，這還是一個(gè)獲得普遍認(rèn)同的觀點(diǎn)。

直到中國科技公司深度求索發(fā)布了推理模型DeepSeek-R1，用不到GPT二十分之一的成本，獲得了和OpenAI的頂尖推理模型o1相當(dāng)?shù)哪芰Α?/p>

DeepSeek的影響很快擴(kuò)散到大洋彼岸。

1月27日，美國科技股遭遇黑色風(fēng)暴，費(fèi)城半導(dǎo)體指數(shù)（SOX）狂瀉9.2%，創(chuàng)下2020年3月以來的最大單日跌幅。英偉達(dá)股價(jià)重挫近17%，市值一夜之間蒸發(fā)近6000億美元，創(chuàng)下美股歷史上最大的單日市值縮水規(guī)模。博通、臺(tái)積電、ASML、Google和微軟等科技巨頭也未能幸免，股價(jià)分別下跌17.4%、13%、7%、4%和2.14% 。

與此同時(shí)，歐洲科技股市場同樣哀鴻遍野，各類科技股慘遭拋售。

引發(fā)全球資本市場強(qiáng)烈地震的幕后主角——DeepSeek，不是任何發(fā)力大模型的大廠，或者創(chuàng)業(yè)明星，而是一家此前名聲不顯的小型科技初創(chuàng)公司。它由幻方量化創(chuàng)始人梁文鋒一手創(chuàng)辦，成立僅一年多。

最能喚醒讀者記憶的，可能是去年8月，DeepSeek率先宣布其API價(jià)格大幅下調(diào)，輸入費(fèi)用調(diào)整為0.1元/百萬tokens，輸出費(fèi)用為2元/百萬tokens，隨后各家大廠紛紛跟進(jìn)。大模型價(jià)格戰(zhàn)也就此打響。

實(shí)際上，DeepSeek的創(chuàng)始人梁文鋒或許是最早把目光投向AI的那批人。不僅僅是他創(chuàng)立了量化基金，更有意思的例證是，在算力緊缺的2023年，國內(nèi)只有五家公司擁有萬塊規(guī)模的顯卡，前四位是阿里巴巴、騰訊、百度和字節(jié)跳動(dòng)，剩下的那個(gè)就是幻方量化。

開源、創(chuàng)新、成本。在硅谷，DeepSeek被稱作來自東方的神秘力量。他們一面跟隨，推出類似的推理模型，一面攻擊，要求對(duì)其進(jìn)行封殺甚至算力封鎖。

1月28日，DeepSeek曾連續(xù)發(fā)布兩條公告稱，DeepSeek線上服務(wù)受到大規(guī)模惡意攻擊。

客觀來講，從產(chǎn)品實(shí)際表現(xiàn)來看，DeepSeek目前只是躋身行業(yè)第一梯隊(duì)，尚未實(shí)現(xiàn)對(duì)市面上現(xiàn)有產(chǎn)品的全面超越，也并非在技術(shù)底層實(shí)現(xiàn)了范式創(chuàng)新。

但DeepSeek確實(shí)為全球AI行業(yè)的長期發(fā)展探索出了新的模式，也讓長期被硅谷霸占話語權(quán)的AI行業(yè)出現(xiàn)了一些不一樣的聲音。正如AI領(lǐng)域泰斗吳恩達(dá)所言：DeepSeek的創(chuàng)新表明，中美在生成式AI領(lǐng)域的差距正在迅速縮小，在某些領(lǐng)域中國已現(xiàn)領(lǐng)先跡象。

01 DeepSeek，破了誰的金身？

去年12月，36氪旗下的暗涌賬號(hào)采訪了DeepSeek。采訪中提到了去年8月由DeepSeek發(fā)起的價(jià)格戰(zhàn)，原因指向了一個(gè)事實(shí)——與很多大廠燒錢補(bǔ)貼不同，DeepSeek是有利潤的。

早在去年5月，DeepSeek發(fā)布的DeepSeekV2模型，就展現(xiàn)了他們非凡的效率：推理成本被降到每百萬token僅1塊錢，約等于Llama370B的七分之一，GPT-4Turbo的七十分之一。

并且相較于OpenAI公司來自全球頂尖學(xué)府幾千人的大公司人力成本，DeepSeek公司只有寥寥幾百人，也沒有全球前50的人才密度，聚集的是國內(nèi)一眾大學(xué)相關(guān)學(xué)科的博碩精英人才。

更加難能可貴的是，DeepSeek-V3在訓(xùn)練時(shí)使用的GPU是英偉達(dá)的H800，一款在性能上被閹割的特供AI芯片。相比之下，GPT-4o使用的是上萬塊英偉達(dá)H100芯片（性能優(yōu)于H800）。

這和我們過去的認(rèn)知是不同的。

英偉達(dá)及美股大跌的原因直指DeepSeek，原因在于DeepSeek的成功打破了AI大模型領(lǐng)域拼投入的慣常邏輯。AI大模型只有砸錢、砸算力才能做出來的觀念在行業(yè)中深入人心。

2023年，OpenAI的CEO奧特曼（SamAltman）曾經(jīng)訪問印度，他對(duì)印度團(tuán)隊(duì)能否憑借僅 1000 萬美元的預(yù)算，在AI領(lǐng)域構(gòu)建出具有實(shí)質(zhì)性成果的模型表示懷疑。

在他看來，如果沒有上億美元的訓(xùn)練成本，是煉不出好的大模型的。畢竟作為AI行業(yè)的領(lǐng)軍企業(yè)OpenAI至今都尚未實(shí)現(xiàn)盈利，很大一部分原因在于尖端AI模型的訓(xùn)練耗資驚人，運(yùn)行成本也十分高昂。據(jù)測算，僅維持ChatGPT的運(yùn)營，每天成本就高達(dá)70萬美元。奧特曼則表示，未來的AI模型成本預(yù)計(jì)將超過10億美元。

高昂的成本也讓后來者紛紛以O(shè)penAI為標(biāo)桿加大投入。馬斯克旗下的xAI，其超級(jí)計(jì)算數(shù)據(jù)中心裝配了10萬顆英偉達(dá)H100 GPU芯片，成為全球最強(qiáng)大的AI訓(xùn)練集群之一。特朗普上臺(tái)后，宣布投資5000億美元啟動(dòng)星際之門項(xiàng)目，試圖憑借巨額資金與強(qiáng)大算力，鞏固美國在AI領(lǐng)域的霸權(quán)地位。

其他科技巨頭們也在積極布局。過去一年，微軟和谷歌的資本支出均超過 500 億美元，其中大部分資金用于AI相關(guān)的基礎(chǔ)設(shè)施建設(shè)，并且計(jì)劃在2025財(cái)年將這一投入提升至700 - 800億美元。國內(nèi)方面，根據(jù)浙商證券的分析，2024年字節(jié)跳動(dòng)的資本開支約為800億元，預(yù)計(jì)2025年將達(dá)到1600億元，其中約900億元將用于AI算力的采購，700億元用于 IDC 基建以及網(wǎng)絡(luò)設(shè)備。

DeepSeek并非是擁有什么降本魔法，而是摸索出了一條不一樣的道路。DeepSeek的研究員提出了一種新的MLA（一種新的多頭潛在注意力機(jī)制）架構(gòu)，與 DeepSeek MoESparse (混合專家結(jié)構(gòu))結(jié)合，這種架構(gòu)的優(yōu)勢是顯存占用僅為常用MHA架構(gòu)的5%-13%。

與此同時(shí)，和行業(yè)慣常的用數(shù)萬億token（文本單位）訓(xùn)練模型不同，而是選擇通過數(shù)據(jù)蒸餾，降低了數(shù)據(jù)計(jì)算程度，從而實(shí)現(xiàn)降本。

正因?yàn)槿绱?，DeepSeek也有了AI屆的拼多多之稱，盡管這種表述可能并不完全準(zhǔn)確，但也基本表達(dá)了DeepSeek對(duì)當(dāng)前主流AI的沖擊。通過這一低成本模式使得DeepSeek能夠更快速地推出新產(chǎn)品和服務(wù)，并極大地降低了其市場進(jìn)入門檻，可以吸引了更多企業(yè)和機(jī)構(gòu)參與到AI研發(fā)中來。

02 開源會(huì)是更好的選擇？

當(dāng)然，DeepSeek對(duì)AI的沖擊還不止于此。

作為一家中國公司，DeepSeek表現(xiàn)出了前所未有的自信，對(duì)產(chǎn)品實(shí)施開源策略，也就是公開模型的代碼和架構(gòu)等等，允許公眾查看、使用和修改。這就意味著，很多中小企業(yè)可以直接使用其模型，極大降低了很多企業(yè)的研發(fā)成本。

相比之下，OpenAI和谷歌等旗下的AI產(chǎn)品都是閉源，DeepSeek的開源和低價(jià)策略，對(duì)于國際上那些依靠高收費(fèi)的主流AI工具，也將帶來巨大沖擊。

DeepSeek并不是個(gè)例，在開源浪潮席卷全球的時(shí)代，meta的LLaMA、阿里的通義千問，都在試圖證明開放才能贏未來。甚至就連馬斯克也是開源技術(shù)的支持者，此前曾批評(píng)OpenAI走向閉源，稱其為CloseAI，并指責(zé)其違背了最初的開源初衷而奧特曼則是埋頭向前，繼續(xù)閉源。這個(gè)爭議還不僅是打口水仗，還曾對(duì)薄公庭。

但盡管如此，依然也有不少業(yè)內(nèi)人士對(duì)此嗤之以鼻。

去年，有行業(yè)人士表示：閉源大模型，才是AI商業(yè)化的最優(yōu)解。

究其原因，開源模型仍有致命傷：所謂模型開源，往往只提供了模型的大量參數(shù)。但想要有效應(yīng)用這些模型，還需要進(jìn)行很多后續(xù)工作。即便公布參數(shù)，開發(fā)者仍難窺見參數(shù)的生成過程和數(shù)據(jù)源等核心配方。這種半透明狀態(tài)，導(dǎo)致二次開發(fā)如同盲人摸象。

由于不了解這些參數(shù)的生成過程和數(shù)據(jù)源，難以直接實(shí)現(xiàn)‘眾人拾柴火焰高’的協(xié)同效應(yīng)。即使獲取了模型源代碼，也可能不清楚訓(xùn)練這些參數(shù)所使用的具體數(shù)量和比例。因此，拿到這些開源資料，并不足以讓人直接站在巨人的肩膀上輕松進(jìn)行迭代與開發(fā)。

這也是為什么OpenAI能夠通過閉源在一定時(shí)間內(nèi)保持了技術(shù)的領(lǐng)先性和獨(dú)特性，構(gòu)建了自己的商業(yè)生態(tài)的原因之一。

另外，在醫(yī)療、金融等高敏感領(lǐng)域，閉源優(yōu)勢還可以在保護(hù)技術(shù)和商業(yè)利益方面有其獨(dú)特作用，能保障知識(shí)產(chǎn)權(quán)安全，防止技術(shù)濫用。

但不可否認(rèn)的是，DeepSeek的確迎來了填補(bǔ)生態(tài)位的絕佳機(jī)會(huì)。

在和暗涌的采訪里，梁文鋒就表示，長遠(yuǎn)來說，我們希望形成一種生態(tài)，就是業(yè)界直接使用我們的技術(shù)和產(chǎn)出，我們只負(fù)責(zé)基礎(chǔ)模型和前沿的創(chuàng)新，然后其它公司在DeepSeek的基礎(chǔ)上構(gòu)建toB、toC的業(yè)務(wù)。

用戶無需付費(fèi)即可享受強(qiáng)大AI推理能力，推動(dòng)AI技術(shù)普及，讓普通用戶在日常工作生活中體驗(yàn)前沿科技的便利。在開源生態(tài)上，它已吸引大量開發(fā)者，形成了蓬勃發(fā)展的社區(qū)。隨著越來越多的開發(fā)者和企業(yè)認(rèn)可開源模式，DeepSeek有望進(jìn)一步擴(kuò)大其影響力，重塑AI產(chǎn)業(yè)格局。

03 一場DeepSeek風(fēng)暴，揭開中美AI敘事重心的搖擺

實(shí)際上，在全球矚目的目光聚焦于DeepSeek出圈的背后，從技術(shù)領(lǐng)域、產(chǎn)業(yè)范疇到資本市場，DeepSeek都以非凡之勢打破了人們對(duì)AI發(fā)展的固有認(rèn)知，掀起了一場前所未有的技術(shù)變革浪潮，在某種程度上預(yù)示著算力軍備競賽的終結(jié)。

長期以來，AI行業(yè)形成了一種依賴大規(guī)模算力與巨額資金投入的研發(fā)模式。以O(shè)penAI等公司為例，它們?cè)谀Ｐ陀?xùn)練上動(dòng)輒投入數(shù)億美元，大規(guī)模采購英偉達(dá)最頂尖的GPU芯片，致力于構(gòu)建龐大的數(shù)據(jù)中心。英偉達(dá)憑借早期賣顯卡的業(yè)務(wù)基礎(chǔ)，順勢踏上AI算力的發(fā)展大潮，締造了算力芯片領(lǐng)域的商業(yè)神話。一時(shí)間，谷歌、OpenAI、蘋果等各路科技巨頭紛紛排隊(duì)向英偉達(dá)輸送資金，使其在AI算力市場占據(jù)了主導(dǎo)地位。

然而，DeepSeek卻以顛覆性的創(chuàng)新打破了這一格局。它僅使用2000塊芯片，投入不到600萬美元，就實(shí)現(xiàn)了與行業(yè)巨頭相媲美的性能。這一成果引發(fā)了行業(yè)的深刻反思：如果DeepSeek的創(chuàng)新是真實(shí)有效的，那AI公司真的還需要如此大量的顯卡嗎？當(dāng)英偉達(dá)還在為每秒200TB的顯存帶寬而自鳴得意時(shí)，DeepSeek用一行開源代碼有力地證明了：真正的人工智能不應(yīng)被算力所束縛。

根據(jù)全球半導(dǎo)體觀察的不完全統(tǒng)計(jì)，目前已有包括英偉達(dá)、AMD、微軟、亞馬遜云科技、英特爾等國外巨頭，沐曦、天數(shù)智芯、摩爾線程、海光信息等國內(nèi)GPU企業(yè)，華為云、騰訊云、天翼云、阿里云、百度智能云、火山引擎等云計(jì)算大廠，以及無問芯穹、壁仞科技、硅基流動(dòng)、PPIO派歐云、云軸科技等共計(jì)20家企業(yè)宣布適配及上架DeepSeek模型服務(wù)。隨著多家國內(nèi)外知名云平臺(tái)和科技企業(yè)相繼上線DeepSeek大模型，AI市場迎來了新一輪的變革浪潮。

從另一方面看，英偉達(dá)股價(jià)的大幅下跌恰恰而言折射出的是在經(jīng)受DeepSeek風(fēng)暴沖擊下其AI芯片霸權(quán)的逐漸被終結(jié)。正如塔勒布現(xiàn)任對(duì)沖基金Universa Investments的顧問的警告，當(dāng)英偉達(dá)把一切都建立在人們會(huì)使用你的芯片的希望之上，希望需求持續(xù)增加，同時(shí)假設(shè)不會(huì)出現(xiàn)軟件上的革命性改進(jìn)或其他創(chuàng)新方法。而現(xiàn)在，這些假設(shè)受到挑戰(zhàn)，未來或?qū)⒊霈F(xiàn)數(shù)倍于當(dāng)前跌幅的回調(diào)。

值得關(guān)注的是，DeepSeek帶來的這種技術(shù)路徑的轉(zhuǎn)變，不僅是對(duì)美國科技霸權(quán)的有力回?fù)?，也讓全球開發(fā)者重新認(rèn)識(shí)到中國AI的巨大潛力。在美國不斷通過各種限令限制中國AI和芯片發(fā)展的背景下，這場由中國團(tuán)隊(duì)發(fā)起的效率革命，或許將重現(xiàn)電動(dòng)車顛覆燃油車的精彩歷程——以更低的成本、更開放的生態(tài)，讓AI從美國巨頭的專屬玩具轉(zhuǎn)變?yōu)槿衿栈莸膶?shí)用工具。

正如DeepSeek技術(shù)白皮書扉頁所寫：我們并非在追趕GPT，而是在證明：通向AGI的道路，絕不止硅谷這一種走法。從產(chǎn)業(yè)發(fā)展的角度來看，隨著DeepSeek不斷發(fā)展壯大，未來將逐步采用更多國產(chǎn)芯片，有效降低產(chǎn)業(yè)鏈風(fēng)險(xiǎn)。在DeepSeek的引領(lǐng)下，國產(chǎn)芯片有望逐步從中低端邁向高端，最終擺脫對(duì)美國芯片的依賴，在全球AI產(chǎn)業(yè)中占據(jù)更為重要的地位。

看完覺得寫得好的，不防打賞一元，以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽：標(biāo)簽內(nèi)容隨筆