DeepSeek，把國產(chǎn)AI的想象力拉滿了

藍(lán)海情報(bào)網(wǎng) 2025-02-07 13:08:50 816

是最好的時(shí)代，也是最卷的時(shí)代。

@數(shù)科星球DigitalPlanet原創(chuàng)

作者丨嘟嘟與石榴

編輯丨大兔

2025年的新年，人們十足地過了一把AI年。除了機(jī)器人和無人機(jī)地表演外，最炸裂的莫過于DeepSeek了。

目前，該模型受到世界范圍內(nèi)的用戶青睞。其中，在Token價(jià)格方面，DeepSeek-R1相對于OpenAI的o3-mini低約50%。

在日活躍用戶方面，業(yè)界統(tǒng)計(jì)，前者已在短時(shí)間之內(nèi)達(dá)到2215萬，距離ChatGPT的5323萬已達(dá)到其41.6%。順理成章地，DeepSeek成為歷史上用戶增長最快的AI產(chǎn)品。

一些受訪者對DeepSeek的用戶增長十分自信，并表示其可能會成為世界上用戶量最大的AI產(chǎn)品。

現(xiàn)在，人們在用它學(xué)習(xí)外語、診斷姻緣甚至玄學(xué)算命（部分功能受限）。它的回答更懂國人，相當(dāng)多的人已經(jīng)形成了DeepSeek依賴。

從對于AI行業(yè)發(fā)展的結(jié)果來看，DeepSeek所帶來的影響正在釋放。首先，它降低了AI應(yīng)用的算力成本。很多以前只能用‘H卡’（英偉達(dá)H系列GPU）跑的需求，現(xiàn)在4090就能跑。一位從業(yè)者回答。

其次是，對比其他家流量較小的開源模型，DeepSeek正在展現(xiàn)出十足商業(yè)潛力。

但目前，全民DeepSeek的熱潮下，仍不足以打破英偉達(dá)等AI巨頭的壟斷，而國產(chǎn)卡的未來仍然任重道遠(yuǎn)。

DeepSeek，把國產(chǎn)AI的想象力拉滿了

01 DeepSeek是對AI行業(yè)的利好

西安電子科技大學(xué)電子工程學(xué)院教授、博士生導(dǎo)師吳家驥認(rèn)為，DeepSeek出現(xiàn)后，美國科技頭牌企業(yè)構(gòu)筑的壟斷門檻邏輯出現(xiàn)問題。

過去，OpenAI等公司在研發(fā)上投入巨大，但DeepSeek以極低的訓(xùn)練成本實(shí)現(xiàn)了與行業(yè)領(lǐng)先水平相當(dāng)?shù)哪Ｐ托Ч?。這表明，高投入并非實(shí)現(xiàn)技術(shù)突破的唯一路徑。

一位前小米高管認(rèn)為，DeepSeek最大的價(jià)值在于算法。

技術(shù)上，DeepSeek在算法和工程方面圍繞MoE（混合專家模型）進(jìn)行了創(chuàng)新，從V2的160個(gè)專家擴(kuò)展到V3的256個(gè)專家，實(shí)現(xiàn)671B參數(shù)量下僅需激活37B參數(shù)的高效運(yùn)算，突破了MoE模型此前訓(xùn)練難度大的限制。

直接影響是，它削弱了美國閉源模型的市場競爭力。

龐大的日活用戶和幾次封禁DeepSeek的失敗，讓AI人才有了逆流之勢。據(jù)了解，在關(guān)于DeepSeek的制裁令發(fā)布后72小時(shí)內(nèi)，DeepSeek硅谷研究院收到327份來自美國頭部科技公司的求職申請，包括17名meta首席工程師。

青云科技市場總監(jiān)王玉圓認(rèn)為，ChatGPT是行業(yè)的第一把火，而DeepSeek是另一個(gè)里程碑。

在她看來，在開源領(lǐng)域，meta的Llama也沒有達(dá)到如此熱度。最為重要的是，DeepSeek所引導(dǎo)的低成本、高性價(jià)比模型將催生AI發(fā)展的下一輪百花齊放。這無疑是對做AI應(yīng)用和個(gè)人開發(fā)者的重大利好，她補(bǔ)充。

一位AI應(yīng)用開發(fā)者對數(shù)科星球DigitalPlanet稱，他曾嘗試用8G顯存的筆記本電腦跑DeepSeek7B私有部署大模型。雖然只是理論上能跑，具體效果還不甚理想，但他已經(jīng)非常感動了。

因?yàn)?，一旦未來該款大模型可進(jìn)行進(jìn)一步的向下兼容，那么他將不需為GPU算力公司繳納高昂的算力費(fèi)用。

他向數(shù)科星球DigitalPlanet展示了自己正在開發(fā)的自動考試和做題軟件。需要用到實(shí)時(shí)算力以生成考試題，在他看來，這種項(xiàng)目要求算力水平不高，如果算力問題解決，那么會成為頗受歡迎的AI應(yīng)用。

王玉圓認(rèn)為，AI算力成本的下降會催生更多AI應(yīng)用的誕生，所有的應(yīng)用都會用生成式AI的邏輯再做一遍（從春節(jié)期間，人們在各種領(lǐng)域的嘗試，可見一斑）。

而同時(shí)，因?yàn)閲a(chǎn)和私有部署的緣故，以往對AI較為保守的ToB客戶的熱情也在被調(diào)動。一些從業(yè)者的回復(fù)稱，新年開年上班第一天，他所在的公司已在著手推動新的AI產(chǎn)品采購計(jì)劃。

所以，可以說，DeepSeek的火爆，是對AI行業(yè)的利好。

DeepSeek，把國產(chǎn)AI的想象力拉滿了

02 DeepSeek刺激了算力行業(yè)發(fā)展

DeepSeek對算力供應(yīng)商而言，展現(xiàn)了驚人的鲇魚效應(yīng)。

一位算力行業(yè)從業(yè)者提到，以前，要租一個(gè)算力機(jī)柜要5年起租。

據(jù)數(shù)科星球DigitalPlanet計(jì)算，彼時(shí)便宜的算力機(jī)柜可能每月3000元左右，5年總價(jià)約18萬元；貴的如一些一線城市核心地段、高功率、高配置并帶有優(yōu)質(zhì)服務(wù)和高帶寬的機(jī)柜，每月可能12,000元甚至更高，5年總價(jià)約72萬元及以上。

而現(xiàn)在，用戶已可以選擇按Token計(jì)費(fèi)、按算力計(jì)費(fèi)（選卡，選租賃時(shí)間）兩種模式。所以，大面積的AI開發(fā)者的加入、算力成本的下降加之性能優(yōu)化可能讓閑置算力得到再次利用。

DeepSeek的火爆有可能改善目前智算中心的經(jīng)營模式，一位前IDC從業(yè)者透露。在他看來，目前的智算中心雖搭建頗多，但運(yùn)營情況不佳。我估計(jì)，80%的國產(chǎn)算力卡都在閑置，但凡能租賃的算力都是英偉達(dá)卡。

這種閑置的規(guī)模頗大，他透露，一些智算中心甚至有50%是國產(chǎn)卡（硬性要求）。在過去，國產(chǎn)卡在訓(xùn)練的效果不佳，只能分擔(dān)一些推理需求（大模型共分訓(xùn)練和推理兩個(gè)使用算力的場景）。

不過在算力出現(xiàn)新的使用方式后，國產(chǎn)卡的使用率有可能提升。

吳家驥認(rèn)為，作為大模型廠商而言，不選擇國產(chǎn)卡的理由是盡量減少折騰，模型廠商更需要穩(wěn)妥方案、專心研究模型技術(shù)而不是和GPU廠家搞適配。

那么DeepSeek是怎么做出來的？

一些專家指出，它使用了PTX（比CUDA更底層）而不是完全使用CUDA（英偉達(dá)深度學(xué)習(xí)的生態(tài)系統(tǒng)）。

PTX允許開發(fā)者對GPU進(jìn)行更細(xì)粒度的控制，能更精準(zhǔn)地調(diào)度計(jì)算任務(wù)，實(shí)現(xiàn)更高效的計(jì)算資源利用。在處理大規(guī)模分布式訓(xùn)練時(shí)，可避開CUDA框架的抽象層，減少潛在的效率損失，有數(shù)據(jù)表明PTX優(yōu)化可提升約16%的理論算力。

影響是，在當(dāng)前國產(chǎn)GPU發(fā)展的背景下使用PTX，便于DeepSeek未來適配國產(chǎn)GPU。它只需了解國產(chǎn)硬件驅(qū)動提供的基本函數(shù)接口，就可仿照英偉達(dá)GPU硬件的編程接口編寫相關(guān)代碼，為國產(chǎn)GPU的軟件兼容性突破提供參考。

吳家驥認(rèn)為，DeepSeek之所以選用PTX技術(shù)，反而是因?yàn)樗麄儧]有足夠多的卡。如果卡夠多，也不會考慮的，他說。

應(yīng)該說，從這個(gè)角度而言，DeepSeek的最大貢獻(xiàn)是，可以讓廠商選擇非英偉達(dá)硬件時(shí)也可以高效運(yùn)行模型。

當(dāng)然，至少目前想要沖擊英偉達(dá)的市場，還需不斷完善生態(tài)。在DeepSeek的刺激下，目前一些對成本敏感或有自主可控需求的用戶，可能會更傾向于選擇國產(chǎn)GPU產(chǎn)品。

總而言之，可以肯定的是，DeepSeek的出現(xiàn)可以在一定程度上緩解高端GPU禁售的影響。

DeepSeek，把國產(chǎn)AI的想象力拉滿了

03 端側(cè)模型：AI硬件的新想象

DeepSeek的遠(yuǎn)期影響是AI硬件。長久以來，端側(cè)模型成為了制約AI硬件發(fā)展的桎梏。而目前，這種情況有望緩解。

現(xiàn)在，手機(jī)的顯存通常在4GB-12GB之間。中高端手機(jī)為例，真正能分配給模型的顯存可能僅在2GB-4GB左右。由于手機(jī)散熱、功耗等方面的限制，長時(shí)間高負(fù)載運(yùn)行大顯存模型會導(dǎo)致手機(jī)發(fā)熱嚴(yán)重、電量消耗過快，影響用戶體驗(yàn)。

而由于更便宜、更好用的大模型到來后，AI硬件的大面積改良或?qū)⒊蔀榭赡堋?/p>

一位AI硬件創(chuàng)業(yè)者指出，DeepSeek的出現(xiàn)改變了AI硬件在大模型行業(yè)發(fā)展的方向。其中，眾多團(tuán)隊(duì)開始向算法效率優(yōu)化傾斜。

在未來可預(yù)期的范圍內(nèi)，針對AI硬件的算法將出現(xiàn)海量迭代。

此外，由于DeepSeek的推理成本降至OpenAI模型的1/50，使得AI手機(jī)、AI眼鏡、智能穿戴等設(shè)備能夠采用低功耗芯片實(shí)現(xiàn)高性能AI功能。

所以硬件的開發(fā)門檻也被降低了。

正如上文所述，在海量AI應(yīng)用呼之欲出之際，將倒逼AI硬件的進(jìn)化。有樂觀人士稱，端側(cè)智能與國產(chǎn)替代將成為新的核心增長引擎。

關(guān)于DeepSeek的影響，你還知道哪些？

看完覺得寫得好的，不防打賞一元，以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽：標(biāo)簽內(nèi)容隨筆