国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

藍(lán)海情報(bào)網(wǎng)

DeepSeek,把國產(chǎn)AI的想象力拉滿了

藍(lán)海情報(bào)網(wǎng) 816

DeepSeek,把國產(chǎn)AI的想象力拉滿了

是最好的時(shí)代,也是最卷的時(shí)代。

@數(shù)科星球DigitalPlanet原創(chuàng)

作者丨嘟嘟與石榴

編輯丨大兔

2025年的新年,人們十足地過了一把AI年。除了機(jī)器人和無人機(jī)地表演外,最炸裂的莫過于DeepSeek了。

目前,該模型受到世界范圍內(nèi)的用戶青睞。其中,在Token價(jià)格方面,DeepSeek-R1相對于OpenAI的o3-mini低約50%。

在日活躍用戶方面,業(yè)界統(tǒng)計(jì),前者已在短時(shí)間之內(nèi)達(dá)到2215萬,距離ChatGPT的5323萬已達(dá)到其41.6%。順理成章地,DeepSeek成為歷史上用戶增長最快的AI產(chǎn)品。

一些受訪者對DeepSeek的用戶增長十分自信,并表示其可能會成為世界上用戶量最大的AI產(chǎn)品。

現(xiàn)在,人們在用它學(xué)習(xí)外語、診斷姻緣甚至玄學(xué)算命(部分功能受限)。它的回答更懂國人,相當(dāng)多的人已經(jīng)形成了DeepSeek依賴。

從對于AI行業(yè)發(fā)展的結(jié)果來看,DeepSeek所帶來的影響正在釋放。首先,它降低了AI應(yīng)用的算力成本。很多以前只能用‘H卡’(英偉達(dá)H系列GPU)跑的需求,現(xiàn)在4090就能跑。一位從業(yè)者回答。

其次是,對比其他家流量較小的開源模型,DeepSeek正在展現(xiàn)出十足商業(yè)潛力。

但目前,全民DeepSeek的熱潮下,仍不足以打破英偉達(dá)等AI巨頭的壟斷,而國產(chǎn)卡的未來仍然任重道遠(yuǎn)。

DeepSeek,把國產(chǎn)AI的想象力拉滿了

01 DeepSeek是對AI行業(yè)的利好

西安電子科技大學(xué)電子工程學(xué)院教授、博士生導(dǎo)師吳家驥認(rèn)為,DeepSeek出現(xiàn)后,美國科技頭牌企業(yè)構(gòu)筑的壟斷門檻邏輯出現(xiàn)問題。

過去,OpenAI等公司在研發(fā)上投入巨大,但DeepSeek以極低的訓(xùn)練成本實(shí)現(xiàn)了與行業(yè)領(lǐng)先水平相當(dāng)?shù)哪P托Ч?。這表明,高投入并非實(shí)現(xiàn)技術(shù)突破的唯一路徑。

一位前小米高管認(rèn)為,DeepSeek最大的價(jià)值在于算法。

技術(shù)上,DeepSeek在算法和工程方面圍繞MoE(混合專家模型)進(jìn)行了創(chuàng)新,從V2的160個(gè)專家擴(kuò)展到V3的256個(gè)專家,實(shí)現(xiàn)671B參數(shù)量下僅需激活37B參數(shù)的高效運(yùn)算,突破了MoE模型此前訓(xùn)練難度大的限制。

直接影響是,它削弱了美國閉源模型的市場競爭力。

龐大的日活用戶和幾次封禁DeepSeek的失敗,讓AI人才有了逆流之勢。據(jù)了解,在關(guān)于DeepSeek的制裁令發(fā)布后72小時(shí)內(nèi),DeepSeek硅谷研究院收到327份來自美國頭部科技公司的求職申請,包括17名meta首席工程師。

青云科技市場總監(jiān)王玉圓認(rèn)為,ChatGPT是行業(yè)的第一把火,而DeepSeek是另一個(gè)里程碑。

在她看來,在開源領(lǐng)域,meta的Llama也沒有達(dá)到如此熱度。最為重要的是,DeepSeek所引導(dǎo)的低成本、高性價(jià)比模型將催生AI發(fā)展的下一輪百花齊放。這無疑是對做AI應(yīng)用和個(gè)人開發(fā)者的重大利好,她補(bǔ)充。

一位AI應(yīng)用開發(fā)者對數(shù)科星球DigitalPlanet稱,他曾嘗試用8G顯存的筆記本電腦跑DeepSeek7B私有部署大模型。雖然只是理論上能跑,具體效果還不甚理想,但他已經(jīng)非常感動了。

因?yàn)?,一旦未來該款大模型可進(jìn)行進(jìn)一步的向下兼容,那么他將不需為GPU算力公司繳納高昂的算力費(fèi)用。

他向數(shù)科星球DigitalPlanet展示了自己正在開發(fā)的自動考試和做題軟件。需要用到實(shí)時(shí)算力以生成考試題,在他看來,這種項(xiàng)目要求算力水平不高,如果算力問題解決,那么會成為頗受歡迎的AI應(yīng)用。

王玉圓認(rèn)為,AI算力成本的下降會催生更多AI應(yīng)用的誕生,所有的應(yīng)用都會用生成式AI的邏輯再做一遍(從春節(jié)期間,人們在各種領(lǐng)域的嘗試,可見一斑)。

而同時(shí),因?yàn)閲a(chǎn)和私有部署的緣故,以往對AI較為保守的ToB客戶的熱情也在被調(diào)動。一些從業(yè)者的回復(fù)稱,新年開年上班第一天,他所在的公司已在著手推動新的AI產(chǎn)品采購計(jì)劃。

所以,可以說,DeepSeek的火爆,是對AI行業(yè)的利好。

DeepSeek,把國產(chǎn)AI的想象力拉滿了

02 DeepSeek刺激了算力行業(yè)發(fā)展

DeepSeek對算力供應(yīng)商而言,展現(xiàn)了驚人的鲇魚效應(yīng)。

一位算力行業(yè)從業(yè)者提到,以前,要租一個(gè)算力機(jī)柜要5年起租。

據(jù)數(shù)科星球DigitalPlanet計(jì)算,彼時(shí)便宜的算力機(jī)柜可能每月3000元左右,5年總價(jià)約18萬元;貴的如一些一線城市核心地段、高功率、高配置并帶有優(yōu)質(zhì)服務(wù)和高帶寬的機(jī)柜,每月可能12,000元甚至更高,5年總價(jià)約72萬元及以上。

而現(xiàn)在,用戶已可以選擇按Token計(jì)費(fèi)、按算力計(jì)費(fèi)(選卡,選租賃時(shí)間)兩種模式。所以,大面積的AI開發(fā)者的加入、算力成本的下降加之性能優(yōu)化可能讓閑置算力得到再次利用。

DeepSeek的火爆有可能改善目前智算中心的經(jīng)營模式,一位前IDC從業(yè)者透露。在他看來,目前的智算中心雖搭建頗多,但運(yùn)營情況不佳。我估計(jì),80%的國產(chǎn)算力卡都在閑置,但凡能租賃的算力都是英偉達(dá)卡。

這種閑置的規(guī)模頗大,他透露,一些智算中心甚至有50%是國產(chǎn)卡(硬性要求)。在過去,國產(chǎn)卡在訓(xùn)練的效果不佳,只能分擔(dān)一些推理需求(大模型共分訓(xùn)練和推理兩個(gè)使用算力的場景)。

不過在算力出現(xiàn)新的使用方式后,國產(chǎn)卡的使用率有可能提升。

吳家驥認(rèn)為,作為大模型廠商而言,不選擇國產(chǎn)卡的理由是盡量減少折騰,模型廠商更需要穩(wěn)妥方案、專心研究模型技術(shù)而不是和GPU廠家搞適配。

那么DeepSeek是怎么做出來的?

一些專家指出,它使用了PTX(比CUDA更底層)而不是完全使用CUDA(英偉達(dá)深度學(xué)習(xí)的生態(tài)系統(tǒng))。

PTX允許開發(fā)者對GPU進(jìn)行更細(xì)粒度的控制,能更精準(zhǔn)地調(diào)度計(jì)算任務(wù),實(shí)現(xiàn)更高效的計(jì)算資源利用。在處理大規(guī)模分布式訓(xùn)練時(shí),可避開CUDA框架的抽象層,減少潛在的效率損失,有數(shù)據(jù)表明PTX優(yōu)化可提升約16%的理論算力。

影響是,在當(dāng)前國產(chǎn)GPU發(fā)展的背景下使用PTX,便于DeepSeek未來適配國產(chǎn)GPU。它只需了解國產(chǎn)硬件驅(qū)動提供的基本函數(shù)接口,就可仿照英偉達(dá)GPU硬件的編程接口編寫相關(guān)代碼,為國產(chǎn)GPU的軟件兼容性突破提供參考。

吳家驥認(rèn)為,DeepSeek之所以選用PTX技術(shù),反而是因?yàn)樗麄儧]有足夠多的卡。如果卡夠多,也不會考慮的,他說。

應(yīng)該說,從這個(gè)角度而言,DeepSeek的最大貢獻(xiàn)是,可以讓廠商選擇非英偉達(dá)硬件時(shí)也可以高效運(yùn)行模型。

當(dāng)然,至少目前想要沖擊英偉達(dá)的市場,還需不斷完善生態(tài)。在DeepSeek的刺激下,目前一些對成本敏感或有自主可控需求的用戶,可能會更傾向于選擇國產(chǎn)GPU產(chǎn)品。

總而言之,可以肯定的是,DeepSeek的出現(xiàn)可以在一定程度上緩解高端GPU禁售的影響。

DeepSeek,把國產(chǎn)AI的想象力拉滿了

03 端側(cè)模型:AI硬件的新想象

DeepSeek的遠(yuǎn)期影響是AI硬件。長久以來,端側(cè)模型成為了制約AI硬件發(fā)展的桎梏。而目前,這種情況有望緩解。

現(xiàn)在,手機(jī)的顯存通常在4GB-12GB之間。中高端手機(jī)為例,真正能分配給模型的顯存可能僅在2GB-4GB左右。由于手機(jī)散熱、功耗等方面的限制,長時(shí)間高負(fù)載運(yùn)行大顯存模型會導(dǎo)致手機(jī)發(fā)熱嚴(yán)重、電量消耗過快,影響用戶體驗(yàn)。

而由于更便宜、更好用的大模型到來后,AI硬件的大面積改良或?qū)⒊蔀榭赡堋?/p>

一位AI硬件創(chuàng)業(yè)者指出,DeepSeek的出現(xiàn)改變了AI硬件在大模型行業(yè)發(fā)展的方向。其中,眾多團(tuán)隊(duì)開始向算法效率優(yōu)化傾斜。

在未來可預(yù)期的范圍內(nèi),針對AI硬件的算法將出現(xiàn)海量迭代。

此外,由于DeepSeek的推理成本降至OpenAI模型的1/50,使得AI手機(jī)、AI眼鏡、智能穿戴等設(shè)備能夠采用低功耗芯片實(shí)現(xiàn)高性能AI功能。

所以硬件的開發(fā)門檻也被降低了。

正如上文所述,在海量AI應(yīng)用呼之欲出之際,將倒逼AI硬件的進(jìn)化。有樂觀人士稱,端側(cè)智能與國產(chǎn)替代將成為新的核心增長引擎。

關(guān)于DeepSeek的影響,你還知道哪些?

看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽:

ad2

推薦內(nèi)容