国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

藍(lán)海情報(bào)網(wǎng)

AI教母李飛飛祛魅算力討巧,DeepSeek算法和成

藍(lán)海情報(bào)網(wǎng) 258

AI教母李飛飛祛魅算力討巧,DeepSeek算法和成

文/Leon

編輯/cc孫聰穎‍

DeepSeek的持續(xù)火爆,被廣泛認(rèn)為是中國(guó)AI大模型的彎道超車,其最大的意義是打破了物理算力至上的邏輯,用更低的成本訓(xùn)練出高性能AI大模型,對(duì)行業(yè)領(lǐng)頭羊OpenAI產(chǎn)生巨大沖擊。

自2025年1月末上線以來(lái),基于DeepSeek V3模型的DeepSeek官方App下載量飆升,目前已經(jīng)登頂全球140多個(gè)國(guó)家應(yīng)用商店,日活突破2000萬(wàn),在多個(gè)國(guó)家及地區(qū)取代ChatGPT成為最受歡迎的AI應(yīng)用。

人紅是非多。很快,DeepSeek的高效、低成本遭遇質(zhì)疑,包括馬斯克等科技大佬紛紛下場(chǎng)表態(tài),認(rèn)為DeepSeek不可能突破算力瓶頸。

‍‍‍‍‍‍‍DeepSeek的爭(zhēng)議:創(chuàng)新還是取巧

訓(xùn)練大模型需要算力,算力則是通過(guò)英偉達(dá)AI顯卡實(shí)現(xiàn)。以馬斯克xAI的全球最大超級(jí)計(jì)算中心Supercluster為例,該集群由10萬(wàn)個(gè)液冷英偉達(dá)H100 GPU組成,價(jià)值超40億美元。同樣,OpenAI、meta、亞馬遜等企業(yè)的AI投入,也都以數(shù)億美元起計(jì)算。

沒有算力,開發(fā)不出高性能的大模型;算力需要英偉達(dá)高性能AI顯卡,不僅奇貨可居,還針對(duì)中國(guó)市場(chǎng)進(jìn)行限制,只向中國(guó)市場(chǎng)銷售低性能的閹割版本,比如特供版H800,性能明顯低于通用版H100。因此,按照上述邏輯來(lái)說(shuō),DeepSeek這樣同時(shí)具有高性能、低算力成本的大模型,是不應(yīng)該出現(xiàn)的。

AI教母李飛飛祛魅算力討巧,DeepSeek算法和成

圖:xAI旗下Supercluste超算中心

據(jù)了解,DeepSeek-V3模型僅使用了2048塊H800的芯片、歷經(jīng)兩個(gè)月,便實(shí)現(xiàn)了6710億參數(shù)的訓(xùn)練成果。相比之下,meta的Llama 3訓(xùn)練參數(shù)為4050億,則需要16384塊性能更強(qiáng)的H100芯片、耗時(shí)54天才能完成訓(xùn)練, DeepSeek的訓(xùn)練效率提升了11倍。

目前,對(duì)于DeepSeek算力爭(zhēng)議眾說(shuō)紛紜,《華爾街科技眼》匯總了各方觀點(diǎn)。

第一種觀點(diǎn),是DeepSeek隱瞞了其訓(xùn)練模型的真實(shí)算力,馬斯克便是其中之一。據(jù)美媒報(bào)道,美國(guó)白宮和FBI正展開調(diào)查 DeepSeek是否透過(guò)新加坡作為中轉(zhuǎn)站獲得H100顯卡。所謂的疑點(diǎn)來(lái)自英偉達(dá)財(cái)報(bào),其2023 財(cái)年第三財(cái)季新加坡營(yíng)收占比僅為9%;而在美國(guó)升級(jí)對(duì)華AI芯片出口管制之后,新加坡在英偉達(dá)2025 財(cái)年第三財(cái)季的營(yíng)收占比提升至22%。

對(duì)此,英偉達(dá)方面簡(jiǎn)稱公司遵循所有法律要求,表示新加坡是主要的交易中轉(zhuǎn)站,英偉達(dá)是在此統(tǒng)計(jì)銷售額,并不代表產(chǎn)品的實(shí)際最終使用地點(diǎn)。

第二種觀點(diǎn),是OpenAI主張的數(shù)據(jù)蒸餾觀點(diǎn)。DeepSeek的大模型均為開源,在使用指南中也提及到數(shù)據(jù)蒸餾,但數(shù)據(jù)蒸餾在訓(xùn)練大模型中是常見的手段,關(guān)鍵爭(zhēng)議在于DeepSeek是否使用了OpenAI的閉源數(shù)據(jù)。ChatGPT分為多個(gè)版本,只有GPT 2時(shí)期短暫開源,后續(xù)的 3.5/4.0等均不再開源。至截稿前,OpenAI方面未發(fā)布相關(guān)的調(diào)查結(jié)果。

AI教母李飛飛祛魅算力討巧,DeepSeek算法和成

DeepSeek與OpenAI大模型基準(zhǔn)性能測(cè)試對(duì)比

第三種觀點(diǎn),即DeepSeek的創(chuàng)新實(shí)際上是思路上的改變,通過(guò)算法上的優(yōu)化降低物理算力成本。此觀點(diǎn)也獲得了一些AI權(quán)威的認(rèn)同。人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的權(quán)威學(xué)者、曾任百度首席科學(xué)家的吳恩達(dá)認(rèn)為,DeepSeek通過(guò)算法創(chuàng)新而非純粹的算力,為AI領(lǐng)域帶來(lái)了新的思路轉(zhuǎn)變,包括專注效率而非規(guī)模的理念、降低AI應(yīng)用的構(gòu)建門檻等等,將對(duì)AI企業(yè)的商業(yè)決策產(chǎn)生深遠(yuǎn)影響。

吳恩達(dá)的觀點(diǎn)很快得到了印證。最新消息稱,AI教母李飛飛團(tuán)隊(duì)和華盛頓大學(xué)研究人員近日以不到50美元的云計(jì)算費(fèi)用訓(xùn)練出一個(gè)名為S1的人工智能推理模型,其數(shù)學(xué)和編碼能力在測(cè)試中的表現(xiàn)達(dá)到了OpenAI o1和DeepSeek R1的水平。

需要指出的是,S1模型是使用了16個(gè)英偉達(dá)H100顯卡、通過(guò)數(shù)據(jù)蒸餾谷歌Gemini 2.0 Flash Thinking Experimenta多模態(tài)模型,耗時(shí)26分鐘完成訓(xùn)練。不到50美元的成本僅計(jì)算了云服務(wù)費(fèi)用,不包括顯卡、服務(wù)器等其他硬件費(fèi)用。

李飛飛團(tuán)隊(duì)成功訓(xùn)練出成本不足 50 美元的人工智能模型,有力地打破了 DeepSeek R1 身上那層被過(guò)度神化的光環(huán),讓業(yè)界對(duì)其有了更為客觀、理性的認(rèn)知。

DeepSeek遭多個(gè)國(guó)家局部封禁

神秘面紗已經(jīng)褪去,算力爭(zhēng)議仍存在,隨之而來(lái)的,便是以數(shù)據(jù)安全為由的各種調(diào)查以及針對(duì)性措施。據(jù)《路透社》2月6日?qǐng)?bào)道稱,韓國(guó)產(chǎn)業(yè)通商資源部一位官員表示,出于安全因素,該部門已暫時(shí)禁止員工訪問DeepSeek。此前,韓國(guó)政府在4日發(fā)布通知,呼吁各個(gè)政府部門員工在工作中謹(jǐn)慎使用AI應(yīng)用,包括ChatGPT及DeepSeek。目前,尚不明確上述部門是否同樣禁用ChatGPT。

韓國(guó)并非首個(gè)在政府部門禁用DeepSeek的國(guó)家。據(jù)新加坡《聯(lián)合早報(bào)》報(bào)道,2月5日,澳大利亞以國(guó)家安全為由,禁止在政府設(shè)備上使用DeepSeek。

據(jù)悉,澳大利亞內(nèi)政部長(zhǎng)托尼·伯克在一份聲明中指出,根據(jù)澳大利亞情報(bào)機(jī)構(gòu)的威脅評(píng)估,DeepSeek相關(guān)技術(shù)獎(jiǎng)構(gòu)成不可接受的風(fēng)險(xiǎn),主要集中在用戶使用DeepSeek時(shí)上傳的信息可能無(wú)法被妥善保護(hù)、并可能會(huì)讓用戶面臨惡意軟件的風(fēng)險(xiǎn)?;趪?guó)家安全考量,將從政府系統(tǒng)中移除所有DeepSeek產(chǎn)品和相關(guān)服務(wù)。

不過(guò),伯克也表示澳洲政府做出上述決定,是基于風(fēng)險(xiǎn)評(píng)估,而非針對(duì)某個(gè)國(guó)家,旨在保護(hù)澳大利亞政府及其資產(chǎn)免受風(fēng)險(xiǎn)。

美國(guó)方面,部分政府部門也在近日通過(guò)行政命令來(lái)禁止在官方設(shè)備上使用DeepSeek,包括美國(guó)國(guó)防部、國(guó)會(huì)、海軍、NASA以及得克薩斯州政府。

AI教母李飛飛祛魅算力討巧,DeepSeek算法和成

與此同時(shí),美國(guó)方面也在加緊制定相關(guān)政策,限制使用DeepSeek。據(jù)美媒報(bào)道,2月3日,美國(guó)國(guó)會(huì)提出新法案,尋求全面禁止包括DeepSeek在內(nèi)的中國(guó)的先進(jìn)AI模型,下載者將被判處20年監(jiān)禁。當(dāng)然,這只是一份提案,而且過(guò)于極端,即便是美媒都表示該法案不可能通過(guò)。

與上述國(guó)家不同,目前意大利實(shí)施全面封禁DeepSeek的政策。1月28日,意大利隱私監(jiān)管機(jī)構(gòu) Garante要求DeepSeek提供關(guān)于個(gè)人數(shù)據(jù)使用問題的解釋,包括收集了哪些個(gè)人數(shù)據(jù)、收集來(lái)源、收集目的、基于什么法律依據(jù),是否存儲(chǔ)在中國(guó)等。隨后在1月30日,意大利區(qū)蘋果AppStore和谷歌Play商店中的DeepSeek應(yīng)用均被下架,無(wú)法下載。

作為歐盟成員國(guó),意大利先于歐盟封禁DeepSeek是令人有些意外的。歐盟對(duì)中國(guó)跨國(guó)應(yīng)用的態(tài)度一直相對(duì)溫和,雖然Temu、TikTok等應(yīng)用此前也被相關(guān)機(jī)構(gòu)調(diào)查過(guò),但并未采用一刀切的封禁措施。與之相對(duì)的,ChatGPT在意大利并未受到該監(jiān)管組織的質(zhì)疑。

在2月6日的中國(guó)外交部例行記者會(huì)上,有媒體就此事提問,外交部發(fā)言人郭嘉昆表示:我想強(qiáng)調(diào)的是,中國(guó)政府高度重視并依法保護(hù)數(shù)據(jù)隱私和安全,從來(lái)沒有也不會(huì)要求企業(yè)或個(gè)人以違法的形式采集或存儲(chǔ)數(shù)據(jù)。中方一貫反對(duì)泛化國(guó)家安全概念、將經(jīng)貿(mào)科技問題政治化的做法,同時(shí)中方也將堅(jiān)定維護(hù)中國(guó)企業(yè)的合法權(quán)益。

事實(shí)上,部分封禁并沒有阻止DeepDeek在全球市場(chǎng)流行。To C市場(chǎng)方面,據(jù)Appfigures數(shù)據(jù)顯示,DeepSeek App于1月26日首次登頂蘋果App Store,并迅速攀升至140個(gè)國(guó)家及地區(qū)榜首,在發(fā)布的18天內(nèi)實(shí)現(xiàn)1600萬(wàn)次下載,其中印度下載量位居榜首,達(dá)到15.6%。

To B市場(chǎng),包括英偉達(dá)、亞馬遜、微軟等科技巨頭紛紛接入DeepSeek平臺(tái),與西方國(guó)家政府的謹(jǐn)慎態(tài)度形成了鮮明對(duì)比。‍‍‍‍‍‍‍

全球科技巨頭紛紛與DeepSeek合作

與上述三國(guó)政府不同的是,跨國(guó)科技巨頭對(duì)DeepSeek的態(tài)度更加開放,其中也包括受影響最大的英偉達(dá)。

DeepSeek爆火后,一度導(dǎo)致英偉達(dá)單日市值蒸發(fā)約5468億美元(約合3.9萬(wàn)億人民幣),公司總市值降至2.95萬(wàn)億美元。不過(guò),截至美東時(shí)間2025年2月5日,英偉達(dá)股價(jià)再次上漲超5%,市值一夜之間增加了1513億美元(約合1.1萬(wàn)億人民幣),總市值再次突破3萬(wàn)億美元的大關(guān)。

事實(shí)上,英偉達(dá)在1月31日便宣布接入DeepSeek-R1大模型,同時(shí)加入的還有亞馬遜和微軟。

據(jù)英偉達(dá)官方表示,DeepSeek-R1采用大規(guī)模專家混合(MoE)架構(gòu),參數(shù)規(guī)模高達(dá) 6710 億,是許多流行的開源大模型的10倍,推理能力極強(qiáng)。在接入該模型后,英偉達(dá)的To B用戶可通過(guò)NVIDIA NIM服務(wù)更加高效地構(gòu)建AI智能體。

與英偉達(dá)類似,曾經(jīng)表示要調(diào)查DeepSeek數(shù)據(jù)來(lái)源的微軟,也在第一時(shí)間宣布接入R1大模型。微軟CEO薩提亞·納德拉在1月29日接受訪問時(shí)說(shuō)道:我認(rèn)為DeepSeek有一些真正的創(chuàng)新。這種優(yōu)化意味著AI將更加無(wú)處不在,對(duì)于像我們這樣的超大規(guī)模服務(wù)提供商和PC平臺(tái)提供商來(lái)說(shuō),這都是好消息。

蘋果CEO蒂姆·庫(kù)克同樣盛贊DeepSeek,稱其高效創(chuàng)新令人矚目,這也不免讓人猜測(cè)難產(chǎn)的蘋果智能中文版,未來(lái)是否有接入DeepSeek的可能性。

另外,騰訊、華為、海光信息、潞晨科技等科技企業(yè),也在近日宣布旗下產(chǎn)品接入DeepSeekV3和R1模型,拉動(dòng)了一批概念股上漲。

AI教母李飛飛祛魅算力討巧,DeepSeek算法和成

在此情況下,DeepSeek的最大競(jìng)爭(zhēng)者OpenAI,似乎陷入了窘境。據(jù)悉,OpenAI正在調(diào)查其數(shù)據(jù)是否被與DeepSeek 以未經(jīng)授權(quán)的方式獲取,同時(shí)還在商業(yè)行為上做出,包括推出免費(fèi)大模型o3-mini、免費(fèi)向所有用戶開放ChatGPT搜索等。

客觀地說(shuō),OpenAI在近年來(lái)AI技術(shù)發(fā)展中占據(jù)絕對(duì)的主導(dǎo)地位。這家初創(chuàng)公司開創(chuàng)了基于大模型的生成式人工智能創(chuàng)新,這種模式高度依賴GPU算力,才有了英偉達(dá)從游戲顯卡廠商到AI硬件算力供應(yīng)商的華麗轉(zhuǎn)身。

OpenAI的定義下,中國(guó)科技巨頭如騰訊、阿里、字節(jié)、百度等,也都紛紛開始堆積算力跑大模型,但不論是通義、豆包或是文心,都沒有讓OpenAI產(chǎn)生危機(jī)感,直至DeepSeek的出現(xiàn)。

用最容易理解的話來(lái)說(shuō),即DeepSeek顛覆了算力為王的傳統(tǒng)概念,這也是其充滿巨大爭(zhēng)議的主要原因。

看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽:

ad2

推薦內(nèi)容