DeepSeek證明了另一條路的可行性
@松果財經(jīng)原創(chuàng)
OpenAI 在2月1日正式上線o3-mini系列模型,號稱要推動低成本推理的邊界,并且首次向免費用戶開放了推理模型的權限,顯然是為了對沖DeepSeek的影響。而與此同時,DeepSeek正處于冰火兩重天之中。
一方面,據(jù)中新社、澎湃新聞、環(huán)球時報等媒體報道,DeepSeek遭遇多方圍剿,美國等國家從數(shù)據(jù)安全、個人信息等方面出發(fā),對DeepSeek進行或明或暗的限制。
此外,奇安信Xlab實驗室監(jiān)測發(fā)現(xiàn),1月30日起,針對DeepSeek的攻擊烈度突然升級,較1月28日暴增上百倍。其中至少有2個僵尸網(wǎng)絡參與了攻擊。僵尸網(wǎng)絡指的是攻擊者用惡意軟件感染和控制其他設備,比如電腦,組成設備網(wǎng)絡,再控制這些設備進行攻擊。
本次攻擊大約起始于1月初,早期為低強度攻擊,1月27日左右開始升級。到1月30日,有用戶稱,從半夜開始DeepSeek卡頓程度劇增,且需要頻繁退出后重新登錄才能使用。
來自奇安信XLab實驗室的安全專家表示:僵尸網(wǎng)絡的加入,標志著職業(yè)打手已經(jīng)開始下場,這說明DeepSeek面對的攻擊方式一直在持續(xù)進化和復雜化,防御難度不斷增加,網(wǎng)絡安全形勢愈發(fā)復雜嚴峻。
據(jù)鞭牛士報道,DeepSeek周二向美國專利商標局提交了AI聊天機器人應用、產品和工具注冊商標申請,但一家總部位于特拉華州的名為Delson Group Inc.的企業(yè)搶先申請了DeepSeek商標,而后面這家公司的創(chuàng)始人Willie Lu和DeepSeek創(chuàng)始人梁文鋒是校友,雙方都畢業(yè)于浙江大學。
另一方面,DeepSeek正在極速改變現(xiàn)有AI應用生態(tài),并成功在全球用戶心中留下了深刻印象,尤其是削弱了OpenAI的影響力。因DeepSeek股價大跌的英偉達剛剛推出采用DeepSeek R1 671b的NIM微服務預覽版開發(fā)工具;微軟一開始說明正在調查DeepSeek以不正當方式獲取OpenAI的數(shù)據(jù),但又迅速在Azure上部署了R1模型,且為免費使用。
和DeepSeek遭遇攻擊的新聞放在一起對比,各方心態(tài)十分明顯:
對OpenAI來說,DeepSeek雖然規(guī)模不對等,但卻打了它個措手不及;對微軟等大企業(yè)而言,DeepSeek的開源策略非常符合它們的應用需求,它們雖有自己的立場,卻也需要削弱對OpenAI的依賴;對更多AI領域的中小企業(yè)、個人用戶、愛好者來說,DeepSeek宛如用農村包圍城市的打法解決了算力圍城問題。而對整個行業(yè)來說,DeepSeek公開了一條不同的技術路線的可行性,即單純利用強化學習(RL)進行自我迭代:
傳統(tǒng)方法的RLHF,也就是基于人類偏好的強化學習,讓人類為AI打分。預訓練撞墻后,推理變成了模型能力提升的關鍵路徑。OpenAI在去年第三季度以o1和后來的o3模型都沿著這條路徑探索。但OpenAI并沒有公布技術細節(jié),而DeepSeek R1開源后,業(yè)界收獲了首個完全公開的模型,也證明了RL路線的潛力。
至于商業(yè)層面,知名分析師郭明錤表示,DeepSeek R1的出現(xiàn),讓兩個趨勢更加值得關注--一個是Scaling Law放緩后AI算力的優(yōu)化訓練,一個則是被討論得最多的成本問題,Token價格越來越便宜,AI應用多元化發(fā)展才會更輕松。這是生成式AI效率突圍期的轉折點。
具體來看,DeepSeek把兩個行業(yè)核心問題擺了出來。
第一個是開源即壁壘的思路。OpenAI等公司的閉源路線是一種技術壁壘,但DeepSeek將核心技術即時開源,同樣構建了一種壁壘。當我用詢問DeepSeek這樣做的好處時,AI生成的回答是:
這種看似激進的決策實則構建了雙重優(yōu)勢,既通過開發(fā)者生態(tài)快速建立行業(yè)標準,又借助低價策略擴大市場滲透。這本質上是在技術擴散過程中搶占生態(tài)位,當更多企業(yè)基于其框架開發(fā)應用時,底層技術的價值反而會持續(xù)強化。
事實上,meta對DeepSeek的反應其實最為興奮,因為DeepSeek用另一種方式證明了meta的開源思路有正確性,而且還提供了非常多的參考資料。有媒體日前報道稱meta在DeepSeek的突破中看到了希望。meta副總裁Ragavan Srinivasan直言:我們的開源策略得到了驗證,有更多人能夠獲得推動事物更快發(fā)展的技術,就越好。
并且,meta通過社交媒體廣告賺錢,反哺AI開源,而DeepSeek也是背靠幻方量化,有支撐AI發(fā)展的資源。meta作為唯一一家走開源路線的美國大型公司,其做法體現(xiàn)了防御性,在相對安全的情況下用成熟商業(yè)的資源換取AI發(fā)展。而DeepSeek作為創(chuàng)業(yè)公司,則明顯更加積極。
一位海外用戶對此評論:托馬斯弗里德曼2005年的著作《世界是平的》,描述了互聯(lián)網(wǎng)如何在全球范圍內傳播知識。我猜中國人學會了如何在我們先進的地方打敗我們。(指用開源競爭閉源)
另一組評論更加發(fā)人深省,DeepSeek將改進的成果免費帶給了全世界,即便是美國的初創(chuàng)企業(yè)也開啟了下一個階段,這才是技術普惠的雙贏:Open means worldwide.
第二個是AI的發(fā)展效率,DeepSeek選擇了一條差異化的技術路線--在保持模型參數(shù)規(guī)??煽氐那疤嵯拢ㄟ^動態(tài)調整計算強度來提升效率。這相當于為AI系統(tǒng)安裝了智能調節(jié)器,使其能夠根據(jù)任務需求自動匹配運算資源。這種思路打破了參數(shù)越多越好的固有認知,證明通過算法優(yōu)化完全可以在不增加硬件投入的情況下實現(xiàn)性能突破。
需要注意,這并沒有否認先進大規(guī)模GPU和優(yōu)質數(shù)據(jù)的價值,但對于廣大缺乏資源的開發(fā)者,以及想要跳出生成式AI既有缺陷的玩家來說,這一次嘗試的意義很大。
之前,OpenAI因為高昂的定價被市場詬病,SemiAnalysis在前兩天刊發(fā)的DeepSeek事件分析報告中指出:R1 并非從技術層面削弱了 o1 的進展,而是以更低的價格實現(xiàn)了相當?shù)哪芰?。OpenAI之所以能定高價,是因為它們一開始基于最前沿的技術定價,然后享受溢價,而R1達到了類似的能力水平之后,OpenAI就不得不做出反應。后續(xù)能力定價依然會是關鍵因素,每一代能追趕上領先能力的參與者越來越少,同時一旦追趕成功,帶來的影響也就越大。
這也是影響到二級市場投資的主要因素,也就是郭明錤提到的,過去這兩年,市場投資AI產業(yè)鏈是Scaling Law對服務器和GPU的需求,然后推動出貨量增長。DeepSeek則證明,Scaling Law放緩之后,關注其他提升模型效益的路徑,也是投資機會。
因為AI的成本足夠低,相關的應用才會獲得更大的試錯空間。在AI成本很高的時候,應用的收入增速可能還趕不上成本的增速,也就沒辦法形成可行的盈利模式。而隨著成本下降跌破一個又一個關口,算法其實代償了之前必需的一部分成本,所以真正的創(chuàng)新爆發(fā)必定會延伸到應用層。
而這又延伸出兩條思考:第一,AI應用需求越多,是否最終依然會提升對算力的需求?算力池總量擴大,依然是潛在的邏輯。第二,這些相對便宜的AI產品有機會促進端側AI和Agent的發(fā)展,怎么兌現(xiàn)還有待探索,因為單純便宜還不能解決AI落地的所有問題。
OpenAI在1月23日發(fā)布了智能體Operator,也就是Agent,可以完成訂餐、電商購物之類的任務,但后續(xù)熱度很快被DeepSeek相關話題蓋過。OpenAI雖然認為這種日常任務自動化蘊藏巨大機遇,但Operator功能被放在每個月需要200美元的ChatGPT Pro訂閱中,顯然并不覺得現(xiàn)在有低價推動Agent普及的必要。
但如果更低成本的AI得到進一步開發(fā),相關的應用必然就會加速。并且DeepSeek作為貫穿整個農歷新年的全球性熱點,因其語言方面的能力突出,特別容易被普通用戶發(fā)現(xiàn)亮點,又成功席卷所有平臺的頭條,所以對之前沒有使用過AI產品的用戶的吸引力,也是獨領風騷。
2月1日,硅基流動和華為云團隊合作,聯(lián)合首發(fā)并上線基于華為云昇騰云服務的DeepSeekR1/V3推理服務。隨后硅基流動 CEO & 創(chuàng)始人袁進輝在朋友圈表示,DeepSeek需求量超出預期,只能限流。
總之,無論是在使用體驗上,還是技術路線上,亦或者行業(yè)發(fā)展水平上,DeepSeek都做出了令人意外的貢獻。它所遇到的一切,也就不難理解。
看完覺得寫得好的,不防打賞一元,以支持藍海情報網(wǎng)揭秘更多好的項目。