作者/質子
編輯/嘉嘉
日前,因涉嫌市場壟斷,英偉達被國家市場監(jiān)督管理總局立案調(diào)查。受此影響,英偉達、AMD、阿斯麥等美股半導體公司股價應聲而下,其中在被立案調(diào)查當日,英偉達股價下跌近3%,市值蒸發(fā)掉6400億元。
與海外半導體公司普遍下跌相比,中國AI半導體概念股集體上漲,寒武紀盤中漲超3%,海光信息漲超4%,景嘉微漲超5%……
作為AI加速芯片沙皇,英偉達掌握著全球90%的市場份額,H100、A100更是被全球AI公司跪求,在AI產(chǎn)業(yè)發(fā)展的關鍵期,對英偉達立案調(diào)查是否會影響中國AI大模型的發(fā)展?
其實完全不用擔心,雖然在性能上,中國AI芯片企業(yè)跟英偉達還有較大差距,但在產(chǎn)業(yè)鏈生態(tài)上,中國AI企業(yè)已經(jīng)度過了筑基期,正在加速發(fā)展。
【1】Open AI將英偉達送上王座2022年11月30日,Open AI發(fā)布全新聊天機器人模型ChatGPT,產(chǎn)品上線五天,全球用戶量就突破100萬,宣告了AI技術取得重大突破。
這一天對黃仁勛來說,是英偉達的iPhone時刻——此后全球成立的AI企業(yè)數(shù)量近3萬家,其中僅生成式AI,國內(nèi)企業(yè)數(shù)量就高達4500 家,這些企業(yè)對算力、AI芯片有著極強的渴求度。
據(jù)了解,2018年,Open AI發(fā)布GPT-1時,模型擁有的參數(shù)為1.17億個,但到了2023年發(fā)布GPT-4時,其模型參數(shù)達到了1.8萬億個,五年時間參數(shù)量增幅超過一萬倍。
更為重要的是,算力需求還在持續(xù)增長。華為預測數(shù)據(jù)顯示,在2020年的算力基礎上,2030年AI的算力要求將增長500倍,通用算力要求將增長10倍。
數(shù)據(jù)結構發(fā)生變化,現(xiàn)在都是大量的非結構數(shù)據(jù),都是圖片、視頻、語音,CPU處理能力很弱的數(shù)據(jù),在接受第一財經(jīng)采訪時,華為昇騰計算業(yè)務總裁張迪煊表示,海量的非結構性數(shù)據(jù)需要更高的算力支撐,這就需要英偉達的GPU。
與專注一件事的CPU不同,英偉達GPU專為并行計算而設計,它本來適用于對圖形進行渲染,能同時處理數(shù)千個計算線程,極大提升了大模型的訓練速度。
英偉達GPU在AI訓練速度上有多強悍?看一組數(shù)據(jù)對比就知道了,以GPT-3基準測試為例,英特爾系統(tǒng)訓練耗時67分鐘,而英偉達系統(tǒng)只需要3.4分鐘,英偉達在效率上完勝英特爾。
靠著AI算力需求的浪潮,英偉達達到了歷史巔峰。天眼查數(shù)據(jù)顯示:2023年,英偉達營收為609 億美元,凈利潤更是達到297.6億美,市值更是達到3.36萬億美元。
而要知道,在十年前,英偉達還是那個全年營收41億,要給雷軍站臺才能拉來訂單的IT邊緣廠商。
(來源:百度股市通)
生成式AI將英偉達送上了王座,但在大國角逐的舞臺上,即便強如英偉達,依然受到波及。
【2】中國AI被打壓中國的現(xiàn)狀是一流的應用、二流的模型、三流的算力,中金公司研究部計算機行業(yè)首席分析師于鐘海在談及中國AI產(chǎn)業(yè)發(fā)展時認為,算力是最為薄弱的環(huán)節(jié),也是國內(nèi)AI企業(yè)最重要的環(huán)節(jié)。
但想要國產(chǎn)替代談何容易。
國內(nèi)AI加速芯片最能打的型號是華為昇騰910B,該芯片采用采用7nm工藝,擁有496億個晶體管,其FP16的運算性能約為320Tflops,整體性能達到英偉達A100的水平。
而英偉達目前最先進的AI芯片為GB200,該芯片采用4nm工藝,擁有2080億個晶體管。
目前國內(nèi)普遍認為:H100性能是A100的2至3倍,Blackwell B200是H100的5倍,我們可以換算出,一顆英偉達GB200相當于10—15顆昇騰910B。
可以說英偉達要性能有性能,要生態(tài)有生態(tài),要性價比有性價比,在這種綜合能力打擊下,英偉達壟斷了國內(nèi)90%的AI加速芯片,華為等AI芯片只能做點邊緣業(yè)務。
(來源:英偉達)
歷史是驚人的巧合,與光刻機、手機芯片等半導體產(chǎn)業(yè)一樣,中國AI加速芯片轉折點源于一次又一次的封鎖和打壓。
2022年9月,美國政府通過設置功率門檻和芯片之間通信速度門檻,限制英偉達A100 和 H100以及 AMD MI250對華出口。為了能向中國市場供貨,英偉達根據(jù)限制條件,為中國研發(fā)出了閹割版本的A800和H800芯片。
2023年10月,為了進一步限制中國AI產(chǎn)業(yè),美國升級限制力度,要求英偉達禁止向中國市場出售運行速度達到300 teraflops(即每秒可計算 3億次運算)及以上的數(shù)據(jù)中心芯片。
這也意味著,此前閹割版的A800和H800也被禁止出售中國,為此,英偉達不得不再次閹割,推出HGX H20、L20 PCle、L2 PCle三款AI加速芯片。
據(jù)了解,閹割版在閹割后的HGX H20芯片,價格為11萬一顆,但整體計算能力只有H100的15%,L20 PCle和L2 PCl其FP16稠密算力分別為8.8TFLOPS和4.4TFLOPS,只有H100的12%、6%。
這樣的性能根本不能滿足國內(nèi)AI大模型廠商的算力需求。
確實,誰都知道AI是未來,是方向,但出口已經(jīng)被美國封死壓制,沒有一點出路,留下的只有反抗。
【3】走過筑基期正如《三體》中水滴對地球科技發(fā)展的鎖死一樣,美國政府對英偉達一而再,再而三的不斷施壓,中國AI企業(yè)從英偉達等國外廠商進口的AI加速芯片的通道已經(jīng)被鎖死。
美國在AI芯片領域對中國的制裁長期不會取消,而中國半導體制造工藝由于也受美國制裁,將在相當長時間處于落后狀態(tài),在華為全聯(lián)接大會2024上,華為副董事長、輪值董事長徐直軍直接挑明,這就意味著我們所能制造的芯片的先進性將受到制約。這是我們打造算力解決方案必須面對的挑戰(zhàn)。
科技有國界,形勢異常艱巨,核心基礎技術卡脖子意味著將生存的命脈放在對方手中,中國AI企業(yè)必須放棄幻想,準備戰(zhàn)斗,然而反抗的火種已經(jīng)在各個產(chǎn)業(yè)悄然打響。
12月2日,美國商務部宣布了新的對華半導體出口管制措施,將140家中國企業(yè)列入實體清單。次日,中國互聯(lián)網(wǎng)協(xié)會、中國汽車工業(yè)協(xié)會、中國半導體行業(yè)協(xié)會以及中國通信企業(yè)協(xié)會集體發(fā)表聲明:美國相關芯片產(chǎn)品不再安全、不再可靠,建議國內(nèi)企業(yè)謹慎采購美國芯片。
顯然現(xiàn)在國內(nèi)像華為、百度等AI加速芯片在性能上無法替代英偉達的高端芯片,但中國AI加速芯片已經(jīng)初見成效,形成產(chǎn)業(yè)集群。
華為推出昇騰910B,寒武紀推出910B AI芯片,其FP16稠密算力達到128TFLOPS,超過英偉達A100;海光信息推出的海光2000 AI芯片,是國內(nèi)首款基于5nm工藝的云端推理芯片;百度昆侖與飛槳及其他國產(chǎn)軟硬件組合打造了國產(chǎn)化AI技術生態(tài)……
更為重要的是,在國產(chǎn)供給的同時,因為不滿英偉達閹割版的閹割版的AI芯片性能,中國移動、百度等企業(yè)開始采購國內(nèi)AI芯片。
2023年8月,百度以4.5億元的價格向華為采購1600顆昇騰910BAI芯片;今年年初,字節(jié)跳動更是向華為采購10萬顆昇騰910BAI芯片;2024年4月,中國移動智算中心(呼和浩特)投產(chǎn)使用,部署2萬張AI加速卡,其中AI芯片國產(chǎn)化率為85%。但到了8月底,中國移動智算中心(哈爾濱)投入使用時,AI芯片國產(chǎn)化率100%。
外采變內(nèi)購,在美國行政命令的限制下,英偉達只能向中國提供性能被大幅閹割的AI芯片,根本無法滿足國內(nèi)市場需求,但正是因為政策限制,反而推動了國產(chǎn)AI加速芯片研發(fā)生產(chǎn)。
曾經(jīng)相似被卡脖子的困境我們也曾遇到,2019年,因為美國貿(mào)易制裁和限制,華為無法獲得7nm芯片,其消費電子業(yè)務被直接按下剎車鍵,華為一度從即將超越蘋果成為全球第一大手機廠商,跌落到邊緣手機廠商,但隨著MATE60、三折疊屏手機的問世,華為內(nèi)磐重生。
如今類似的境遇也發(fā)生在百度等AI大模型廠商身上,英偉達的大模型訓練工具被斷供,但好消息是,面對美國的不斷封鎖,中國AI加速芯片已經(jīng)走過了筑基期,剩下的只需要耐心和等待。
2019年,對于中國制造光刻機,ASML首席執(zhí)行官溫彼得一臉傲慢:就算給你們?nèi)讏D紙,中國也造不出光刻機。但四年后,面對同樣的問題,溫彼得頗為憂傷:中國有14億人,而且聰明人很多,我們太自以為是了。
我們真心希望,光刻機、手機芯片發(fā)生的事情,四年后能AI加速芯片身上上演,這一定很難,但一定會實現(xiàn)。
看完覺得寫得好的,不防打賞一元,以支持藍海情報網(wǎng)揭秘更多好的項目。