(圖片來源:攝圖網(wǎng))
英特爾(Intel)最近在官網(wǎng)上發(fā)布了一份名為Gaudi 3 AI加速器白皮書的報告,揭示了他們即將在中國發(fā)售Gaudi 3兩款特供版AI芯片產(chǎn)品。這兩款硬件形態(tài)加速卡分別是型號為HL-328的OAM兼容夾層卡(Mezzanine Card)和型號為HL-388的PCle加速卡,預(yù)計將于今年6月24日和9月24日推出。
據(jù)報道,原版Gaudi 3在FP16/BF16上的性能可以達到1835 TFLOPS,而中國特供版Gaudi 3的16bit性能將不超過150 TFLOPS。相比國際版Gaudi 3,中國特供版的HL-328芯片性能或?qū)⒔档图s92%左右。這意味著中國特供版Gaudi 3的TDP(熱設(shè)計功耗)也將大幅降低。
Gaudi 3在AI加速領(lǐng)域的強大性能和效率,尤其在大模型訓(xùn)練和推理方面表現(xiàn)出色。國際版Gaudi 3擁有128GBHBMe2內(nèi)存容量、3.7TB內(nèi)存帶寬和96MB板載靜態(tài)隨機存取內(nèi)存,可以滿足大模型的超大內(nèi)存需求。而Gaudi 3的訓(xùn)練時間平均比英偉達的H100縮短了50%。在Llama-2 7B/70B以及Falcon180B大模型的推理測試中,Gaudi 3的吞吐量平均比H100快了50%,平均推理效率快了40%。
人工智能芯片發(fā)展路徑
人工智能作為一項計算密集型的新技術(shù),在早期發(fā)展階段依賴通用芯片的性能迅速發(fā)展,而后期將依賴專用芯片來主宰市場。定制的硬件能夠?qū)崿F(xiàn)更優(yōu)的功耗效率,滿足不同算法、結(jié)構(gòu)、終端和消費者的需求,實現(xiàn)規(guī)?;氖找?。然而,通用芯片與專用芯片永遠不是互相替代的關(guān)系,二者必須協(xié)同工作才能發(fā)揮出最大的價值。
人工智能芯片分類
目前,人工智能芯片根據(jù)技術(shù)架構(gòu)可分為CPU、GPU、FPGA、ASIC和類腦芯片;根據(jù)在網(wǎng)絡(luò)中的位置可分為云端AI芯片、邊緣AI芯片和終端AI芯片;按實踐目標可分為訓(xùn)練芯片和推理芯片。
全球GPU芯片出貨量超過4.6億片/年
GPU是目前市場上應(yīng)用最廣泛、在AI計算方面最成熟的通用芯片。根據(jù)弗若斯特沙利文的推算,2020年GPU芯片在AI芯片市場占據(jù)了35.95%的主要份額。
近年來,全球GPU技術(shù)迅速發(fā)展,不僅滿足了傳統(tǒng)圖形應(yīng)用需求,還在科學(xué)計算、人工智能和新型圖形渲染技術(shù)方面得到廣泛應(yīng)用。這些技術(shù)的成熟應(yīng)用推動了全球GPU芯片市場的持續(xù)高速發(fā)展。據(jù)全球知名調(diào)研機構(gòu)JPR的數(shù)據(jù)顯示,2021年全年全球GPU芯片的出貨總量超過4.6億片,每個季度的出貨量維持在1-1.3億片之間。
根據(jù)IDC的預(yù)測,隨著智能手機需求逐步復(fù)蘇以及對AI芯片的強勁需求,半導(dǎo)體市場將在2024年重新回到增長趨勢,年增長率預(yù)計將超過20%。
另據(jù)Omdia的預(yù)測,全球機器人人工智能芯片組市場規(guī)模預(yù)計將達到8.66億美元,這將有助于推動GenAI在機器人領(lǐng)域的普及化。
IDC亞太區(qū)半導(dǎo)體研究高級研究經(jīng)理Galen Zeng指出,內(nèi)存芯片制造商對供應(yīng)和產(chǎn)量的嚴格控制導(dǎo)致芯片價格自去年11月初開始上漲。預(yù)計人工智能的需求將推動2024年整體半導(dǎo)體銷售市場的復(fù)蘇。
經(jīng)濟學(xué)人APP資訊組
看完覺得寫得好的,不防打賞一元,以支持藍海情報網(wǎng)揭秘更多好的項目。