出品/壹覽商業(yè)
作者/李彥
編輯/木魚
7月28日,為期3天的2025年世界人工智能大會(下稱WAIC )落幕。
整體來看,稱之為世界,還是差了點意思:一方面,海外大廠除了谷歌,也就只有特斯拉帶著車-擎天柱機器人過來擺了攤。另一方面,本該是機器人最熱鬧的舞臺,結果因為一周后還有另一場WRC在北京(世界機器人大賽),不少廠商二選一,把重磅新品留到了下一站。
不過,WAIC的人氣倒還是一年比一年高。今年,70多個國家和地區(qū)的1500多位專家、800多家企業(yè)齊聚上海世博展覽館,12位圖靈獎、諾貝爾獎得主同場出現(xiàn)。展覽面積第一次突破7萬平方米,三天參觀人數(shù)預計35萬。門票開幕前兩天就被搶光,黃?,F(xiàn)場叫賣要票嗎,價格翻到上千元一張。
熱鬧之外,這屆WAIC還是釋放了不少信號。
壹覽商業(yè)在現(xiàn)場總結出四個最明顯的變化:
1、生成式AI更無處不在了,從寫稿、畫圖一路卷進了工業(yè)、醫(yī)療、交通這些硬核領域;2、算力進階,國產(chǎn)芯片和全棧協(xié)同成了高頻詞,競爭焦點從單顆芯片性能變成全鏈路效率;
3、機器人不再只是站著擺姿勢,運動控制、情緒交互、玩花活的能力都明顯升級;4、Robotaxi大跨步,廠商牌照越拿越多之余,車端多模態(tài)模型正在重塑交通系統(tǒng)的想象力。
無處不在的AI
今年WAIC最大的直觀感受是:大模型不再只是比參數(shù),而是深入到各種具體場景——從車內座艙到生產(chǎn)車間,從線上客服到展館咖啡機器人,都能看到它的身影。
首先是大模型本身的能力躍遷。階躍星辰發(fā)布的新一代基礎模型 Step 3,采用3210億參數(shù)的MoE架構,激活參數(shù)38億,是其首個全尺寸原生多模態(tài)推理模型。它能同時理解文本、圖片和數(shù)學符號,并在國產(chǎn)芯片上實現(xiàn)推理解碼效率的跨代提升,意味著更聰明但更省算力的模型正走向應用一線。
而在怎么用上,MiniMax給出了另一種答案——直接把模型變成能執(zhí)行任務的全棧智能體 MiniMax Agent。它能分解任務、調用API、發(fā)起支付并調度長流程,在展會現(xiàn)場的演示中,用一句話生成企業(yè)數(shù)據(jù)看板或自動搭建簡易電商網(wǎng)站并完成支付閉環(huán),展現(xiàn)出AI同事的雛形。一個月內快速迭代12次,也折射出這一賽道的競爭節(jié)奏。
安全問題則被合合信息單獨拎了出來。其AI鑒偽技術可在毫秒級識別深度偽造,對金融、政務等行業(yè)尤為關鍵。展臺以名畫找茬互動吸引大量觀眾:被篡改過的《蒙娜麗莎》《向日葵》通過模型掃描后,會顯示偽造區(qū)域的光影和紋理異常,并給出真?zhèn)卧u分。這套技術同樣適用于人臉換裝、票據(jù)篡改等高風險場景。
百度在展會上展示的是一整套應用生成流水線。一邊是 GenFlow 2.0,能調度多智能體一次性生成PPT、圖表、網(wǎng)頁和腳本;另一邊是 秒噠平臺,用戶用一句話描述需求,三分鐘就能生成可運行的應用?,F(xiàn)場演示會務簽到小程序,從界面到邏輯全自動生成。數(shù)字人 Nova 的升級版也同步亮相,動作更自然、語音克隆更接近真人主播,為直播和短視頻營銷場景準備。
聚焦實時交互的聲網(wǎng)則發(fā)布新版對話式AI引擎,新增聲紋識別、視覺理解、數(shù)字人交互三大能力?;用q寵物芙崽成了現(xiàn)場人氣展品:它能在嘈雜環(huán)境中分辨不同人的聲音,精準響應指令,并通過攝像頭識別手勢、表情做出擬人化反饋,面向教育、客服和娛樂的應用潛力清晰可見。
阿里云正式發(fā)布首款專為AI Agents打造的超級大腦——無影 AgentBay。這臺云端電腦能同時運行代碼、網(wǎng)頁、數(shù)據(jù)分析、表格制作等任務,具備視覺理解、自然語言控制、任務解析等多項AI能力,并可在Windows、Linux、Android等系統(tǒng)間無縫切換,只需三行代碼即可接入,實現(xiàn)拎包入住。
本次大會,阿里云還完整呈現(xiàn)了從基礎設施到模型再到平臺應用的全棧能力:包括云原生CPU 倚天710、飛天云計算操作系統(tǒng)、HPN7.0智算網(wǎng)絡架構、AI Stack一體機,以及通義千問、通義萬相大模型系列和百煉、PAI平臺。
整體看,今年的生成式AI展區(qū)呈現(xiàn)兩大信號:一是多模態(tài)和Agent化成為共識,大模型正在變成能干活的工具而非展示參數(shù)的噱頭;二是安全與成本話題被前置,廠商開始正面應對偽造治理與推理效率。
GPU賽道:國產(chǎn)算力的全面出擊
如果說生成式AI是腦子,那算力就是肌肉。今年WAIC上,國產(chǎn)GPU廠商幾乎是成排亮相,從芯片架構到智算中心方案,展示了一次集體肌肉秀。
華為展區(qū)展示了昇騰AI最新進展。核心亮點是基于CloudMatrix 384超節(jié)點的昇騰云服務:384顆昇騰NPU與192顆鯤鵬CPU通過全新高速網(wǎng)絡Matrixlink全對等互聯(lián),形成一臺超級AI服務器,算力規(guī)模300 PFlops,成功打破跨機通信帶寬性能瓶頸,實現(xiàn)從服務器級到矩陣級的資源供給模式轉變。
華為云CloudMatrix 384超節(jié)點還具備四大技術特點:首先,吞吐突破性能強,可實現(xiàn)軟硬件協(xié)同優(yōu)化,單卡Decoding吞吐達到2300Tokens;其次,主流模型覆蓋多,沉淀了行業(yè)主流160+模型,可高效支撐模型遷移;同時,專家并行效率高,國內首創(chuàng)大規(guī)模專家并行方案,可實現(xiàn)系統(tǒng)級優(yōu)化支撐更大吞吐、更低decode時延;以及規(guī)模靈活,規(guī)模靈活,初始投資小,每年迭代發(fā)布新版本,可實現(xiàn)彈性靈活按需用,這些都能夠更好地支撐AI+的落地需求。
沐曦科技帶來了旗艦新品——曦云C600 GPU。該芯片采用自主GPU IP架構,構建從設計、制造到封裝測試的全國產(chǎn)供應鏈閉環(huán)。曦云C600支持大容量存儲與多精度混合算力,并搭載 metaXlink 超節(jié)點擴展技術,滿足下一代生成式AI的訓練和推理需求。值得注意的是,它內置ECC/RAS安全防護模塊,瞄準金融、政務等場景,全面對標國際旗艦GPU產(chǎn)品。
摩爾線程的展臺更像一座全棧算力超市。它把全功能GPU作為底座,覆蓋從云端到終端的完整產(chǎn)品線:面向大模型訓練的旗艦服務器 MCCX D800 X2,基于自研OAM模組和高速全互聯(lián)架構,可支撐萬億參數(shù)規(guī)模;新推出的智算加速卡 MTT S4000,訓推兼顧,單卡48GB顯存、768GB/s帶寬,支持FP8和FP64混合精度;云渲染卡 MTT S3000 和桌面級顯卡 MTT S80 分別面向云游戲、數(shù)字孿生和個人消費市場;以及用于工業(yè)、交通等邊緣場景的AI計算模組,憑50TOPS算力實現(xiàn)端云協(xié)同部署。
摩爾線程的最大看點在于其云—邊—端一體化布局。同一套MUSA架構既能跑大模型訓練,也能支持圖形渲染和科學計算,讓其產(chǎn)品天然適配多模態(tài)和具身智能的需求。
燧原科技則以芯火燎原為主題,展示了務實的商業(yè)化落地。展臺重點展示了燧原®S60人工智能推理卡的大規(guī)模商業(yè)化應用,尤其在聊天機器人、代碼生成、搜索推薦、廣告投放等場景。燧原還帶來了 DeepSeek一體機系列,主打國產(chǎn)CPU適配和多場景調優(yōu),讓企業(yè)以更低門檻接入AI推理業(yè)務。它們同時公布了在慶陽、無錫、宜昌等地智算中心的部署案例,強調先商業(yè)化、再迭代的路線。
整體來看,算力競爭的焦點已從單卡性能轉向全鏈路效率與成本——尤其在大模型推理成本持續(xù)下探的背景下,國產(chǎn)GPU的性價比優(yōu)勢正被市場放大。
具身智能:會表演、能干活
如果說去年的機器人展臺還停留在能走能站的階段,今年的具身智能已經(jīng)開始會表演、能干活了。無論是舞臺秀還是工業(yè)操作,機器人們的動作更流暢、反應更靈敏,甚至多了一些情緒表達。
千尋智能首次亮相WAIC,帶來人形機器人 Moz1。這是它面向多任務場景的明星產(chǎn)品,依托自研的 Spirit v1 VLA模型 和頂級運控系統(tǒng),Moz1 能完成太空步、S型壓彎、主動平衡挑戰(zhàn)等高難度動作,絲滑程度幾乎接近真人。展臺設計了多個互動區(qū):在飲品區(qū),觀眾掃碼下單后,Moz1 能精準抓取飲料并遞送;在遙操區(qū),參觀者通過零延時同步跟隨體驗操縱機器人玩掌上迷宮;在疊衣區(qū),Moz1 能識別亂成一團的衣物并精準折疊成整齊豆腐塊,展示了強大的泛化能力。
傅利葉智能則選擇了另一條路徑——情緒化與康復結合。它在WAIC上帶來了即將發(fā)布的交互陪伴機器人 GR-3,首次引入柔膚軟包覆和莫蘭迪暖色設計,讓機器人看起來不再冰冷。GR-3主打康養(yǎng)和陪伴場景,可進行導診、認知康復訓練、上肢康復、運動功能重建等多維服務;現(xiàn)場的具身智能康復港展區(qū)展示了從導診咨詢到遠程康復的完整解決方案,康復機器人和外骨骼設備協(xié)同,讓人直觀看到具身智能如何改變醫(yī)療康復體驗。
智元機器人帶來的輪足雙形態(tài)機器人 靈犀 X2-N 把舞臺表演玩出了新花樣。它能在雙足行走和滾輪風火輪模式之間自由切換——既能在人群中靈活步行,也能高速滑行完成追逐表演。在大會開幕式上,靈犀 X2-N與兒童藝術團同臺表演,燈光配合下既科技又童趣,成為社交平臺刷屏的機器人秀場。
優(yōu)艾智合展示了其工業(yè)具身智能模型 MAIC(一腦多態(tài)),這是面向工廠場景的多形態(tài)機器人協(xié)作系統(tǒng)。它強調一個大腦、多個形態(tài),通過多模態(tài)感知和自適應多臂協(xié)同,實現(xiàn)從搬運、揀選到全物流調度的作業(yè)銜接。展臺演示中,移動操作機器人與人形機器人協(xié)同完成復雜流水線任務,展示了單體智能到群體智能的躍遷。
而宇樹科技則是本屆WAIC的頂流。它直接把此前央視直播的人形機器人擂臺賽搬到了現(xiàn)場,多場格斗表演讓展位前人潮涌動。明星產(chǎn)品 G1 身高1.32米、重35公斤,擁有29個靈活關節(jié),能完成直拳、勾拳、側踢等高難度動作,并在智能平衡算法加持下實現(xiàn)被擊倒后快速起身。觀眾圍在擂臺四周,伴隨機器人連擊和閃避不斷驚呼,現(xiàn)場氣氛堪比電競決賽。
除了格斗人形,宇樹還帶來了工業(yè)四足機器人 Unitree B2 和 消費級四足機器人 Unitree Go2。B2主打工業(yè)巡檢、消防、應急救援,能負重120公斤、跨越1米寬深塹,在-20℃到55℃環(huán)境下穩(wěn)定工作;Go2則面向消費市場,售價不足萬元,支持GPT大模型語音交互,可完成倒立、后空翻等動作,還推出了輪足版Go2-W,既能跑能跳也能滑行,成為展館里孩子們最愛合影的萌寵機器人。
在人形與輪足機器人集中展示之外,云深處科技帶來了一場行業(yè)場景的沉浸式體驗。展區(qū)真實還原了電力巡檢環(huán)境,觀眾可近距離看到四足機器人絕影X30 化身巡檢員,精準識別指針儀表、紅外溫度、指示燈等目標,并在低電量時自主返回充電樁,實現(xiàn)無人值守式連續(xù)巡檢。在浙江某換流站的真實應用中,絕影X30已累計超過1000小時平均無故障運行。
活動現(xiàn)場還展示了絕影Lite3與AR眼鏡結合的交互體驗,觀眾可通過手勢直接操控機器狗完成動作;以及憑借攀爬70cm高臺、空翻接倒立等高難度動作出圈的山貓輪足機器人和旗艦級四足機器人絕影X30的多行業(yè)解決方案。云深處的展示表明,具身智能正從表演走向高風險、高重復工業(yè)場景的實用化落地。
今年的機器人展區(qū)有兩個明顯信號:一是動作與交互能力的大幅躍遷——從單純行走到能跳舞、折衣、遞飲料、打拳擊,機器人開始具備真正的實用性和觀賞性;二是場景化落地的清晰化——有的走舞臺表演和消費互動,有的切入醫(yī)療康復和工業(yè)生產(chǎn),賽道正在分化出娛樂、醫(yī)療、工業(yè)三條主線。
Robotaxi開上街頭;多模態(tài)大模型重塑出行體驗
今年WAIC的智慧出行展區(qū),比往年更接地氣可以直接上車了。世博展館北門外,一輛Robotaxi按照手機APP定位緩緩駛來。只要輕點確認,系上安全帶,方向盤隨即自動轉動。車輛在浦東的真實車流中穿行:精準避讓橫穿的外賣騎手,綠燈一亮平穩(wěn)起步,前方車輛突然變道時能流暢減速并自行換道——整個過程無需人工干預。
大會期間,智行無界·AI駕未來自動駕駛體驗活動開放,覆蓋浦東約30公里的城市路網(wǎng),串聯(lián)金橋、花木、世博等核心片區(qū)。上汽智己、小馬智行、奇瑞汽車、百度智行等多家廠商的Robotaxi在場館周邊待命,只需手機端下單,即可呼叫無人車接駁。更長距離的試點甚至延伸至浦東國際機場和迪士尼度假區(qū)之間,首次展示L4級自動駕駛在跨區(qū)域、多路況接駁場景下的穩(wěn)定性。
在技術呈現(xiàn)上,各家廠商都拿出了新動作。小馬智行宣布其Robotaxi示范運營網(wǎng)絡已覆蓋北京、上海、廣州、深圳四城,并首次將PonyPilot+平臺的部分大模型推理成果用于優(yōu)化乘客交互與路徑規(guī)劃——用戶可在行駛中通過語音提出順路買咖啡等臨時需求,系統(tǒng)會自動重規(guī)劃路線。
斑馬智行則把多模態(tài)大模型直接搬進了車內座艙?;诟咄?295平臺和通義大模型,它演示了一套端側智能座艙系統(tǒng):能用自然對話完成導航、播放音樂、調整空調,并支持離線運行——即使斷網(wǎng)也能完成90%的感知-決策-執(zhí)行閉環(huán)。更具亮點的是,它能根據(jù)駕駛員情緒和駕駛行為主動推薦內容,例如在高峰期自動切換舒緩音樂、推送咖啡優(yōu)惠券,呈現(xiàn)出車懂人的趨勢。
而蘑菇車聯(lián)帶來的則是另一種思路——面向城市級交通治理的物理世界AI大模型 MogoMind。不同于車端單車智能,MogoMind聚合路口攝像頭、信號燈狀態(tài)、擁堵指數(shù)等多源實時數(shù)據(jù),在數(shù)字孿生平臺上構建城市交通全景圖,實現(xiàn)智能調度與擁堵預測。展區(qū)演示中,它能在數(shù)秒內完成全城路徑優(yōu)化模擬,為Robotaxi車隊和公共交通提供決策參考,也為智慧城市建設提供了基礎設施方案。
政策層面,上海市在大會期間發(fā)布了《高級別自動駕駛引領區(qū)發(fā)展行動方案》。方案提出,到2027年L4級自動駕駛載客量突破600萬人次、載貨超過80萬TEU,開放道路超過5000公里,覆蓋區(qū)域2000平方公里;L2/L3功能新車占比超90%,L4車型實現(xiàn)量產(chǎn)。多場景應用、多平臺支撐、多生態(tài)培育成為未來四年的核心目標,明確了從示范運營邁向規(guī)?;逃玫穆窂?。
隨著多城示范牌照的密集發(fā)放,Robotaxi正在從展臺上的未來走向街頭的現(xiàn)實。浦東街頭的這次集體上路,意味著自動駕駛競爭已從算法比拼過渡到規(guī)模與體驗之爭——誰能率先跑通商業(yè)模式,誰就可能定義下一代城市出行。
看完覺得寫得好的,不防打賞一元,以支持藍海情報網(wǎng)揭秘更多好的項目。