在今日台灣時間凌晨一點,於美國加州聖荷西隆重登場的 NVIDIA GTC (GPU Technology Conference)NVIDIA CEO 黃仁勳發表了備受期待的主題演講,現場吸引了超過 2.5 萬名來自各界的產業專家、研究人員與科技愛好者齊聚一堂 。這場全球矚目的科技盛會,不僅是技術交流的重要平台,被比喻為科技界的「超級盃」。GTC 的與會人數持續增長,充分展現了各界對於 NVIDIA 在人工智慧領域最新發展的高度關注與濃厚興趣。這也印證了 NVIDIA 的技術進步及其在更廣泛的 AI 領域所扮演的關鍵角色。黃仁勳的這番話不僅點燃了現場的熱情,更預示著 NVIDIA 的創新將為整個科技生態系統帶來積極的影響,而不僅僅是公司本身。
次世代GPU架構磅礴登場:Blackwell Ultra與Rubin系列將引領效能飛躍
在本次 GTC 大會上,最引人注目的莫過於 NVIDIA 次世代 GPU 架構的重磅發布。黃仁勳首先揭露了新一代 Blackwell GPU 的升級版本,名為「Blackwell Ultra」,其設計理念完全聚焦於蓬勃發展的 AI 推理應用。Blackwell Ultra NVL72 平台展現了驚人的效能提升,其頻寬較前代產品提升了兩倍,記憶體速度也加快了 1.5 倍,這將能顯著加速代理型 AI、實體型 AI 以及各式推論模型的開發與部署。緊隨其後,NVIDIA 更預告了即將問世的 GB300 NVL72 伺服器,這款強大的系統將整合 72 顆 Blackwell Ultra GPU 與 36 顆基於安謀 Neoverse 架構的 Grace CPU,其整體 AI 效能相較於之前的 GB200 NVL72 有了顯著的提升。這種 GPU 與 CPU 的異構運算架構,展現了 NVIDIA 持續優化其系統級解決方案,以滿足日益複雜的 AI 工作負載需求的決心。
GPU 架構 | 預計推出時間 | 相較於 Hopper 的效能提升 | 主要應用 | 備註 |
---|---|---|---|---|
Blackwell Ultra | 2025 年下半年 | 68 倍 (整體), 40 倍 (推理) | AI 推理、代理型 AI、實體型 AI | NVL72 平台頻寬提升 2 倍,記憶體速度提升 1.5 倍 |
Vera Rubin | 2026 年下半年 | 900 倍 (Vera Rubin Ultra) | AI 超級運算 | Vera Rubin Ultra 由 4 個 GPU 整合而成,沿襲 Grace Blackwell 的 CPU+GPU 設計 |
GB300 NVL72 伺服器 | 即將推出 | 比 GB200 NVL72 提升 | 連接 72 顆 Blackwell Ultra GPU 與 36 顆 Grace CPU |
在本次主題演講中,黃仁勳反覆強調「AI 工廠」的概念,並將 tokens 視為未來 AI 運算最核心的單位。這種將 AI 基礎設施視為如同工業時代的工廠,而將運算資源量化為代幣的想法,預示著 AI 運算模式的重大轉變。NVIDIA 將代幣定義為 AI 運算的計算單位,這有助於更清晰地理解和衡量 AI 模型運行所需的資源消耗。AI 模型現在能夠主動生成答案,這從根本上改變了傳統的運算方式,使得運算的每一個環節都經歷了深刻的變革。未來,電腦的角色將從單純的檔案檢索者轉變為軟體的代幣生產者,這意味著運算能力的輸出將直接體現在 AI 生成的內容和服務上。
隨著 AI 推理和強化學習等應用需求的持續攀升,對 AI 運算能力的需求也呈現指數級的增長。推理作為 AI 模型生成代幣的過程,對於企業而言至關重要。因此,構建能夠高效且高性能地產生這些 tokens 的「AI 工廠」就成為了關鍵。為了應對未來 AI 模型參數規模可能達到數兆級別的挑戰,以及提供更精確的回應,在推理階段投入更多的運算資源(即測試時的擴展)將變得至關重要。這也解釋了為何需要像 Blackwell 系列這樣強大的系統,才能夠應對日益增長的 AI 運算需求。
具備推理能力的 Agentic AI 與 Physical AI
黃仁勳在演講中強調,人工智慧正處於一個重要的轉折點,其智慧程度不斷提升,應用領域日益廣泛,並獲得了更多的資源支持。NVIDIA 正在積極開發能夠逐步進行推理的 AI 技術,並深入探討推理和強化學習的需求如何驅動對 AI 運算能力的需求。這種「一步一步」的推理能力,代表著 AI 正朝著更強大的問題解決和決策能力邁進。所謂的「物理 AI (Physical AI)」是指能夠理解物理世界基本規律的人工智慧,例如摩擦力、慣性、因果關係以及物體的持久性等概念。這種能力對於機器人技術和自主系統的發展至關重要。
另一方面,「具備代理能力的 AI (Agentic AI)」則更進一步,它指的是擁有自主性的 AI,能夠感知和理解周遭環境的狀況,進行複雜的推理,制定行動計劃並付諸實施,甚至可以使用各種工具來完成任務。這種 AI 能夠獨立解決問題並達成目標,展現出類似人類的自主性。值得注意的是,相較於傳統的大型語言模型 (LLM),推理模型在獲取正確答案時,需要消耗多達 20 倍的代幣和 150 倍的運算資源。這再次凸顯了高效能運算系統對於發展更智能 AI 的重要性。
機器人技術重大突破:Isaac GR00T N1與Newton平台加速產業轉型
NVIDIA 在機器人技術領域也取得了顯著的突破。黃仁勳宣布推出一系列旨在增強人形機器人開發的技術,其中包括已經上市的「NVIDIA Isaac GR00T N1」。這被譽為全球首個開放、完全可客製化的通用人形推理和技能基礎模型。
黃仁勳認為,機器人技術將有助於解決全球面臨的勞動力短缺問題,並且這個領域蘊藏著巨大的發展潛力。為了進一步推動機器人技術的發展,NVIDIA 還與 Google DeepMind 和迪士尼研究院合作開發了 Newton 機器人平台。這是一個開源的物理引擎,專為機器人學習進行了優化。Newton 基於 NVIDIA Warp 框架構建,不僅針對機器人學習進行了最佳化,還能與 Google DeepMind 的 MuJoCo 和 NVIDIA Isaac Lab 等模擬框架相容。精密的物理模擬技術對於提升機器人接近人類的運動能力至關重要,它能使機器人透過觸覺反饋來學習並優化其行為模式。
值得一提的是,美國最大的汽車製造商通用汽車 (GM) 將與 NVIDIA 展開合作,利用 AI、模擬技術和加速運算,共同開發下一代汽車、智慧工廠以及機器人技術。兩家公司將攜手運用 NVIDIA 的加速運算平台,包括搭載 NVIDIA Cosmos 的 NVIDIA Omniverse,來構建客製化的 AI 系統,用於訓練 AI 製造模型,從而優化通用汽車的工廠規劃和機器人技術。此外,通用汽車還將採用 NVIDIA DRIVE AGX 作為其車載硬體,以實現未來更先進的駕駛輔助系統和車內增強型安全駕駛體驗。
Spectrum-X與Quantum-X交換器打造超大規模AI工廠
為了應對 AI 運算爆炸性增長所帶來的資料中心數據傳輸瓶頸,NVIDIA 宣布與台積電 (TSMC)、鴻海科技集團、日月光投控旗下的矽品精密工業股份有限公司以及波若威科技股份有限公司等多家台灣廠商攜手合作,推出了全新的 NVIDIA Spectrum-X 和 NVIDIA Quantum-X 矽光子共同封裝光學 (CPO) 網路交換器。這項技術的目標是打造能夠跨越不同地點、連接數百萬個 GPU 的超大規模 AI 工廠,預示著「AI 世界的光通訊時代」的來臨。透過將矽光子技術直接整合到交換器內部,可以突破過去超大規模和企業網路所面臨的限制,實現訊號損耗的減少和功耗的降低。Spectrum-X Photonics 以太網路和 Quantum-X Photonics InfiniBand 平台均能實現高達每端口 1.6Tb/s 的速度,總頻寬更可達到 400Tb/s。
相較於傳統的網路解決方案,這些新型交換器整合了光學創新技術,不僅減少了四倍的雷射器使用量,更實現了 3.5 倍的能源效率提升、63 倍的訊號完整性增強以及 10 倍的網路彈性提升。Quantum-X 矽光子交換器預計將於今年稍晚時候上市,而各大系統廠商則計劃在 2026 年推出 Spectrum-X 矽光子交換器。值得一提的是,NVIDIA Spectrum-X 和 Quantum-X 矽光子共同封裝光學網路交換器採用了台積電的 COUPE 平台及其先進的 SoIC-X 封裝技術。
輝達攜手通用汽車等產業巨擘加速創新
NVIDIA 正積極與各行各業的領導者展開合作,共同推動技術創新。與美國汽車巨頭通用汽車 (GM) 的合作便是其中的一個重要例證。雙方將攜手利用 AI、模擬技術和加速運算,共同開發下一代汽車、智慧工廠以及機器人技術。這項合作不僅僅局限於自動駕駛技術的研發,更涵蓋了生產製造和工業機器人等廣泛領域。
兩家公司將共同利用 NVIDIA 的加速運算平台,包括搭載 NVIDIA Cosmos 的 NVIDIA Omniverse,來構建客製化的 AI 系統,以訓練 AI 製造模型,進而優化通用汽車的工廠規劃和機器人技術。此外,通用汽車還將採用 NVIDIA DRIVE AGX 作為其車載硬體,以實現未來更先進的駕駛輔助系統和提升車內的安全駕駛體驗。
軟硬體生態系統持續擴展:Dynamo與DGX系列強化開發者能量
為了進一步完善其 AI 生態系統,NVIDIA 還推出了一項名為 Dynamo 的重要技術。這是一個開源的 AI 推論服務,黃仁勳將其形象地比喻為「AI 工廠的作業系統」,其命名靈感源自於推動工業革命的第一台發電機。NVIDIA 表示,Dynamo 這項技術能夠將 AI 模型的推論性能提升高達 30 倍,為企業帶來更高的生產效率和商業價值。
此外,為了讓 AI 開發人員、研究人員、資料科學家和學生能夠更便捷地進行大型模型的原型設計、微調和推理,NVIDIA 推出了前身為 Project DIGITS 的「DGX Spark」,以及一款由 NVIDIA Blackwell Ultra 平台支援的新型高效能 NVIDIA Grace Blackwell 桌上型超級電腦「DGX Station」。NVIDIA 還與華碩、戴爾等業者合作,共同推出為開發者量身打造的「DGX 個人 AI 超級電腦」系列。這些舉措旨在降低 AI 開發的門檻,並賦予開發者更強大的工具和平台。
展望未來,輝達持續引領AI技術發展
儘管 NVIDIA 在 GTC 2025 上展示了其在 AI、機器人、資料中心等多個前瞻技術領域的重大突破,以及在運算能力上的顯著提升,但華爾街和投資者的反應卻相對平淡。在盤後交易中,NVIDIA 的股價下跌了約 4%。這可能反映出市場對 NVIDIA 的高期望值已經被部分消化,或者投資者對新技術的短期財務影響仍持謹慎態度。另一方面,以「低成本、高效能」為賣點的中國 AI 新創公司 DeepSeek 的崛起,在全球範圍內引發了關於 AI 軍備競賽的討論,並被視為 NVIDIA 在 AI 硬體領域主導地位的潛在挑戰。包括 AMD 和 Intel 在內的傳統晶片製造商也在積極開發其 AI 導向的晶片,預計將在 2025 年對 NVIDIA 的市場領導地位構成更直接的競爭。此外,包括 Google、Amazon 和 Microsoft 等科技巨頭也開始設計和生產自己的 AI 晶片,以期減少對 NVIDIA 產品的依賴。這些因素都預示著 AI 晶片市場的競爭將更加激烈。
總體而言,NVIDIA 在 GTC 2025 上所展示的一系列創新技術和戰略布局,再次鞏固了其在人工智慧和加速運算領域的領導地位。無論是次世代 GPU 架構的效能飛躍,還是矽光子技術所帶來的互聯革命,都展現了 NVIDIA 持續突破技術邊界的決心和能力。公司在機器人技術、軟硬體生態系統以及跨界合作方面的積極投入,也預示著 AI 技術將在未來幾年內迎來更加顯著的進步。儘管面臨來自市場和競爭對手的挑戰,NVIDIA 憑藉其前瞻性的技術 vision 和強大的執行力,有望繼續引領全球 AI 技術的發展方向。