
隨着 AI 模型由傳統的單次交互聊天機器人,演進為具備長期推理與工具調用能力的智能主體,後端數據中心的運算樽頸已不再局限於算力本身。NVIDIA 透過首款專為 Agentic AI 打造的 Vera CPU,以及打破傳統儲存路徑的 BlueField-4 STX 參考架構,全面優化大語言模型在長上下文推理下的執行效率,宣告「AI 工廠」硬體基礎設施正式進入一體化量產階段。
Vera 處理器進入全面量產 下半年引發數據中心架構轉型
作為 NVIDIA 首款專為代理式工作負載與強化學習而設的晶片,Vera CPU 的量產進度成為今次 Computex 的焦點。這款晶片採用 88 個自訂 Olympus 核心,具備「空間多線程」技術,能在減半功耗的同時,將效能提升 50%。其核心優勢在於配備了高達 1.2 TB/s 記憶體頻寬的 LPDDR5X 記憶體。當透過 NVLink-C2C 技術與 Rubin GPU 組裝為 Vera Rubin 超級晶片並接入 NVL72 機架系統時,相干頻寬高達 1.8 TB/s,約為 PCIe Gen 6 標準的七倍,大幅消除了異構運算之間的通訊延遲。
目前首批 Vera CPU 已正式送抵 Anthropic、OpenAI、xAI 及 Oracle Cloud Infrastructure(OCI)進行技術評估與部署。其中 OCI 已表明計劃於年內進行數十萬顆 Vera CPU 的超大規模部署。NVIDIA 在展會上確認,該晶片已進入全面量產階段,由戴爾(Dell)、HPE、聯想、華碩、技嘉及 Supermicro 等主要伺服器廠商研發的合作夥伴系統,預計將於 2026 年下半年起陸續推向市場,預期將引發全球數據中心新一輪的架構轉型。
STX 架構突破長上下文樽頸 與頂級儲存商聯合設計
隨着 AI 模型的上下文窗口擴展至數百萬 Token,傳統儲存架構在數據讀取與動態記憶體配置上的不足,嚴重拖慢了推理速度並降低了 GPU 利用率。為此,NVIDIA 正式推出基於 Vera Rubin 平台的 BlueField-4 STX 模塊化儲存參考架構。該架構的核心在於全新 CMX 情境記憶儲存平台,透過將儲存單元深度集成至計算集群內部,將數據訪問路徑縮短至傳統架構的五分之一,成功將每秒處理的 Token 數量提升高達 5 倍。
BlueField-4 STX 將 Vera CPU 核心、ConnectX-9 SuperNIC 網絡卡、Spectrum-X 以太網絡與 DOCA 軟件框架整合為端到端加速方案。黃仁勳強調,未來的 AI 協作夥伴必須兼具短期和長期記憶,而儲存架構的升級正是支撐這一切的基礎。現時戴爾、HPE、IBM、NetApp、VAST Data 及 WEKA 等頂級儲存製造商,正基於 STX 架構聯合設計下一代 AI 基礎設施,甲骨文雲與 Mistral AI 亦計劃於今年下半年率先將其實現商業化落地。
DSX 平台開創方法論閉環 引入強化學習自主運營
除了硬體產品線的擴展,NVIDIA 宣佈推出 DSX 平台,正式將 AI 工廠的建設提升至系統方法論層面。DSX 平台整合了開源模塊化軟件庫、API 及參考設計,提供從設計、仿真、建造到運營的完整閉環框架。黃仁勳解釋,NVIDIA 不僅僅是交付晶片,而是為基礎設施建設者提供完整的構建指南,讓運營商在投入實體成本前,能夠利用數字孿生技術在虛擬環境中驗證全工廠的性能與能效表現。
該平台包含四大核心軟件庫:DSX Max-LPS 支援 45°C 液冷技術,可在固定功耗預算內容納多達 40% 的額外 GPU;DSX Flex 負責對接電網進行動態用電調整;DSX Exchange 則打通 IT 與運營設備(OT)的數據壁壘。值得注意的是,NVIDIA 引入了 Phaidra 的強化學習智能體參與工廠運營,實測顯示能令真實 DGX GB200 系統的液冷熱峰值降低約 80%,GPU 集群熱穩定性提升 70%,實現了由 AI 自主管理 AI 工廠的技術突破。目前該生態已匯聚包括達索系統、西門子、施耐德電氣在內超過 200 家覆蓋生命週期的合作夥伴。
Source:ezone.hk、NVIDIA
