NVIDIA Ampere GPU 登場!16 顆同步‧推出 DGX A100 超級電腦

| 朱力恒 | 08-05-2020 18:22 |
NVIDIA Ampere GPU 登場!16 顆同步‧推出 DGX A100 超級電腦

下世代 NVIDIA Ampere 微架構 GPU,官方將它集合 16 顆而製成「DGX A100」超級電腦,應用於人工智能及深度學習 (Machine Learning),每顆「GA100」GPU 內建 8,192 個 CUDA 運算單元,因此結合 131,072 CUDA 驚人數量。Ampere 微架構 GPU,將成為下一代 GeForce RTX 30 系列顯示卡,今次消息對於主流市場產品具前膽性。

  • 每台 16 顆 Ampere GPU,每顆 8,192 CUDA 單元
  • 用於人工智能及深度學習運算
  • Ampere GPU 將作於推出 RTX 30 系列顯示卡

【硬件】Intel 十代 Core 正式登場!最高 10 核心‧5.3GHz Turbo 時脈

【硬件】Intel Z490 主板抵港率先睇!晶片原生 2.5Gbps LAN

合共 13.1 萬 CUDA 單元

受 COVID-19 新冠病毒疫情影響,NVIDIA 取消舉行今年 GTC (GPU Technology Conference) 技術峰會,改為香港時間 5 月 14 日晚上 9 時,進行綫上發佈會。今屆 GTC 重點產品之一已被流出,NVIDIA 首席執行長暨創辦人 Jensen Huang (黃仁勳) 將正式公佈新一代 DGX A100 超級電腦,使用首度推出的 Ampere GPU,其開發代號「GA100」,它由 Samsung 7nm EUVL 製程生產,每顆整合 8,192 個 CUDA 單元。總共使用 16 顆 GA100,每 8 顆分佈於 2 塊大型綫路上,整台 DGX A100 結構是特殊設計,迎合數據中心的機架 (Rackmount) 安裝環境。

現時用家熟悉的 Turing 微架構 GPU,亦即 GeForce RTX 20 系列,最高階「TU102」核心最大 CUDA 數量是 4,608 個。至於限量推出的 GeForce TITAN V 系列顯示卡,其採用「GV100」核心晶片,其最大 CUDA 數量是 5,120 個。故新一代 Ampere GPU,單一顆「GA100」核心晶片便達到 8,192 個 CUDA,相比 Turing 及 Volta 微架構的極限,分別提升 77.8% 及 60%,絕對相當誇張。DGX A100 總運算能力及功耗方面,有待 NVIDIA 官方正式公佈規格數據。

NVIDIA Ampere GPU 登場!16 顆同步‧推出 DGX A100 超級電腦
DGX A100 是橫身設計,可安裝於 19 吋闊機架,及支援多台同步運作。

NVIDIA Ampere GPU 登場!16 顆同步‧推出 DGX A100 超級電腦
DGX A100 結構將類似上代 DGX-2 超級電腦,16 顆 GPU 分佈於 2 塊綫路上。

提供 Intel 及 AMD 版本

Ampere 可視為第二代 Turing 微架構,內部每個 S.M. (Streaming Multiprocessors) 模組,FP32 單元數量加倍,Tensor Cores 單元效能快兩倍,並由 RT Cores 提升至「RT Cores Advanced」。Tensor Cores 及 RT Cores 在 3D 圖像方面,能分別應付 DLSS-AA (深度學習抗鋸齒) 及 RRT (實時光綫追蹤)。然而在運算應用層面,Tensor Cores 與 RT Cores 能配合 CUDA 單元,共同達成人工智能及深度學習,也能應用於人臉辨識系統、無人駕駛汽車控制系統等。

DGX A100 超級電腦將提供 2 個版本,一款使用 Intel「Cascade Lake-SP」微架構的 Xeon 處理器,另一款使用 AMD「Zen 3」微存架構的 EPYC 處理器,原因是不少運算應用,需倚賴處理器與 GPU 同步運算。NVIDIA 即將正式發佈 DGX A100,反映 Ampere GPU 已投入量產階段,GA100 核心晶片將簡化為「GA102」、「GA104」、「GA106」多個版本,依次成為 GeForce RTX 3080 系列、RTX 3070 系列及 RTX 3060 系列等主流市場顯示卡。GeForce RTX 30 全綫產品,預計最快在 9 月上市,正式取代 2018 年 9 月開始面世的 RTX 20 系列。

NVIDIA Ampere GPU 登場!16 顆同步‧推出 DGX A100 超級電腦
現時 Turing 微架構,每組 S.M. 模組內建 1 組 INT32、FP32、Tensor Cores 及 RT Cores。

NVIDIA Ampere GPU 登場!16 顆同步‧推出 DGX A100 超級電腦
新一代 Ampere 微架構,FP32 及 Tensor Cores 單元數量均加倍,提升至 RT Cores Advanced 單元。

【硬件】Intel 十一代 Core 架構大革新!400 系晶片已「PCI-E 4.0 Ready」?

【硬件】假冒 Intel Core i7‧i9 湧現!「空心 U」內部沒有核心晶片

Source:ezone.hk、Wccftech

Page 1 of 8