NVIDIA 在 GT(CGPU Technology Conference)大會上發布新一代 Volta 顯示核心架構,效能較上代 Pascal 提升 5 倍之多,而首款使用新架構的 Tesla V100 加速卡,廠商更指其運算能力等同 100 顆 CPU(處理器),並會應用於深度學習超級運算系統 DGX-1 上,利用 8 張 Tesla V100 計算卡,運算效能高達 960 TFLOPS。
史上最大 GPU 核心
Tesla V100 是基於 Volta 架構的首款產品,內建代號 GV100 的新一代顯示核心,雖然使用最新 12nm TSMC 製程,但內建多達 211 億個晶體,故面積達 815mm2,較上代 Pacal 架構 GP100 核心(16nm 製程 / 153 億個晶體)的 610mm2 大上 33% 之多,是市場上最大的 GPU 核心。
【精選消息】
【精選消息】
【精選消息】
內建 5,120 個 CUDA 單元
規格方面,GV100 設有 5,120 個 CUDA 單元,核心時脈達 1,455MHz,單精度浮點效能達到 15TFLOPS,而雙精度浮點運算也達 7.5 TFLOPS,再配上 16GB HBM2 高速顯示記憶體,顯示記憶體頻寬速達驚人之 900GB/s,GV100 的 L2 Cache 容量也由 GP100 的 4,096KB 增加至 6,144KB。
此外,NVIDIA 更在 GV100 內首次引入 672 個 Tensor Core,它是專門為深度運算操作而設計,效能以達到 120 TFLOPS。NVIDIA 表示 Volta 的效能是上代 Pascal 架構的 5 倍,更是 Maxwell 架構的 15 倍,並足以取代內建上百顆 CPU 的 HPC 。
Source:ezone.hk