NVIDIA RTX 30 系列規格曝光 效能較 RTX 2080 Ti 再快五成!

| 朱力恒 | 15-05-2020 18:07 |
NVIDIA RTX 30 系列規格曝光  效能較 RTX 2080 Ti 再快五成!

NVIDIA GeForce RTX 30 系列顯示卡,傳聞最快 9 月上市,規格陸續浮上水面。衍生自全新 Ampere 微架構,相比上代 Turing 微架構,IPC 運算效能快 10% 至 20%。Ampere GPU 由 7nm EUV 製成,令時脈可超出 2GHz。最高階 RTX 3080 Ti,效能較 RTX 2080 Ti 快 50% 甚至最多 70%。此外,RT Cores 提升為「Advanced」改良版,強調開啟 RRT (實時光綫追蹤) 的效能折損程度,較 Turing 微架構更低。

  • Ampere 是 Turing 架構大改,台積電 7nm EUV 製程
  • 最高階旗艦是 RTX 3080 Ti,5,376 CUDA 單元
  • 開啟實時光綫追蹤,效能折損程度將極低

【硬件】Intel 十代 Core 正式登場!最高 10 核心‧5.3GHz Turbo 時脈

【硬件】Intel Z490 主板抵港率先睇!晶片原生 2.5Gbps LAN

終於 PCI-E 4.0 x16 介面

NVIDIA 上周正式公布「DGX A100」超級電腦,每台具 8 顆 Ampere 微架構的「GA100」核心晶片,每顆 8,192 個 CUDA,由此確定 Ampere GPU 已正式量產。如此誇張規格的 GA100 核心晶片,將不會投放到主流市場。GA100 將依定位高至低,衍生 GA102、GA103 及 GA104,分別製成 RTX 3080 Ti、RTX 3080 及 RTX 3070,全綫使用 18GHz GDDR6 記憶體。原生支援 PCI-E 4.0 x16 訊號介面,終於與 AMD「Navi 10」GPU 看齊。

RTX 3080 Ti 旗艦型號,整合 84 組 S.M. (Streaming Multiprocessors) 模組,每組 S.M. 具 64 個 CUDA 單元,因此合共 5,376 個 CUDA。對比現時 RTX 2080 Ti,整合 68 組 S.M. 及 4,352 個 CUDA,故 RTX 3080 Ti 在 CUDA 數量大增 23.5%。RTX 3080 Ti 整合 12 組 GDDR6 控制器,構成 384-bit 位寬 (Bit-width),18,000MHz 而達到 864GB/s 頻寬!Ampere GPU 全綫由 TSMC 7nm EUV 製程生產,大幅改善「功耗 / 效能」比率,而且屆時核心 Boost 時脈將衝出 2GHz 以上。

NVIDIA RTX 30 系列規格曝光  效能較 RTX 2080 Ti 再快五成!
NVIDIA 上周四 (5 月 14 日) 正式公布 DGX A100 超級電腦,由此證實 Ampere GPU 已量產。

NVIDIA RTX 30 系列規格曝光  效能較 RTX 2080 Ti 再快五成!
現時 RTX 20 系列主要使用 Micron「D9WCW」14GHz GDDR6 顆粒,屆時將改用 18GHz 新顆粒。

IPC 效能快 10% 至 20%!

相比 Turing 微架構,Ampere 的 L2 緩存容量提升一倍,FP32 浮點運算單元數量倍增,Tensor Cores 由 2 個分拆成 4 個,以改善平行運算效率,及 RT Cores 變成 RT Cores Advanced。綜合上述改善,Ampere 的 IPC (每 MHz 時脈執行指令) 效能加強 10% 至 20%。Ampere GPU 開啟 RRT 的效能折損程度將極低,不像 Turing GPU 般將造成效能明顯下跌。RTX 3080 Ti 旗艦型號而言,針對 4K 120fps 超高清流暢「打機」而設。

Turing GPU 所支援的 DLSS 2.0 (深度學習超取樣抗鋸齒) 技術,Ampere GPU 將升級至 DLSS 3.0,要求 3D 遊戲開發商需要重新編程,但 DLSS 3.0 能藉着新指令而簡化運算複雜程度,縮短延遲時間及資料存取大小。Ampere GPU 還有 2 項「秘密武器」,其一是「Tensor Accelerated Lossless VRAM Compression」,運用 Tensor Cores 將 3D 圖像資料進行實時無損性壓縮,節省記憶體的流量。

NVIDIA RTX 30 系列規格曝光  效能較 RTX 2080 Ti 再快五成!
Ampere GPU 的 S.M. 模組架構圖。每個 S.M. 模組,整合 2 個 FP32、4 個 Tensors Cores 及 1 個 RT Cores Advanced。

NVCache:VRAM 充當緩存

另一是 NVCache,將顯示卡本身記憶體 (Video RAM;VRAM) 充當超高速緩存區,並且與系統主記憶體同步配合,將常用的 3D 圖像資料暫存於 VRAM 內。另一邊廂,確定已沒用的 3D 圖像資料,則從 VRAM 移至系統主記憶體中。其實 AMD 曾於 Vega 微架構 GPU,具備名為 HBCC (High-Bandwidth Cache Controller) 技術,原理正是相同,然而 NVIDIA 將之倣效及取名 NVCache。

【硬件】AMD 平價四核 Ryzen 3 3100/3300X!鐵定 5‧22 上市

【硬件】AMD 將有 A520 平價晶片!Ryzen 1000「舊 U」砌機救星?

Source:ezone.hk、HexusTweakTown

 

Page 1 of 8