新一代 NVIDIA GeForce RTX 30 系列顯示卡,採用全新 Ampere 架構,以 8nm 製程生產,內建最多 10,496 CUDA Cores、24GB GDDR6X 記憶體、支援 PCI-E 4.0 等。跟上代 Turing 架構比較,有 2 倍效能提升及 1.9 倍能源效率改善。今次,ezone.hk 詳細剖析 Ampere 架構技術,並考驗性價比最高 RTX 3080 之效能。
Ampere 架構詳解
Techno 01:運算力提升 2 倍
GeForce RTX 30 系列是 NVIDIA 第二代 RTX 產品,採用 Ampere 架構,由 Samsung 以 8nm 製程代工。在 Ampere 架構下,每組 SM (Streaming Multiprocessors) 擁有 16 個 FP32 與 16 個 FP32/INT32 核心,一個時脈周期可執行 32 FP32 或 16 FP32,以及 16 INT32 的運算,而 4 個 SM 分區達到 128 FP32 運算/Clock,提供 RTX 20 系列的 2 倍 FP32 處理量,高達 30 Shader-TFLOPS 處理能力。
【精選消息】Apple A14 Bionic 深入解構!5nm 製程‧效能激增 40%!
【精選消息】【蘋果發佈會】iPad Air 4 或支援 5G?官網規格露玄機!
此外,Ampere 架構內的第二代 Ray Tracing 專屬核心,大幅加速 Triangle Intersection 效能,並加入 Motion Blur 硬體加速,效能達到 58 RT-TFLOPS,處理量是上代的 2 倍,並可同時進行光綫追蹤、著色與運算處理。最後,第三代的 Tensor 核心導入 Sparse Deep Learning 技術,並通過 Tensor Core 針對 Sparsity Optimized,即使維持同樣演算法,也可達上一代 Turing 架構的 2 倍效能提升,處理能力高達 238 Tensor-TFLOPS,能以更高效率執行 NVIDIA DLSS 等 AI 驅動技術。
Techno 02:CUDA 單元數量倍增
Ampere 架構的 GeForce RTX 30 系列顯示卡,包括 RTX 3090、RTX 3080 及 RTX 3070 三款型號,CUDA Core 數目大幅提升。最頂級的 GeForce RTX 3090,稱為「BFGPU (Big Ferocious GPU)」,意旨「大型兇猛 GPU」,內建驚人的 10,496 個 CUDA Core,而今次測試的 RTX 3080,也擁有 8,704 個 CUDA Core,是上代 Turing 架構 RTX 2080 Super (3,072 個 CUDA Core) 的 2.8 倍。即使最低階的 RTX 3070,也設有 5,888 個 CUDA Core,較上代 Turing 架構最頂級的 RTX TITAN (4,608 個 CUDA Core) 多出 1,280 個。
Techno 03:NVIDIA RTX IO 技術
GeForce RTX 30 系列引入全新 NVIDIA RTX IO 技術,讓 GPU 快速解壓縮與載入遊戲資料,比傳統儲存架構的 I/O 效能有 100 倍提升。另外,與 Microsoft 全新 DirectStorage for Windows API 一併使用,RTX IO 把原來相等如數十個 CPU 核心的負戴,交由 RTX GPU 運算升,大幅改善畫面更新率,以及近乎即時的遊戲載入。此外,NVIDIA 在 GeForce RTX 30 系列引入 NVIDIA Reflex (360Hz NVIDIA G-SYNC)、NVIDIA Broadcast (AI 雜音消除、虛擬背景效) 及 NVIDIA Omniverse Machinima (藝術形式) 三項新技術,特別為遊戲玩家、電競職業選手、遊戲直播而設。
兵分三路出擊!
GeForce RTX 30 系列分三路出擊,今次測試的 RTX 3080,內建 8,704 個 CUDA Core,配搭 10GB 320-bit GDDR6X 記憶體,定價 US$699 (HK$5,452)。最頂級的 GeForce RTX 3090 ,擁有 10,496 個 CUDA Core、24GB 384-bit GDDR6X 記憶體,售 US$1,499 (HK$11,692) 起,於 9 月 24 日開賣。至於定價 US$499 (HK$3,892) 的 RTX 3070,則內建 5,888 個 CUDA Core,配搭 8GB 256-bit GDDR6 記憶體,將於 10 月 15 日賣街。
GeForce RTX 3080 綫路拆解
上代 Turing 核心以 TSMC (台積電) 12nm 製程生產,全新 Ampere 核心則由 Samsung 以 8nm 製程代工。今次測試的 RTX 3080,採用 GA102 核心,電晶體多達 283 億顆,較上代 RTX 2080 Super 的 TU104 核心內建 136 億顆電晶體,多出一倍以上,但受惠於 8nm 製程,晶片面積 (Die Size) 只由 TU104 核心的 545mm² 微增 15.2% 至 628mm²。RTX 3080 官方建議板載 10GB 320-bit GDDR6X 記憶體,建議核心 Base / Boost 時脈為 1,440 / 1,710MHz,核心內建 8,704 CUDA 及 272 T.M.U 單元,使用 PCI-E 4.0 x16 介面,最高 TDP 功耗 320W。今次測試的 RTX 3080 為 ZOTAC 型號,供電未有使用 NVIDIA 建議的全新 12-pin 設計,仍採用傳統的雙 8-pin,以及配搭自家散熱器。
A. RTX 3080 核心
代號 GA102-200,晶片面積為 628mm²,較上代 GTX 2080 Super (545mm²) 大 15.2%。
B. GDDR6X 記憶體
官方建議板載 10GB 320-bit GDDR6X 記憶體,記憶體頻寬高達 760GB/s。
C. 視訊輸子
提供 1 組 HDMI 2.1 及 3 組 DP 1.4a,支援輸出最高 8K @ 120Hz 畫面。
D. 電源輸入
廠商未有參考官方的全新 12-pin 供電插座設計,而是使用傳統的雙 8-pin。
E. 供電設計
RTX 3080 功耗高達 320W,故板載 16 相供電。
F. PCI-E 4.0 介面
RTX 30 系列已升級支援 PCI-E 4.0 x16 介面,頻寬達 32GB/s。
G. GPU-Z 檢測
最新《GPU-Z 2.34》已支援 RTX 30 系列,可見顯示卡介面為 PCI-E 4.0 x16。
首批 RTX 3080 檢閱
VGA 01:GALAX GeForce RTX 3080 SG (1-Click OC)
售價:$6,399
查詢:Felton
電話:2273 8393
SPEC:型號:GALAX GeForce RTX 3080 SG (1-Click OC) ●核心:GF RTX 3080 (GA102) ●記憶體:10GB 320-bit GDDR6X ●時脈:Default 1,440 / 1,710、OC 1,440 / 1,725 (核心 Base / Boost)●介面:PCI-E 4.0 x16 ●視訊輸出:HDMI 2.1 x1、DisplayPort 1.4a x3 ● ●電源輸入:8-pin + 8-pin ●TDP 功耗:320W
GALAX GeForce RTX 3080 SG (1-Click OC) 散熱器頂部整合大面積 RGB LED,表面設有半透明霧面組件,滲出較柔和 RGB 光效,配合自家《XtremeTuner》軟件或手機 App,可調校 RGB 光效,以及進行超頻。散熱方面,GALAX 參考 NVIDIA 的前後雙風扇設計再改良,採用自家三扇式散熱器,風扇直徑達 98mm,用上 11 扇葉 WINGS 設計,在高風壓下仍能保持低噪音;卡背尾端則設有 1 把可裝拆的 80mm 風扇,進一步將核心熱力迅速帶走。值得一提是,由於此卡重量十足,故隨卡附送 VGA Support Stick,並支援 RGB 燈效。
VGA 02:ZOTAC GAMING GeForce RTX 3080 Trinity
售價:$5,480
查詢:GTR
電話:2305 1756
SPEC:型號:ZOTAC GAMING GeForce RTX 3080 Trinity ●核心:GF RTX 3080 (GA102) ●記憶體:10GB 320-bit GDDR6X ●時脈:1,440 / 1,710 (核心 Base / Boost)●介面:PCI-E 4.0 x16 ●視訊輸出:HDMI 2.1 x1、DisplayPort 1.4a x3 ● ●電源輸入:8-pin + 8-pin ●TDP 功耗:320W
ZOTAC GAMING GeForce RTX 3080 Trinity 定價 $5,480,跟 NVIDIA 官方 Founder Edition 定價 US$699 (約 HK$5,452) 相近。此卡配搭自家散熱器,核心、記憶時脈則參照官方建議。散熱部分採用改良版 IceStorm 2.0 冷卻系統,11 扇葉表面用上「拋光 + 磨砂」設計,有助提升 10% 氣流量。頂部整合自家「Spectra 2.0」RGB 模組,金屬背板亦提供 ARGB LED 燈效,配合《FireStorm 3》軟件,支援調校 RGB 光效、時脈、Vcore 電壓等。
GeForce RTX 3080 效能‧功耗實測
由於 GeForce RTX 30 支援 PCI-E 4.0 介面,故測試使用 AMD Ryzen 9 3900X 處理器及 ASUS ROG Crosshair VIII Formula (AMD X570) 主機板的 AMD 平台,所有測試顯示卡均使用 NVIDIA 最新的《GeForce Driver 456.16》驅動程式。
測試平台:●處理器:AMD Ryzen 9 3900X●主機板:ASUS ROG Crosshair VIII Formula (AMD X570)●記憶體:G.Skill Trident Z Royal DDR4 3,600 8GB x2●顯示卡:ZOTAC GAMING GeForce RTX 3080 Trinity (RTX 3080)、ASUS ROG-STRIX-RTX2080TI-O11G-GAMING (RTX 2080 Ti)、MSI GeForce RTX 2080 SUPER SEA HAWK (RTX 2080 Super)●SSD:Intel SSD 660p 512GBNVMe●作業系統:《Windows 10 Pro 64-bit》●驅動程式:AMD《Chipset Drivers 2.07.14.327》、NVIDIA《GeForce Driver 456.16》
Test 01:3DMark 理論‧遊戲效能
分析:效能大增 50%
RTX 3080 採用新一代 Ampere 架構,而且 CUDA 核心數目大增,以及 GDDR6X 記憶體加持,故效能相當驚人!《3DMark》- Time Spy Extreme 以 UHD 4K 解像度執行,測試顯示卡的極限 Direct X12 效能,RTX 3080 得分高達 8,291,比上代同級的 GTX 2080 Super (5,602 分) 快 48% 之多,面對上代高一級、定價貴 US$300 的 RTX 2080 Ti (6,797 分),RTX 3080 也有約 22% 領先。
在測試 Ray Tracing 的 《3DMark》- Port Royal,RTX 3080 分別比 RTX 2080 Ti 及 RTX 2080 Super 領先 24.6% 與 56.3%,可見第二代 Ray Tracing Cores 之威力。進入遊戲測試,RTX 3080 表現亦同樣出眾,較 RTX 2080 Super 快 40% 至 50%,而面對 RTX 2080 Ti,也有約 20% 之優勢 。
Test 02:運作溫度.功耗
分析:負載溫度 71℃
雖然 RTX 3080 已升級至 8nm 製程,但電晶體多達 283 億顆,較上代多出一倍以上,故 TDP 功耗也由 250W 增至 320W。在顯示核心全負載測試,平台總功耗 446.5W,比 RTX 2080 Super 平台增加 78.5W。
溫度方面,由於不同牌子的顯示卡採用自家散熱設計,而 RTX 2080 Super 更屬水冷版,故測試數據只作參考。不過,RTX 3080 負載溫度為 71℃,只較使用風冷散熱的 RTX 2080 Ti 高 7℃。
最值得升級新卡
GeForce RTX 30 系列使用 Ampere 新架構,加上 CUDA 數目激增,效能表現驚人,RTX 3080 實測效能已超越上代同級 RTX 2080 Super 型號達 50%,甚至輕鬆擊倒上一級 RTX 2080 Ti,因此令人更期待 RTX 3090 之效能。但據廠商表示,首批到港的 RTX 3080 數量有限,而於下星期四發售的 RTX 3090,更可能只有個位數,在供不應求情況下,很大機會出現炒價!
【相關新聞】GeForce RTX 3090、3080、3070 登場! Ampere 架構‧效能提升 100%!
【相關新聞】NVIDIA 低調發布新顯示核心!終於支援 PCI-E 4.0!
Source:ezone.hk