
NVIDIA GeForce RTX 5070 FE 詳測!NVIDIA GeForce RTX 50 系列再有新成員登場,續早前開賣的 GeForce RTX 5090 D、RTX 5080 及 RTX 5070 Ti 後,下一級的 GeForce RTX 5070 也正式解禁。ezone.hk 今次將解構 GeForce RTX 5070 的特點,並與上代 Ada Lovelace 架構同級的 GeForce RTX 4070 作效能實測比較,同時會以最新推出的《Monster Hunter Wilds》測試 RTX 5070 之表現。
刻按此,用 App 睇更多產品開箱影片
NVIDIA GeForce RTX 5070 FE 詳測!挑戰《Monster Hunter Wilds》4K 最高畫質!
NVIDIA 於 2025 年 1 月的 CES 展覽中,正式發佈了全新 GeForce RTX 50 系列顯示卡,NVIDIA GeForce RTX 5070 作為 NVIDIA 第四款 Blackwell 顯示核心架構產品,官方定價 US$549 (約 HK$4,282),與上代 RTX 4070 相同 ,跟上級 RTX 5070 Ti 相比,則平上 US$200 (約 HK$1,560),今次 ezone.hk 詳細剖析 RTX 5070 之特點。
Techno 01:6,144 個 CUDA Cores
GeForce RTX 5070 使用 GB205 核心,屬上線 RTX 5080/RTX 5070 Ti 使用 GB203 核心的簡化版,同樣 Blackwell 顯示核心架構及 TSMC 4N 定制工藝,但內建電晶體由 456 億降至 311 億電晶體,而 Die 面積則為 263mm2,與上代 RTX 4070 使用 AD104 核心的 358 億顆電晶體及 263mm2 Die 面積相比,RTX 5070 的電晶體更少及 Die 更細,而 TGP 則由 200W 增加至 250W。
GB205 核心內建 5 個 GPC (Graphics Processing Clusters),每個 GPC 設有 8 個 TPC (Texture Processing Clusters) 及 16 個 SM(Streaming Multiprocessors) 及 16 個 ROPs ,而每個 SM 則擁有 4 組處理模組,每模組設 32 個 FP32/INT32 CUDA Cores 及 1 個 Tensor Cores。因此,GeForce RTX 5070 只提供 6,144 個 CUDA Cores、192 個 Tensor Cores 及 48 個 RT Cores。從下表下見,GeForce RTX 5070 在 CUDA Cores、Tensor Cores 及 RT Cores 數目上領先 RTX 4070,同時受惠於升級的核心架構,包括第 4 代 Tensor Cores、第 5 代 RT Cores 等,使各效能參數明顯提升。
Specification | GeForce RTX 5070 | GeForce RTX 4070 |
GPU Codename | GB205 | AD104 |
GPU Architecture | NVIDIA Blackwell | NVIDIA Ada Lovelace |
GPCs | 5 | 5 |
TPCs | 24 | 23 |
SMs | 48 | 46 |
CUDA Cores / SM | 128 | 128 |
CUDA Cores / GPU | 6144 | 5888 |
Tensor Cores / SM | 4 (5th Gen) | 4 (4th Gen) |
Tensor Cores / GPU | 192 (5th Gen) | 184 (4th Gen) |
RT Cores | 48 (4th Gen) | 46 (3rd Gen) |
GPU Boost Clock (MHz) | 2512 | 2475 |
Peak FP32 TFLOPS | 30.9 | 29.1 |
Peak FP16 TFLOPS | 30.9 | 29.1 |
Peak BF16 TFLOPS | 30.9 | 29.1 |
Peak INT32 TOPS | 30.9 | 14.6 |
RT TFLOPS | 93.6 | 67.4 |
Peak FP4 Tensor TFLOPS | 493.9/987.8 | N/A |
Peak FP8 Tensor TFLOPS (FP16 Accumulate) | 246.9/493.9 | 233.2/466.4 |
Peak FP8 Tensor TFLOPS (FP32 Accumulate) | 123.5/246.9 | 116.6/233.2 |
Peak FP16 Tensor TFLOPS (FP16 Accumulate) | 123.5/246.9 | 116.6/233.2 |
Frame Buffer Memory Size & Type | 12 GB GDDR7 | 12 GB GDDR6X |
Memory Interface | 192-bit | 192-bit |
Memory Clock (Data Rate) | 28 Gbps | 21 Gbps |
Memory Bandwidth | 672 GB/sec | 504 GB/sec |
ROPs | 80 | 64 |
Pixel Fill-rate (Gigapixels/sec) | 201 | 158.4 |
Texture Units | 192 | 184 |
Texel Fill-rate (Gigatexels/sec) | 482.3 | 455.4 |
L1 Data Cache/Shared Memory | 6144 KB | 5888 KB |
L2 Cache Size | 49152 KB | 36864 KB |
Register File Size | 12288 KB | 11776 KB |
Video Engines | 1 x NVENC (9th Gen), 1 x NVDEC (6th Gen) | 1 x NVENC (8th Gen), 1 x NVDEC (5th Gen) |
TGP (Total Graphics Power) | 250 W | 200 W |
Transistor Count | 31.1 Billion | 35.8 Billion |
Die Size | 263 mm² | 294.5 mm² |
Manufacturing Process | TSMC 4nm 4N (NVIDIA Custom Process) | TSMC 4nm 4N (NVIDIA Custom Process) |
PCI Express Interface | Gen 5 | Gen 4 |
Techno 02:記憶體頻寬提升 33%
NVIDIA 在 GeForce RTX 50 系列內引入 GDDR7 記憶體支援,而 RTX 5070 是續 RTX 5090 D、RTX 5080、RTX 5070 Ti 後第四款使用 GDDR7 記憶體的產品。RTX 5070 使用 6 組 32-bit 記憶體控制器組成 192-bit 架構,提供 12GB 總容量,而記憶體運作時脈則為 28Gbps,故可提供 672GB/s 的寬頻 (RTX 5070 Ti 為 896GB/s),較上代 RTX 4070 (192-bit 12GB GDDR6X 時脈 21Gbps) 的 504GB/s 提升 33%。
Techno 03:DLSS 4 技術加持
NVIDIA 與 Blackwell 架構同時推出了 DLSS 4(Deep Learning Super Sampling 4),作為新一代的 AI 驅動升級技術,提升圖形處理的性能和畫質。
DLSS 4 的技術突破在於其多幀生成能力,這是一項基於 Transformer 模型的新技術,能顯著提高遊戲幀率並增強畫面表現力。
- 多幀生成(Multi-Frame Generation):DLSS 4 可通過生成多達 3 幀的 AI 驅動像素,實現遊戲幀數的多倍提升,達到全新的性能高度。
- 光線重建(Ray Reconstruction):優化了光追效果的細節,使畫面表現更為真實。
- 深度學習反鋸齒(DLAA):進一步提升畫面的邊緣平滑度與紋理細節,為高端顯示設備提供了絕佳的畫質支持。
DLSS 4 對各代 RTX 顯示核心支援
DLSS 4 是 NVIDIA 最新的 AI 驅動圖形升級技術,其支援範圍涵蓋多個世代的 RTX 顯示核心,但功能啟用程度因硬體規格而異。
RTX 50 系列:作為 Blackwell 架構的代表作,RTX 50 系列能充分發揮 DLSS 4 的全部功能,包括多幀生成(Multi-Frame Generation)、光線重建(Ray Reconstruction)及深度學習反鋸齒(DLAA),在 4K 分辨率下實現高達 8 倍的性能提升。
RTX 40 系列:DLSS 4 在 RTX 40 系列顯卡上部分功能可用,例如光線重建和 DLAA,但由於硬體限制,未能支援多幀生成,只提供基本的單幀生成。
RTX 30 系列與 RTX 20 系列:這些世代支援 DLSS 4 的基本功能如超級分辨率、光線重建及 DLAA,但無法運行進階的多幀生成技術。
其他技術:Reflex 2 、RTX 神經渲染(Neural Rendering)、 NVIDIA ACE 等
可參考此文章:NVIDIA RTX 50 系列顯示核心完整解構!Blackwell 架構技術新時代!
解構 NVIDIA GeForce RTX 5070 FE
今次送測的 NVIDIA GeForce RTX 5070 FE (Founders Edition) 擁有 6,144 CUDA Cores,Boost Clock 達到 2,512MHz,配上 12GB 192-bit GDDR7 記憶體,定價為 US$549 (約 HK$4,282) 。GeForce RTX 5070 FE 同樣採用了全新的環保包裝理念,完全摒棄了塑料材質,體積僅為 RTX 4070 FE 包裝的一半,外觀相當低調。外包裝採用類似蘋果 iPhone 包裝封條的密封設計。
NVIDIA GeForce RTX 5070 FE (Founders Edition) 外型與上線 GeForce RTX 5080 FE 相近,但再迷你化,全卡為 242mm x 112mm x 40mm,只佔用 2-Slot,適合安裝於迷你電腦機箱中。
GeForce RTX 5070 FE 能達成 2-Slot 厚度的秘密,在於採用了全新的 「雙穿透氣流」 散熱設計,包含均溫板、熱導管、散熱鰭片與雙風扇。
正面配備兩顆 9cm 軸向式風扇,透過 縮短中央電路板,讓風流得以貫穿顯示卡,提高散熱效率
GeForce RTX 5070 FE 側面設計了一個 90° 斜角的 PCIe 12V-2×6 供電接頭,這樣的設計主要用於 節省電路板空間,同時讓玩家在 使用原生線材時更容易理線,減少雜亂的佈線影響整體美觀度。
GeForce RTX 5070 FE 提供 3 個 DisplayPort 2.1b UHBR20 與 1 個 HDMI 2.1b,支援以下解析度與刷新率:
- 4K 480Hz 或 8K 165Hz DSC(DisplayPort)
- 4K 480Hz 或 8K 120Hz DSC + Gaming VRR、HDR(HDMI)
最多 4 個螢幕輸出時:最高解析度為 4K 165Hz(DP 或 HDMI);2 個螢幕輸出時最高解析度提升至 4K 360Hz 或 8K 100Hz DSC(DP 或 HDMI)。
GeForce RTX 5070 FE 配新版 「PCIe 12V-2×6 柔軟編織 PCIe 8pin 轉接線」,此新款轉接線具有 更高的柔軟度,並在接頭處增設了 額外保護層,確保玩家在裝機時不會影響接頭密合度,而 RTX 5070 需要 2 條 PCIe 8pin 轉接至 PCIe 12V-2×6。
供電方面,GeForce RTX 5070 FE 的 TGP 功耗由 RTX 4070 的 200W 升至 250W (上線 RTX 5070 Ti 為 300W),並要供電源供應器最低 650W 輸出。
GeForce RTX 5070 VS RTX 4070
3D 效能、DLSS4 加速、《MHW》、AI 運算、功耗溫度詳測
為了發揮 GeForce RTX 5070 的最高效能,使用 24 核心、支援 PCIe 5.0 的 Intel Core i9 14900K 處理器及 ASUS ROG MAXIMUS Z790 FORMULA 主機板進行測試。
<測試平台>
●處理器:Intel Core i9 14900K● 主機板:ASUS ROG MAXIMUS Z790 FORMULA●記憶體:G.Skill Trident Z5 RGB DDR5-6000MHz 2 x 16GB●顯示卡:影馳 GeForce RTX 5070 FE、GeForce RTX 4070 FE●SSD:WD Black SN850 NVMe SSD 2TB●作業系統:《Windows 11 Pro 24H2 64-bit》●驅動程式:NVIDIA《GeForce Driver 572.50》●散熱:ASUS ROG Strix LC II 360 ARGB
Test 01:3DMark 理論遊戲效能
分析:新架構效能提升高達 40%
NVIDIA GeForce RTX 5070 採用全新一代 Blackwell 架構的 GB203 核心,利用核心架構的改進,即第 5 代 Tensor Cores 及第 4 代 RT Cores。在 《3DMark》- Fire Strike Ultra 測試中,RTX 5070 獲得 14,463 分的成績,比 RTX 4070 的 10,259 分高出約 40%,而其他《3DMark》測試項目也表現出全面提升,足證新一代 Blackwell 架構帶來的效能優勢。
Test 02:DLSS 4 遊戲效能測試
GeForce RTX 50 系列另一大賣點是完整支援 DLSS 4 (Deep Learning Super Sampling 4) 技術,當中重點的 DLSS MULTI FRAME GENRATION 功能是由 Blackwell GPU 內第 5 代 Tensor Cores 進行處理。ezone.hk 找來多款對應 DLSS 4 技術的 3D 遊戲於 QHK (2,560x1,440) 解像度、最高畫質及啟用光追技術下進行測試。
《Cyberpunk 2077》
《Cyberpunk 2077》最新更新已支援新一代 DLSS4 技術,配合 RTX 50 系列即可「DLSS Multi Frame Generation」功能,可選 2x、3x、4x 。
效能測試:
《Star Wars Outlaw》
《Star Wars Outlaw》是另一款原生支援 DLSS4 技術的遊戲,遊戲內「Frame Generation」選項同樣可設「4x」。
效能測試:
《Alan Wake 2》
《Alan Wake 2》「DLSS Frame Generation」選項。
效能測試:
《Marvel Rivals》
《Marvel Rivals》「DLSS Frame Generation」選項。
效能測試:
《Dragon Age: The Veilguard》
《Dragon Age: The Veilguard》需在 NVIDIA 應用程式內設定「DLSS Multi Frame Generation」。
效能測試:
分析:DLSS4 威力盡顯
GeForce RTX 5070 內建 第 5 代 Tensor Cores 進行「DLSS MULTI FRAME GENRATION 」,有效提升遊戲 FPS 流暢度。從測試可見,在未啟用 DLSS MULTI FRAME GENRATION 前,GeForce RTX 5070 已能領先 RTX 4070 約 13% 至 90%。不過,當啟用 DLSS MULTI FRAME GENRATION 技術,GeForce RTX 5070 表現大幅提升,領先 RTX 4070 80% 至最高 131%,可見新架構配合 DLSS MULTI FRAME GENRATION 的威力。
《3DMark》 DLSS 測試
《3DMark》DLSS 4 測試 GPU 在使用不同 Frame Generation 設定的流暢度,測試可見 RTX 5070 Ti 在啟用 2X、3X、4X Frame Generation 後,FPS 分別由 41.08 提升了 3 至 5 倍。
Test 03:《Monster Hunter Wilds》測試
近期大熱的《Monster Hunter Wilds》,PC 版由 Capcom 使用自家的 RE 引擎開發,該引擎以優異的畫面表現和效能著稱。在這款遊戲中,玩家將體驗到細緻入微的環境設計和逼真的角色模型,進一步提升了遊戲的沉浸感。為提升畫質與效能,遊戲支援 NVIDIA 的 DLSS 3 .5 技術,透過深度學習超級採樣,玩家可在高解析度下享受更流暢的遊戲體驗。此外,遊戲也實現了光線追蹤反射效果,使光影呈現更為真實,增強了視覺效果的真實感。這次測試,分別在 QHD 及 4K 解像度下進行,並設為 Ultra 最高畫質及啟用最高光追技術,以考驗 RTX 5070、RTX 4070 之實力。
4K 解像度
在 4K 解像度下,DLSS 的效能提升明顯,在 Ultra 最高畫質和光追全開的情況下,顯示卡的負擔相當沉重。RTX 5070 FE 在 DLSS 關閉時僅能維持 44.84 FPS,開啟 DLSS 後提升至 76.83 FPS,提升 71.3%。RTX 4070 FE 則由 33.45 FPS 提升至 58.65 FPS,增幅 75.4%。即便 DLSS 幫助顯著,RTX 4070 FE 在 4K 下仍無法穩定達到 60 FPS,可能需要進一步調整畫質設定來確保流暢性。
QHD 解像度
在 1440p 解像度下,《Monster Hunter Wilds》開啟 DLSS 能顯著提升遊戲幀率。RTX 5070 FE 在 DLSS 關閉時達 71.9 FPS,而開啟後提升至 111.03 FPS,提升幅度約 54.5%。RTX 4070 FE 也從 56.25 FPS 提升至 97.88 FPS,增幅達 74%。這樣的表現確保了高刷新率顯示器的流暢度,無論是 RTX 5070 FE 還是 RTX 4070 FE,都能在 1440p 下提供穩定的高幀率體驗。
總評:還待 DLSS4 正式支援
RTX 5070 FE 於《Monster Hunter Wilds》 1440p 解像度下表現優異,開啟 DLSS 能確保 100 FPS 以上的流暢度,適合高刷新率玩家。而在 4K 解像度,RTX 5070 FE 開啟 DLSS 可達 76 FPS,勉強維持順暢,但 RTX 4070 FE 仍略顯吃力。目前《Monster Hunter Wilds》尚未原生支援 DLSS 4,未來若更新至 DLSS 4 支援,RTX 5070 FE 表現有望以倍數提升。
Test 04:AI 運算測試
NVIDIA Blackwell 新架構除了在遊戲效能提升,在 AI 運算表現也有大幅度的優化,ezone.hk 今次找來多款評估系統生成式 AI 模型性能的工具,測試 RTX 5070 的 AI 運算表現。
《UL Procyon AI Text Generation》測試
UL Procyon AI Text Generation 測試是一套專為評估生成式 AI 模型性能的工具,適用於主流的文字生成應用場景。此測試專注於分析大型語言模型(LLM)在不同硬體上的推理能力與效能表現,涵蓋內容生成、文本總結及創意寫作等真實使用情境。
該工具支援多種生成式 AI 模型(如 Meta 的 Llama 2),並記錄關鍵性能指標,包括「生成第一個標記的時間」和「每秒生成後續標記的速度」。此外,測試兼容 Microsoft 的 ONNXRuntime-GenAI,允許模型在多種硬體環境下執行,並充分利用 DirectML 實現加速。UL Procyon AI Text Generation 測試為硬體性能評估提供了一種標準化的方法,使開發者能夠比較不同 GPU 的生成式 AI 工作負載表現,是評估硬體在生成式 AI 任務中效率的關鍵工具。
分析:AI 全面加速
從以上 AI 測試結果可見,NVIDIA GeForce RTX 5070 在 AI 運算方面展現了顯著的進步,主要得益於全新的 Blackwell 架構和第五代 Tensor Cores。這些改進使其在處理生成式 AI 和深度學習任務時的性能達到新高度。
Test 05:運作溫度.功耗
分析:功耗、熱量增加
GeForce RTX 5070 TGP 功耗由 RTX 4070 的 200W 增加至 250W。ezone.hk 利用《Cyberpunk 2077》遊戲進行測試,並紀錄核心溫度與功耗。測試成績可見,顯示核心在遊戲時全負載時,平均功耗為 232.58W,較上代 RTX 4070 高 36.5W,而溫度也升高了 7.6℃。
評語:還看 AMD 反擊
GeForce RTX 5070 作為 RTX 50 系列第四位成員,利用新一代 Blackwell 新架構,效能表現相當出色,配合 DLSS 4 MULTI FRAME GENRATION 技術更是如虎添翼,相信隨著更多遊戲支援 DLSS 4,其優勢將更顯著。不過,AMD 使用新一代 RDNA 4 架構.、定價同為 US$549 的 Radeon RX 9700 已發布,效能更將於明天解禁,相信或可與 GeForce RTX 5070 一較高下。
【精選消息】
Source: ezone.hk