
NVIDIA GeForce RTX 5070 Ti 超詳實測!NVIDIA GeForce RTX 50 系列再有新成員登場,續早前開賣的 GeForce RTX 5090 D 及 RTX 5080後,下一級的 GeForce RTX 5070 Ti 也正式解禁。ezone.hk 今次將解構 GeForce RTX 5070 Ti 的特點,並與上代 Ada Lovelace 架構同級的 GeForce RTX 4070 Ti 作效能實測比較,更會越級挑戰上代最頂級的 RTX 4090。
刻按此,用 App 睇更多產品開箱影片
NVIDIA GeForce RTX 5070 Ti 實測!DLSS 4 加持‧效能直迫 RTX 4090?!
NVIDIA 於 2025 年 1 月的 CES 展覽中,正式發佈了全新 GeForce RTX 50 系列顯示卡,NVIDIA GeForce RTX 5070 Ti 作為 NVIDIA 第三款 Blackwell 顯示核心架構產品,官方定價 6,299 人民幣 (約 HK$6,734),較上代 RTX 4070 Ti 首發時的 6,499 人民幣 (約 HK$6,948) 平上 200 人民幣 ,跟上級 RTX 5080 相比,則平上 2,000 人民幣 (約 HK$2,138),今次 ezone.hk 詳細剖析 RTX 5070 Ti 之特點。
Techno 01:8,960 個 CUDA Cores
GeForce RTX 5070 Ti 使用與上線 RTX 5080 相同的 GB203 核心,屬 Blackwell 顯示核心架構及 TSMC 4N 定制工藝,內建電晶體為 456 億電晶體,而 Die 面積則為 378mm2,與上代 RTX 4070 Ti 使用 AD104 核心的 358 億顆電晶體及 294.5mm2 Die 面積,有明顯的增加,是故 TGP 功耗也由 285W 輕微增加至 300W。
完整的 GB203 核心設有 7 個 GPC (Graphics Processing Clusters),每個 GPC 設有 8 個 TPC (Texture Processing Clusters) 及 16 個 SM(Streaming Multiprocessors) 及 16 個 ROPs ,而每個 SM 則擁有 4 組處理模組,每模組設 32 個 FP32/INT32 CUDA Cores 及 1 個 Tensor Cores。不過,GeForce RTX 5070 Ti 內的 GB203 核心只啟用當中的 6 個 GPC。
因此,GeForce RTX 5070 Ti 只提供 8,960 個 CUDA Cores、280 個 Tensor Cores 及 70 個 RT Cores。
從下表下見,GeForce RTX 5070 Ti 在 CUDA Cores、Tensor Cores 及 RT Cores 數目上領先 RTX 4070 Ti,同時受惠於升級的核心架構,包括第 4 代 Tensor Cores、第 5 代 RT Cores 等,使各效能參數明顯提升。
Specification | RTX 5070 Ti | RTX 4070 Ti |
GPU Codename | GB203 | AD104 |
GPU Architecture | NVIDIA Blackwell | NVIDIA Ada Lovelace |
GPCs | 6 | 5 |
TPCs | 35 | 30 |
SMs | 70 | 60 |
CUDA Cores / SM | 128 | 128 |
CUDA Cores / GPU | 8960 | 7680 |
Tensor Cores / SM | 4 | 4 |
Tensor Cores / GPU | 280 | 240 |
RT Cores | 70 | 60 |
GPU Boost Clock (MHz) | 2452 | 2610 |
Peak FP32 TFLOPS (non-Tensor) | 43.9 | 40.1 |
Peak FP16 TFLOPS (non-Tensor) | 43.9 | 40.1 |
Peak BF16 TFLOPS (non-Tensor) | 43.9 | 40.1 |
Peak INT32 TOPS (non-Tensor) | 43.9 | 20 |
RT TFLOPS | 133.2 | 92.7 |
Peak FP4 Tensor TFLOPS (FP4 AI TOPS) | 703/1406 | N/A |
Peak FP8 Tensor TFLOPS (FP16 Accumulate) | 351.5/703 | 320.7/641.4 |
Peak FP8 Tensor TFLOPS (FP32 Accumulate) | 175.8/351.5 | 160.4/320.8 |
Peak FP16 Tensor TFLOPS (FP16 Accumulate) | 175.8/351.5 | 160.4/320.8 |
Peak FP16 Tensor TFLOPS (FP32 Accumulate) | 87.9/175.8 | 80.2/160.4 |
Peak BF16 Tensor TFLOPS (FP32 Accumulate) | 87.9/175.8 | 80.2/160.4 |
Peak TF32 Tensor TFLOPS | 43.9/87.9 | 40.1/80.2 |
Peak INT8 Tensor TOPS | 351.5/703 | 320.7/641.4 |
Frame Buffer Memory Size and Type | 16 GB GDDR7 | 12 GB GDDR6X |
Memory Interface | 256-bit | 192-bit |
Memory Clock (Data Rate) | 28 Gbps | 21 Gbps |
Memory Bandwidth | 896 GB/sec | 504 GB/sec |
ROPs | 96 | 80 |
Pixel Fill-rate (Gigapixels/sec) | 235.4 | 208.8 |
Texture Units | 280 | 240 |
Texel Fill-rate (Gigatexels/sec) | 686.6 | 626.4 |
L1 Data Cache/Shared Memory | 8960 KB | 7680 KB |
L2 Cache Size | 49152 KB | 49152 KB |
Register File Size | 17920 KB | 15360 KB |
Video Engines | 2 x NVENC (9th Gen), 1 x NVDEC (6th Gen) | 2 x NVENC (8th Gen), 1 x NVDEC (5th Gen) |
TGP (Total Graphics Power) | 300 W | 285 W |
Transistor Count | 45.6 Billion | 35.8 Billion |
Die Size | 378 mm2 | 294.5 mm2 |
Manufacturing Process | TSMC 4nm 4N NVIDIA Custom Process | TSMC 4nm 4N NVIDIA Custom Process |
PCI Express Interface | Gen 5 | Gen 4 |
Techno 02:記憶體頻寬提升 78%
NVIDIA 在 GeForce RTX 50 系列內引入 GDDR7 記憶體支援,而 RTX 5070 Ti 是續 RTX 5090 D、RTX 5080 後第三款使用 GDDR7 記憶體的產品。RTX 5070 Ti 使用與 RTX 5080 相同的 8 組 32-bit 記憶體控制器組成 256-bit 架構,提供 16GB 總容量。不過,為了與 RTX 5080 作效能分野,故 RTX 5070 Ti 的記憶體運作時脈由 RTX 5080 的 30Gbps 降至 28Gbps,故可提供 896GB/s 的寬頻 (RTX 5080 為 960GB/s),但較上代 RTX 4070 Ti (192-bit 12GB GDDR6X 時脈 21Gbps) 的 504GB/s 提升 78%。
Techno 03:DLSS 4 技術加持
NVIDIA 與 Blackwell 架構同時推出了 DLSS 4(Deep Learning Super Sampling 4),作為新一代的 AI 驅動升級技術,提升圖形處理的性能和畫質。
DLSS 4 的技術突破在於其多幀生成能力,這是一項基於 Transformer 模型的新技術,能顯著提高遊戲幀率並增強畫面表現力。
- 多幀生成(Multi-Frame Generation):DLSS 4 可通過生成多達 3 幀的 AI 驅動像素,實現遊戲幀數的多倍提升,達到全新的性能高度。
- 光線重建(Ray Reconstruction):優化了光追效果的細節,使畫面表現更為真實。
- 深度學習反鋸齒(DLAA):進一步提升畫面的邊緣平滑度與紋理細節,為高端顯示設備提供了絕佳的畫質支持。
DLSS 4 對各代 RTX 顯示核心支援
DLSS 4 是 NVIDIA 最新的 AI 驅動圖形升級技術,其支援範圍涵蓋多個世代的 RTX 顯示核心,但功能啟用程度因硬體規格而異。
RTX 50 系列:作為 Blackwell 架構的代表作,RTX 50 系列能充分發揮 DLSS 4 的全部功能,包括多幀生成(Multi-Frame Generation)、光線重建(Ray Reconstruction)及深度學習反鋸齒(DLAA),在 4K 分辨率下實現高達 8 倍的性能提升。
RTX 40 系列:DLSS 4 在 RTX 40 系列顯卡上部分功能可用,例如光線重建和 DLAA,但由於硬體限制,未能支援多幀生成,只提供基本的單幀生成。
RTX 30 系列與 RTX 20 系列:這些世代支援 DLSS 4 的基本功能如超級分辨率、光線重建及 DLAA,但無法運行進階的多幀生成技術。
其他技術:Reflex 2 、RTX 神經渲染(Neural Rendering)、 NVIDIA ACE 等
可參考此文章:NVIDIA RTX 50 系列顯示核心完整解構!Blackwell 架構技術新時代!
解構 影馳 GeForce RTX 5070 Ti 魔刃
由於 RTX 5070 Ti 不設 FE (Founders Edition) 版本,故 NVIDIA 提供了影馳 GeForce RTX 5070 Ti 魔刃作為樣本,用以展示 RTX 5070 Ti 的性能表現和硬件設計潛力。
黑、白兩色
影馳 GeForce RTX 5080 魔刃採用 黑色與金色點綴 的工業風設計,整體低調且具有科技感,同步也推出了 GeForce RTX 5080 聖刃(白色版),針對喜愛純白主機的玩家。聖刃版採用全白外殼、白色風扇與銀白色金屬背板,可與其他白色配件(如主機板、水冷散熱器等)形成統一風格,滿足不同玩家的審美需求。
設計
影馳 GeForce RTX 5070 Ti 魔刃正面設有三顆 90mm 風扇,透過環刃風扇設計增強散熱效果,並在風扇中央嵌入影馳標誌,提升整體視覺質感。金屬裝甲部分則採用低調的黑色調,輔以金色點綴,讓整體造型更具層次感。顯卡尺寸適中,設計時考慮到了 ITX 和 MATX 小型機殼的兼容性,使其符合 SFF-Ready 標準,玩家可以將其安裝於緊湊型主機中,而不需擔心散熱與供電的問題。
背板的設計也經過特別強化,採用堅固的金屬材質,並於右側開設了大面積通風孔,使空氣能夠順暢地流通,提高散熱效率。除了提升散熱性能,這種設計也進一步強化了顯卡結構,使其在長時間使用後仍能保持穩定,不易因 PCB 板彎曲而影響使用壽命。
用料
影馳在 GeForce RTX 5070 Ti 魔刃的用料上展現了高端顯示卡應有的品質。顯卡採用 12 層 PCB 板設計,並搭載 12+4 相核心供電與 3 相顯存供電,確保顯示卡在高負載環境下仍能穩定運行。此外,供電部分選用了高品質的電容、電感及 MOSFET 元件,有效減少電壓波動,提升長時間使用時的穩定性。
電源接口方面,RTX 5070 Ti 魔刃採用了最新的 12VHPWR(12V-2x6) 接口,能夠提供穩定的電力輸入,確保 GPU 能夠發揮最大效能。顯示輸出則支援 DisplayPort 2.1 和 HDMI 2.1a,能夠輕鬆驅動高解析度、多螢幕環境,滿足遊戲玩家與內容創作者的需求。
散熱
為了應對 RTX 5070 Ti 在高效運行時所產生的熱量,影馳為這款顯卡設計了一套高效的散熱系統。三顆 90mm 環刃風扇搭配環形葉片設計,在提升風壓的同時降低風噪,使散熱效果更加均衡。此外,顯卡內部搭載 均熱板(Vapor Chamber),能夠均勻地將 GPU 核心與顯存產生的熱量快速傳導至散熱鰭片,再透過 鍍鎳複合熱管 加速散熱,確保整體溫度維持在穩定範圍內。
顯卡的背板後半部分設計了大面積的 通風開孔,讓風扇的氣流能夠順暢穿透散熱鰭片,形成貫穿式散熱通道,進一步增強熱交換效果。此外,顯卡還支援 智能啟停技術,當系統處於低負載狀態時,風扇會自動停止運行,以降低功耗並減少噪音,讓玩家在日常使用時享受更安靜的環境。
RGB 燈效
影馳 GeForce RTX 5070 Ti 魔刃不僅在散熱和用料方面表現優異,更搭載 GALAX Aurora RGB 信仰 Logo 燈效,磁吸結構靈活安裝,玩家可透過影馳官方軟體調整燈光顏色、亮度及模式,支援靜態光效、呼吸燈、流光燈等多種視覺效果。此外,顯卡還支援 ARGB 燈效同步,允許玩家將燈效與主機板、機殼燈條等其他硬體進行同步,打造統一的燈效。
同場加映: GeForce RTX 5070 Ti 影馳金屬大師、星曜系列
金屬大師系列
- 黑金版 & 白金版:新設計摒棄銀色主題,黑白雙色簡約卻不簡單,鋁合金上蓋與金屬背板加強穩固性。
- 寒光星β散熱系統:搭配霜環風扇,提升散熱性能並減少噪音。
星曜系列
- 星曜LUNA:靈感來自月亮女神,銀白設計呈現月光效果,二次元形象化身神秘女武神。
- 磁吸上蓋 & IML ARGB燈效:便捷拆卸設計,燈效可與主機板同步。
- 高效散熱 & 白化設計:強勁的霜環風扇和清新白化設計,附贈星曜娘貼紙。
GeForce RTX 5070 Ti VS RTX 4070 Ti
3D 效能、DLSS4 加速、AI 運算詳測
為了發揮 GeForce RTX 5070 Ti 的最高效能,使用 24 核心、支援 PCIe 5.0 的 Intel Core i9 14900K 處理器及 ASUS ROG MAXIMUS Z790 FORMULA 主機板進行測試。
<測試平台>
●處理器:Intel Core i9 14900K● 主機板:ASUS ROG MAXIMUS Z790 FORMULA●記憶體:G.Skill Trident Z5 RGB DDR5-6000MHz 2 x 16GB●顯示卡:影馳 GeForce RTX 5070 Ti 魔刃、 COLORFUL iGame GeForce RTX 4070 Ti Vulcan OC●SSD:WD Black SN850 NVMe SSD 2TB●作業系統:《Windows 11 Pro 24H2 64-bit》●驅動程式:NVIDIA《GeForce Driver 572.43》●散熱:ASUS ROG Strix LC II 360 ARGB
Test 01:3DMark 理論遊戲效能
分析:新架構效能提升高達 37%
NVIDIA GeForce RTX 5070 Ti 採用全新一代 Blackwell 架構的 GB203 核心,利用核心架構的改進,即第 5 代 Tensor Cores 及第 4 代 RT Cores。在 《3DMark》- Fire Strike Ultra 測試中,RTX 5070 Ti 獲得 18,024 分的成績,比 RTX 4070 Ti 的 13,654 分高出約 32%,而其他《3DMark》測試項目也表現出全面提升,特別在新一代《3DMark》- Speed Way 測試,集中考驗顯示卡的 Ray Tracing 及 DX12 遊戲表現,RTX 5070 Ti 領先上代高達 37% ,足證新一代 Blackwell 架構帶來的效能優勢。
Test 02:4K DLSS 4 遊戲效能越級挑戰 RTX 4090
GeForce RTX 50 系列另一大賣點是完整支援 DLSS 4 (Deep Learning Super Sampling 4) 技術,當中重點的 DLSS MULTI FRAME GENRATION 功能是由 Blackwell GPU 內第 5 代 Tensor Cores 進行處理。ezone.hk 找來多款對應 DLSS 4 技術的 3D 遊戲及《3DMark》進行測試。值得一提,這部份特別加入上代頂級的 RTX 4090,作越級挑戰!
《Cyberpunk 2077》
《Cyberpunk 2077》最新更新已支援新一代 DLSS4 技術,配合 RTX 50 系列即可「DLSS Multi Frame Generation」功能,可選 2x、3x、4x 。
效能測試:
《Star Wars Outlaw》
《Star Wars Outlaw》是另一款原生支援 DLSS4 技術的遊戲,遊戲內「Frame Generation」選項同樣可設「4x」。
效能測試:
《Alan Wake 2》
《Alan Wake 2》「DLSS Frame Generation」選項。
效能測試:
《Marvel Rivals》
效能測試:
《Dragon Age: The Veilguard》
《Dragon Age: The Veilguard》需在 NVIDIA 應用程式內設定「DLSS Multi Frame Generation」。
效能測試:
分析:DLSS4 加持、領先 RTX 4090
GeForce RTX 5070 Ti 內建 第 5 代 Tensor Cores 進行「DLSS MULTI FRAME GENRATION 」,有效提升遊戲 FPS 流暢度。從測試可見,在未啟用 DLSS MULTI FRAME GENRATION 前,GeForce RTX 5070 Ti 已能領先 RTX 4070 Ti 約 22% 至 68%,但仍未及上代最頂級的 RTX 4090。不過,當啟用 DLSS MULTI FRAME GENRATION 技術,GeForce RTX 5070 Ti 表現大幅提升,領先 RTX 4070 Ti 100% 至最高 136%,更超越 RTX 4090,可見新架構配合 DLSS MULTI FRAME GENRATION 的威力。
《3DMark》 DLSS 測試
《3DMark》DLSS 4 測試 GPU 在使用不同 Frame Generation 設定的流暢度,測試可見 RTX 5070 Ti 在啟用 2X、3X、4X Frame Generation 後,FPS 分別由 41.08 提升了 3 至 5 倍。
Test 03:AI 運算測試
NVIDIA Blackwell 新架構除了在遊戲效能提升,在 AI 運算表現也有大幅度的優化,ezone.hk 今次找來多款評估系統生成式 AI 模型性能的工具,測試 RTX 5070 Ti 的 AI 運算表現。
《UL Procyon AI Text Generation》測試
UL Procyon AI Text Generation 測試是一套專為評估生成式 AI 模型性能的工具,適用於主流的文字生成應用場景。此測試專注於分析大型語言模型(LLM)在不同硬體上的推理能力與效能表現,涵蓋內容生成、文本總結及創意寫作等真實使用情境。
該工具支援多種生成式 AI 模型(如 Meta 的 Llama 2),並記錄關鍵性能指標,包括「生成第一個標記的時間」和「每秒生成後續標記的速度」。此外,測試兼容 Microsoft 的 ONNXRuntime-GenAI,允許模型在多種硬體環境下執行,並充分利用 DirectML 實現加速。UL Procyon AI Text Generation 測試為硬體性能評估提供了一種標準化的方法,使開發者能夠比較不同 GPU 的生成式 AI 工作負載表現,是評估硬體在生成式 AI 任務中效率的關鍵工具。
分析:AI 全面加速
從以上 AI 測試結果可見,NVIDIA GeForce RTX 5070 Ti 在 AI 運算方面展現了顯著的進步,主要得益於全新的 Blackwell 架構和第五代 Tensor Cores。這些改進使其在處理生成式 AI 和深度學習任務時的性能達到新高度。
評語:DLSS4 威力盡現
GeForce RTX 5070 Ti 作為 RTX 50 系列第三位成員,利用新一代 Blackwell 新架構,在未有大幅增加 CUDA 數目及電晶體數目下,純以新架構已能提供不俗的效能提升,而在配合 DLSS 4 技術更是有極亮眼的表現,在遊戲測試更超越上代最頂級的 RTX 4090,可見新核心加 DLSS4 技術配合下之威力。
【精選消息】
Source: ezone.hk