DeepSeek｜DeepSeek R2料5月面世成本較GPT-4低97% 傳徹底棄用Nvidia投奔華為晶片

| Johannes | 03-05-2025 16:50 |

【DeepSeek】中國人工智能企業DeepSeek在今年初發布其DeepSeek R1大模型震撼AI業界，甚至一度引發NVIDIA股價大幅下跌。近日，有內地消息指出，下一代模型DeepSeek R2預計將於5月登場。最令人期待的是，有傳R2將徹底擺脫Nvidia晶片，轉而全面採用華為自主研發的昇騰910B（Ascend 910B）晶片。

DeepSeek｜DeepSeek R2料全面採用華為晶片

綜合快科技等媒體報道，DeepSeek R2將採用更先進的混合專家模型（MoE）架構，總參數規模較前代R1大幅提升約1倍，預計將達到1.2兆。與此同時，DeepSeek R2推理成本將較OpenAI的GPT-4大幅降低97.4%。

↓點擊圖片放大↓

有消息指，DeepSeek R2的整體規模將與OpenAI的GPT-4 Turbo以及Google的Gemini 2.0 Pro等頂尖模型匹敵。此外，DeepSeek R2將結合更先進的門控網路層（Gating Network），提升高負載推理任務下的性能表現。消息同時明確指出，DeepSeek R2的訓練過程將完全擺脫Nvidia晶片，全面採用華為昇騰910B晶片集群平台。據稱，在FP16精度下，該平台的計算性能可達到512 PetaFLOPS，晶片利用率高達82%，整體性能約為輝達A100晶片集群的91%。

↓點擊圖片放大↓