【DeepSeek】中國人工智能企業DeepSeek在今年初發布其DeepSeek R1大模型震撼AI業界,甚至一度引發NVIDIA股價大幅下跌。近日,有內地消息指出,下一代模型DeepSeek R2預計將於5月登場。最令人期待的是,有傳R2將徹底擺脫Nvidia晶片,轉而全面採用華為自主研發的昇騰910B(Ascend 910B)晶片。
綜合快科技等媒體報道,DeepSeek R2將採用更先進的混合專家模型(MoE)架構,總參數規模較前代R1大幅提升約1倍,預計將達到1.2兆。與此同時,DeepSeek R2推理成本將較OpenAI的GPT-4大幅降低97.4%。
有消息指,DeepSeek R2的整體規模將與OpenAI的GPT-4 Turbo以及Google的Gemini 2.0 Pro等頂尖模型匹敵。此外,DeepSeek R2將結合更先進的門控網路層(Gating Network),提升高負載推理任務下的性能表現。消息同時明確指出,DeepSeek R2的訓練過程將完全擺脫Nvidia晶片,全面採用華為昇騰910B晶片集群平台。據稱,在FP16精度下,該平台的計算性能可達到512 PetaFLOPS,晶片利用率高達82%,整體性能約為輝達A100晶片集群的91%。
市場分析普遍相信,DeepSeek R2若能成功實現全面採用華為昇騰晶片,將有望顯著降低中國在高端AI晶片方面對海外供應商的依賴,提升國產AI產業的自主能力。此外,華為昇騰910C晶片也據稱開始進入大規模量產階段,預計將進一步增強中國在AI基礎設施領域的實力。
即刻【按此】,用 App 睇更多產品開箱影片
【熱門報道】
Source:news.mydrivers.com、udn.com
雖然 Microsoft 是 OpenAI 金主之一,向其投資數十億美元幫助進行研究並獲得其模型的特權訪問,好讓其能與 Google 競爭,但時至今日,Open ChatGPT 每星期使用人數已遠比 Microsoft Copilot 多出很多,到底兩者用家數量相差得多遠呢?
Source:ezone.hk