
DeepSeek|近期灸手可熱的內地人工智能初創公司DeepSeek再有新模型面世。日前,全新模型DeepSeek-V3-0324在無預告下低調推出,並且繼續免費開源。據悉,DeepSeek-V3-0324並非推理模型,但採用具6710億參數的專家混合模型(MoE),集中提升其編程能力。
DeepSeek|DeepSeek-V3面世領先OpenAI
綜合經濟日報報道,基於去年12月發布前代 DeepSeek V3進行更新的DeepSeek-V3-0324在多項能力評分都直逼甚至超越其他大模型。根據開源評測平台kcores-llm-arena 測試數據,DeepSeek V3-0324的編碼能力達328.3分,勝於DeepSeek-R1、OpenAI-o1以及Claude 3.5 Sonnet,但仍與Claude 3.7 Sonnet思維鏈版本的334.8分有一小段距離。
當輸入「設計一個美觀的個人部落格網站,帶有科技感,直接開發成可用網頁」的指令時,DeepSeek-V3 在 2 分鐘內產生一個包含400多行程式碼的網站,而且設計細節也相對仔細,會採用粒子背景動畫等元素,具備響應式設計,能自動適配手機和電腦版木介面。相比舊版DeepSeek-V3,在同一指令下的表現,僅有100多行程式碼,且美學效果不佳。
是次登場的DeepSeek-V3-0324版本,採用MIT開源授權,用家可將其用於商業用途,並進行修改。外媒報道指,與DeepSeek R1相比,升級版V3模型在生成前端程式碼方面,有明顯改進。數學能力也有提升,能像推理模型一樣能夠解題。到更實際的測試中,DeepSeek-V3在網站開發和UI設計都表現出色。
此外,內媒指出,將舊版DeepSeek-V3和DeepSeek-R1無法解答的數學題目,交給升級版DeepSeek-V3模型進行測試,其輸出的token數量明顯增加,單次輸出基本上已達到輸出上限,而且最終答案仍是錯誤。但升級版DeepSeek-V3提供答案後,會進行反思,並嘗試修改解題過程,顯示模型在自我修正和推理能力上也有所增強。
即刻【按此】,用 App 睇更多產品開箱影片
【熱門報道】
Source:hket、github.com
【相關話題】愈常使用 ChatGPT 孤獨感愈強
OpenAI ChatGPT 是現時不少人工作或生活上不可缺少的東西,有些上不只會用其解決辦公難題,有時可能連 plan 旅行行程,又或者想不到晚餐吃甚麼的時候,都會找 ChatGPT 談談。不過近日 OpenAI、MIT Media Lab 聯合調查有提,長時間使用 ChatGPT 未必是好事,因為日常愈常使用 ChatGPT 的話,自身孤獨感就會愈強。
Source:ezone.hk