效能號稱不輸Meta Llama 3 Apple推出2款小型開源AI模型

| Johannes | 22-07-2024 21:50 |

在Google
追蹤《e-zone》

近期各大科企及AI公司都紛紛推出小型語言模型（SLM）。繼OpenAI推出GPT-4o mini，Apple 日前亦發布「DCLM-1B」及「DCLM-7B」兩款具備14億和70億參數的小型開源AI模型，更號稱性能不輸Llama 3等AI模型。

即刻【按此】，用 App 睇更多產品開箱影片

Apple再推小型開源AI模型效能不輸Llama 3

經濟日報報道，Apple機器學習團隊近日發布兩款最新小型開源AI模型。這兩款模型屬DataComp for Language Models 計畫的一環，分別名為「DCLM-7B」具70億參數，以2.6兆字符（token）資料訓練而成，另一款「DCLM-1B」就有14億參數。

↓點擊圖片放大↓

據了解，在多語理解測試MMLU中，DCLM-7B和Map-Neo效能相同，但運算資源耗損少40%；DCLM-7B準確性得分為64%，和Mistral-7B-v0.3（63%）及Google Gemma（64%）都不相上下，但比起Llama 3-8B的66%為低。不過Apple強調，其模型耗能低了6.6倍。此外，蘋果表示，在Alpaca Bench測試中，DCLM-1B效能高於Hugging Face上周公布的小模型SmolLM。Apple開發團隊負責人Vaishaal Shankar表示，在一眾真正開源的AI模型中，DCLM屬「表現最佳」。

↓點擊圖片放大↓