近期各大科企及AI公司都紛紛推出小型語言模型(SLM)。繼OpenAI推出GPT-4o mini,Apple 日前亦發布「DCLM-1B」及「DCLM-7B」兩款具備14億和70億參數的小型開源AI模型,更號稱性能不輸Llama 3等AI模型。
即刻【按此】,用 App 睇更多產品開箱影片
Apple再推小型開源AI模型 效能不輸Llama 3
經濟日報報道,Apple機器學習團隊近日發布兩款最新小型開源AI模型。這兩款模型屬DataComp for Language Models 計畫的一環,分別名為「DCLM-7B」具70億參數,以2.6兆字符(token)資料訓練而成,另一款「DCLM-1B」就有14億參數。
據了解,在多語理解測試MMLU中,DCLM-7B和Map-Neo效能相同,但運算資源耗損少40%;DCLM-7B準確性得分為64%,和Mistral-7B-v0.3(63%)及Google Gemma(64%)都不相上下,但比起Llama 3-8B的66%為低。不過Apple強調,其模型耗能低了6.6倍。此外,蘋果表示,在Alpaca Bench測試中,DCLM-1B效能高於Hugging Face上周公布的小模型SmolLM。Apple開發團隊負責人Vaishaal Shankar表示,在一眾真正開源的AI模型中,DCLM屬「表現最佳」。
【熱門報道】
Source:hket、datacomp.ai
【相關話題】GPT-4o mini 預計引進Apple Intelligence
OpenAI近日推出全新語言模型「GPT-4o mini」,將作為ChatGPT-4o輕量化版本引入人工智能市場。新模型宣稱比GPT-3.5 Turbo便宜超過60%,預計今年秋季會結合Apple Intelligence,引進iOS 18正式版,讓用家在iPhone 上使用。
Source:ezone.hk