Meta 於 Llama 3 發布一周年之際,正式推出其迄今為止最為強大的人工智能模型系列 Llama 4,再次向開源社區釋放重磅資源。是次發布的 Llama 4 系列採用先進的「混合專家」(Mixture of Experts, MoE)架構。這種架構通過將大型模型,分解為多個專注於特定知識領域或任務的「專家」子模型,在處理用戶查詢時僅激活最相關的幾個「專家」,從而顯著提高模型訓練和推理的效率,同時保持強大的性能。
Meta 宣稱,Llama 4 是其目前最先進的模型,並且在多模態處理能力方面處於領先地位。
Llama 4 系列目前推出了兩個版本:Scout 和 Maverick。Scout 版本擁有 170 億活躍參數,由 16 個「專家」組成,總參數量達到 1090 億;而 Maverick 版本同樣具備 170 億活躍參數,但其「專家」數量大幅增加至 128 個,使得總參數量高達 4000 億。這種設計允許模型在保持相對較低運算需求的同時,擁有極其龐大的知識儲備。
除了已發布的版本,Meta 還透露正在積極訓練一個規模更為龐大的模型 Behemoth,目標是將其打造成全球頂尖的智能大模型之一。Llama 4 的發布,無疑將為全球的研究人員和開發者提供更強大的開源工具,推動 AI 技術的進一步發展和應用。
Meta 公司首席執行官朱克伯格(Mark Zuckerberg)在相關聲明中重申了公司的開源策略,他表示:「我們的目標是建立世界領先的人工智能,將其開源,並使其普遍可用,以便世界上每個人都能受益。」
Source:快科技
【延伸閱讀】