【AWS re:Invent 2025】AWS 3nm 自研晶片 Trainium 3 效能狂飆 4.4 倍 Nova 2 Omni 模型貫通圖文影音

| 李兆城 | 03-12-2025 09:46 |
【AWS re:Invent 2025】AWS 3nm 自研晶片 Trainium 3 效能狂飆 4.4 倍 Nova 2 Omni 模型貫通圖文影音

AWS re:Invent 2025 本周於拉斯維加斯舉行,AWS CEO Matt Garman 在主題演講中表示,面對 AI 運算需求呈幾何級數上升,以及企業對高性價比模型的渴求,AWS 推出自家研發的首款 3nm AI 晶片 Trainium 3,以及打破模態界限的 Amazon Nova 2 模型家族。

首款 3nm AI 晶片登場 Trainium 3 效能激增 4.4 倍

隨著 AI 模型的參數量越來越大,市場對算力的渴求已接近極限。為了解決昂貴的訓練成本問題,Matt Garman 發布 AWS 新一代 AI 訓練晶片 Amazon EC2 Trainium 3。這是 AWS 首款採用先進 3nm 製程技術打造的 AI 晶片,專為處理龐大的前沿模型(Frontier Models)而設。

官方數據顯示,與上一代 Trainium 2 相比,Trainium 3 的運算效能提升高達 4.4 倍,能源效率提升 4 倍,記憶體頻寬亦增加近 4 倍。企業可以用更短時間、更少電力來訓練更強大的模型,大幅降低營運成本。Garman 更在台上展示由 144 顆 Trainium 3 晶片組成的 Trn3 UltraServer,這台超級伺服器透過專用的 Neuron Link 交換器連接,能提供海量的運算吞吐量。企業甚至可透過 UltraCluster 3.0 技術,將叢集擴展至多達 100 萬顆晶片,規模之大前所未見。目前,Amazon Bedrock 已在 Trainium 3 上運行生產負載,證明其穩定性足以應付企業級需求。

Nova 2 Omni 統一全模態 一個模型搞掂圖文影音

在模型層面,AWS 發布了全新的 Amazon Nova 2 系列,其中最搶眼的莫過於 Nova 2 Omni。這是一統一多模態模型(Unified Multimodal Model)。以往要處理一個包含影片、錄音和文件的複雜任務,開發者往往需要串連多個專用模型(例如一個負責聽、一個負責看、一個負責寫),過程繁複且容易出錯。

Nova 2 Omni 打破這些界限,它能同時接受文本、圖像、影片及音訊作為輸入,並能直接輸出文本及圖像。例如,市場營銷團隊只需將產品實物影片、錄音介紹及品牌指引文件一次過「餵」給 Nova 2 Omni,模型便能理解所有內容,並自動生成符合品牌風格的宣傳文案及配圖。這種「通殺」能力,大幅降低多模態應用的開發門檻與成本,讓創意工作流程更為流暢。

Amazon AGI 產品總監 Eshan Bhatnagar 在接受訪問時強調,Amazon 的核心哲學是「實用人工智能」(Practical AI)。他指出:「對客戶真正有價值的是在可靠性和性價比上滿足他們需求的 AI,而不僅僅是華麗的跑分數據。我們開發產品的目標,是解決客戶在生產環境中遇到的真實問題。」

Nova Forge 開放訓練 打造企業專屬模型

針對企業希望擁有「專屬模型」的痛點,AWS 推出了 Nova Forge 服務,引入了「Open Training(開放訓練)」概念。與傳統的微調(Fine-tuning)不同,Nova Forge 允許企業在模型訓練的早期階段(如預訓練或中期訓練),就將自家的專有數據與 Amazon 的精選數據集混合。

Eshan 指出,目前企業在應用生成式 AI 時面臨一大痛點:傳統的微調(Fine-tuning)或 RAG 技術,往往像是在模型訓練完成後才「外掛」知識。這種做法容易導致模型在學習新領域知識時,發生「遺忘」現象,喪失原有的指令跟隨能力。為此,AWS 推出了 Nova Forge,引入「開放訓練」(Open Training)概念。Eshan 解釋:「我們允許企業在預訓練(Pre-training)或中訓練階段就注入數據,這時模型的學習效率最高,能真正將企業知識與模型的通用能力深度融合,而非單純的表面微調。」這種深度的數據融合,讓企業能訓練出既保留 Nova 模型強大通用能力,又深度理解企業獨特業務知識的小模型變體。

同場加映的還有 Nova 2 Sonic,這款模型專攻「語音對語音(Speech-to-Speech)」交互,支援極低延遲的實時對話,能實現如真人般自然的語音交流,非常適合用於智能客服或語音助手。此外,新推出的 Nova Act 服務則利用強化學習訓練的 Nova 2 Lite 模型,專注於瀏覽器 UI 自動化,能以極高可靠度執行如填寫表單、操作 CRM 系統等網頁任務,為企業自動化流程提供新選擇。

10 分鐘發布 25 項更新 全方位強化雲端基建

演講尾聲,Matt Garman 更在 10 分鐘內發布 25 項核心服務更新。重點包括為 EC2 加入針對記憶體密集型應用的 X8g 實例、運算速度最快的 M8zn 實例,以及支援 Apple 開發的全新 Mac 實例。儲存方面,推出 S3 Tables 以優化大數據查詢效能,並加入智能分層(Intelligent Tiering)以節省高達 80% 成本;數據庫方面,RDS SQL Server 的儲存容量上限大幅提升至 256TB。

Source:AWS

相關文章

Page 1 of 9