Amazon行政總裁Andy Jassy於AWS re:Invent 2024中,宣佈推出Amazon Nova,一系列最新的基礎模型,重新定義雲端運算和GenAI。Amazon Nova包括語言、圖像和影片生成模型,以及針對不同需求而設的不同版本,為開發者和企業提供更多選擇和靈活性。
四種主要版本
Andy Jassy介紹指,Nova系列模型包括四種主要版本:Micro、Light、Pro和Premier。Micro版本是一個文本編碼模型,以速度和成本效益見稱,適合簡單的文本生成任務。Light和Pro版本則為多模態模型,可以處理文本、圖像和影片輸入,並生成高質量的文本輸出。Premier版本是功能最強大的多模態模型,預計將於2025年第一季度推出。
Andy Jassy表示Nova模型的一大優勢是成本效益,相比其他領先的模型,Nova的成本降低了約75%,而且在延遲方面表現出色,是目前市面上速度最快的模型之一。此外,Nova模型與Bedrock平台深度整合,支援微調、知識庫整合和代理行為等功能,為開發者提供更全面的工具和能力。
Nova Canvas及Nova Reel支援相片及影片生成
除了語言模型外,Amazon Nova還包括圖像和影片生成模型。Amazon Nova Canvas是一款先進的圖像生成模型,可以根據自然語言描述生成高質量的圖像,並支援圖像編輯和內容審核等功能。
Amazon Nova Reel則是一款影片生成模型,可以生成工作室級的影片,並提供豐富的控制選項,例如鏡頭運動、360度旋轉和縮放等,目前支援生成6秒的片段,未來可增至2分鐘片段。
AWS計劃在2025年第一季度推出Nova模型的第二代版本,並新增語音轉語音模型,和Any-to-Any模型。語音轉語音模型可以將語音輸入,轉換為流暢的語音輸出;Any-to-Any模型則支援多模態輸入和輸出,例如將文本轉換為圖像、將語音轉換為影片等,為用戶帶來更多創新體驗。
Source:ezone.hk