
目前,主流的生成式人工智能的功能主要集中在文字轉語音和透過文字描述生成圖像。然而,Stability AI最近正開發一款名為「Stable Video Diffusion」的AI模型,它能夠根據現有圖像的內容生成短影片,也就是將靜止的圖像轉化為動畫,讓人期待。
即刻【按此】,用 App 睇更多產品開箱影片
經濟日報報道,Stable Video Diffusion是由SVD和SVD-XT兩個模型組成。SVD模型能夠將靜態影像轉換為 14幀、576×1024像素的影片;而SVD-XT模型與前者使用相同的架構,但將幀數提高至24幀。兩個模型都能以每秒3至30幀的速度生成影片,而每個生成的影片時長約4秒以內。據了解,SVD和SVD-XT最初是在一個包含數百萬個影片的資料集上進行訓練,隨後在一個規模較小的數據集上進行了「微調」。 然而,目前該模型並非對外全面開放或作商業應用,仍只是處於「研究預覽」階段。
【熱門報道】
Source:hket
