1月8日 消息:Meta 的 GenAI 團隊推出了名為 Fairy 的視頻到視頻綜合模型,該模型比現有模型更快,時間上更一致。研究團隊展示了 Fairy 在幾個應用中的表現,包括角色 / 物體替換,風格化和長形式視頻生成。
比如,只需簡單的文本提示,如 “仿梵高風格”,就足以編輯源視頻。例如,文本命令 “變成雪人” 將視頻中的宇航員變成了雪人。
Fairy 的視覺連貫性是一個特別具有挑戰性的問題,因為基于相同提示有無數種方法可以修改給定的圖像。Fairy 使用交叉幀關注機制,這是一種隱式傳播擴散特征的機制,確保了優越的時間連貫性和高保真度的合成。
該模型可以在僅14秒內生成大小為512x384像素、120幀(30fps 下的4秒)的視頻,比以前的模型至少快44倍。與 Meta 的 Emu 視頻模型一樣,Fairy 是基于用于圖像處理的擴散模型,經過了視頻編輯的增強。
Fairy 在處理源視頻的所有幀時不進行時間降采樣或幀插值,并保持了512的水平輸出視頻的縱橫比。在使用六個 A100GPU 進行測試時,Fairy 能夠在71.89秒內渲染一個27秒的視頻,并保持高度的視覺一致性。
Fairy 的性能在一個包含1000個生成樣本的廣泛用戶研究中進行了測試。無論是人類判斷還是定量指標都證實,Fairy 的表現優于 Rerender、TokenFlow 和 Gen-1這三個模型。
然而,該模型目前在處理如雨、火災或閃電等動態環境效果方面存在問題,這些效果要么無法很好地融入整個場景,要么會產生視覺錯誤。
盡管存在這些問題,研究團隊認為他們的工作在 AI 視頻編輯領域代表了一次重大進展,具有對時間一致性和高質量視頻合成的變革性方法。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。