3月4日 消息:北大團隊聯合兔展啟動了復現Sora的計劃,該項目名為Open Sora。這一舉措的背后是資源有限的情況下,團隊希望匯集開源社區的力量,以盡可能完成復現工作。
項目的核心團隊由北大信息工程學院助理教授袁粒和北大計算機學院教授田永鴻等領導,共有13名成員。除了團隊成員外,北大校友和AnimateDiff貢獻者等也積極響應,并有人表示愿意提供高質量的數據集。
關于Sora的復現技術細節已經公布,項目框架包括三個主要部分:Video VQ-VAE、Denoising Diffusion Transformer和Condition Encoder。
為了解決Sora視頻的可變長寬比問題,團隊采用了上海AI Lab提出的FiT技術,實施了一種動態掩碼策略。同時,團隊還通過位置插值來處理可變分辨率,并使用Video VQ-VAE來支持可變時長的視頻處理。團隊已經初步實現了三個功能,并在項目主頁上提供了兩個demo,展示了10秒和18秒視頻的重建效果。
盡管已經取得了一些進展,但團隊面臨著諸多挑戰。目前的訓練是在8個A100-80G上進行的,但仍然遠遠不夠,而且需要更多的數據和GPU進行訓練。團隊已經完成了一些任務,包括采樣腳本和在embeddings上添加類條件,但仍有一些待辦事項需要完成。
項目的領銜者之一是袁粒,他是北大信息工程學院的助理教授,曾獲得福布斯30歲以下亞洲杰出人物榜單的榮譽。另一位領銜者是田永鴻,他是北京大學博雅特聘教授,擁有豐富的科研經驗和榮譽。
關于誰能率先發布中文版Sora的問題,目前仍然是一個未解之謎。在業內,有傳言稱字節可能會成為首個發布中文版Sora的公司。盡管有一些AI模型類似于Sora,比如最近出現的Boximator和Dreamina,但它們與Sora仍存在一定差距。然而,這個問題的答案還有待時間的揭曉。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。