故事,是對現實的剖析和重構。講好一個故事,需要創造性地把素材組織起來。在 AI 時代,一個好的故事又將如何被呈現出來呢?
今年,是視頻生成類產品爆發式增長的一年。在AI生成的視頻中,我們看到創作者在用一種新的方式講述著自己的故事。
同樣,AI 視頻內容是通過新的創作方式誕生的新娛樂內容形態,有可能誕生2C平臺級的機會。
小編近期發現了幾個不同視頻賽道的創業者,都瞄準了 AI 生成消費級內容,甚至成為下一個 “Netflix” 的機會。SenseAI盤點了視頻模型層的 Odyssey,內容平臺創新的DreamFlare,以及從動畫制作 Agent System 切入的 Fable Studio,Enjoy!
01.
Odyssey
打造“好萊塢級”的視覺AI
視頻生成模型的 AI 生成效果天花板往往決定了故事片的天花板。底層技術迭代是可行的一條路徑。
Odyssey 選擇了這條路徑,希望通過構建一個類似OpenAI的 Sora 或 Runway 的 Gen3的強大底層模型,旨在為專業電影制作人和動畫師打造“好萊塢級”人工智能視頻工具。用戶使用 Odyssey 的工具,可以直接將場景或鏡頭序列的文字描述轉換成簡短、高質量的電影視頻。
從自動駕駛到視頻生成
這家公司的核心創始人奧利弗·卡梅倫 (Oliver Cameron) 和杰夫·霍克 (Jeff Hawke) 此前都是自動駕駛汽車領域的從業者。Cameron 曾和他人共同創辦了自動駕駛汽車公司 Voyage,并在2021年被Cruise收購。而 Odyssey 目前的 CTOHawke 曾是英國公司 Wayve 的創始研究和工程團隊成員,Wayve 致力于打造自動駕駛汽車的軟件大腦,是目前自動駕駛領域的獨角獸企業。
自動駕駛算法的研發經歷是如何與視頻生成產品產生關聯的呢?
Cameron 表示,本質上,自動駕駛汽車軟件是關于人工智能軟件如何從二維輸入中學習三維世界,而視覺效果問題本質上是相反的——將三維世界壓縮成二維運動圖像。
Hawke 曾經在 Wayve 研究一個名為 FIERY 的 AI 模型,該模型是 GAIA 的前身,可以實現拍攝初始視頻幀,然后使用它來構建整個逼真的街景視頻,Wayve 使用該技術創建合成數據來訓練其自動駕駛決策 AI 軟件。類似的想法也可以用于制作高質量的電影鏡頭序列。
從自動駕駛汽車領域走出來的另一個好處是,兩位聯合創始人都明白收集自己的現實世界數據集來訓練模型的重要性。與其他依靠從互聯網上搜集視頻數據來為 AI 軟件提供數據的文本轉視頻公司不同,Odyssey 正在現實世界中收集自己的三維數據集,并利用這些數據來為其模型提供數據。Cameron 表示,互聯網上根本沒有足夠大的三維數據集來構建具有足夠大小和能力的 AI 模型,以滿足 Odyssey 想要創建的目標。他和 Hawke 在自動駕駛汽車方面的經驗讓他們對如何收集 Odyssey 所需的現實世界數據有了一些聰明的想法。
好萊塢質感從何而來?
“好萊塢級”的視效意味著生成的視頻不僅要保證一致性和連貫性,還要在畫面細節上做到精準把控。傳統的電影拍攝,需要攝影指導、燈光師、美術指導等一系列專業人員的共同參與。AI 生成視頻中, 同樣也需要在場景構建、鏡頭控制上做到流暢自然,而單一的文生視頻模型在精細化控制上有很大的局限。
當前 AI 創作類產品普遍面臨的問題是不可編輯性,AI 生成內容的過程更像是一個隨機游戲,而不是一個創作流程,無法在生成的內容基礎上進行打磨,生成效果不理想只能重新來一遍。涉及復雜劇情和較多的角色、對人物和場景的精雕細琢等,AI生成便難以達到創作要求。
Odyssey 這款產品,將重心放在視效提升上,恰好彌補了當前視頻生成產品的不足之處。正如創始人所說,我們已經被低質量的內容所淹沒,忘記高質量的故事是什么樣子。AI 要做的,不是生產更多低質量內容,而是用在專業的故事講述者手中,去制作出更多高質量內容。
為了能夠實現這一目標,Odyssey 訓練了四個生成模型,分別對應視覺生成的四個不同任務:
1)生成三維圖形渲染,該模型創建場景和人物的基本形狀和結構。
2)生成水或布料等材質效果,負責為幾何形狀添加真實的紋理和表面特性。
3)運動生成:處理場景中人物和物體的運動,生成可控的運動。
4)照明生成:該模型模擬復雜的照明場景,對于營造情緒和氛圍至關重要。
Odyssey 不同模型的疊加
Odyssey 生成的電影級視頻畫面效果
通過將這些方面分離成不同的模型,Odyssey 旨在讓用戶對視頻創作的每個元素進行精細控制,從而保證最終能夠保持高質量的視頻輸出。
Odyssey 并不打算完全取代現有的制作工具。相反,他們正在設計自己的系統,以便與當前的行業標準工作流程無縫集成。使用 Odyssey 創建的所有內容都可以編輯并以標準3D 文件格式導出,例如 USD(通用場景描述)文件格式。
有了這些功能,Odyssey 的用戶群體除了電影愛好者和 AI 愛好者之外,還能夠觸達電影制作人和視覺特效師,成為他們的創意生產工具。
Odyssey 目前獲得了包括 GV(谷歌風投)在內的900萬美金種子輪投資。團隊希望構建一支復合型的視頻模型團隊,目前他們的員工來自三個群體:
1)來自Cruise、Waymo、Tesla、Meta、NVIDIA 等公司的AI 研究人員。
2)參與過 Spore(孢子)、SimCity(模擬城市)、The Sims(模擬人生)等視頻游戲的計算機圖形專家。
3)為DUNE(沙丘)、Godzilla(哥斯拉)、Jurassic World(侏羅紀公園)等大片做出貢獻的技術藝術家。
Odyssey 的終極愿景
非常明確——利用 AI 視覺生成模型制作好萊塢級別的電影。以《阿凡達》電影為例,每部電影的制作時間都超過十年,數百名視覺效果藝術家參與其中,耗資數億美元。Odyssey 希望在不犧牲視覺質量的情況下,縮短制作時間和降低成本——可能只需要一個五人團隊,花費5萬美元,工作六個月。
02.
Dreamflare,
前 Google 員工創業新的短視頻平臺
除了從技術上做提升之外,視頻生成類產品還可以打造新的交互方式,并基于此建立新的內容分發機制。
Dreamflare 瞄準的正是這條路徑,其定位于一個全新的消費者平臺,專注于 AI 生成的優質娛樂,打造 AI 時代的 Netflix。
Dreamflare平臺上目前提供兩種類型的動畫內容:
Flips:沉浸式故事
Flips,包括AI生成的短片和圖像。Flips 既不像一個長視頻,也不像一個漫畫,而是幾秒的視頻短頻和漫畫圖片組合成的一種故事片。這種新的內容形態很難說能否在觀眾群體中驗證成功。同時對視頻創作者的藝術功底也有比較高的要求。
平臺中的Flips內容展示
Spins:互動式短片
在 Spins 中,觀眾可以改變故事的某些結局。以目前生成內容的質量來看,還無法達到皮克斯級別的質量,它的創新之處在于構建起互動劇情,將用戶的被動消費變為主動參與。目前平臺內的 Spins 產品出現了多種藝術風格,用戶可以訂閱后解鎖后續劇集。
平臺中的Spins內容展示
商業化與遠景
Dreamflare 由前谷歌員工 Josh Liss 和紀錄片制片人 Rob Bralver 共同創立,旨在幫助創作者制作 AI 短視頻并從中獲得收益。他們將好萊塢的制作團隊與 AI 創作者協同起來,共同打造出沉浸式互動內容。
目前 Dreamflare 并不涉及到過多AI 內容創作上的指引,創作者可以通過Runway、Midjourney、ElevenLabs等第三方AI工具來制作視頻,并上傳至Dreamflare 平臺。Dreamflare 更專注于幫助創作者在線訂閱的方式分發視頻,收獲訂閱收入分成,同時,創作者還可以通過廣告分成、粉絲打賞等其他方式獲得進一步收益。
目前內容風格比較多樣
由于創作者可以使用任意AI工具來生成視頻或圖像,在生成內容上會存在道德或法律爭議。Dreamflare聲稱其采取嚴格的審核流程,確保提交的內容不基于受版權保護的素材,并且不接受 R 級內容。
在訂閱模式上,目前平臺推出限時優惠,提供9.99美元的年費和每月2.99美元的早鳥價格。正常訂閱費用設定為49.99美元/年,相比目前 Dramabox、Netflix 等平臺的訂閱費用還是顯著更低。
在合作方面,Dreamflare創始人表示,公司目前已經與迪士尼、奈飛、環球影業等多位娛樂行業高管建立了創意合作關系。Dreamflare 通過在 AI 內容中有機地融入電影從業者的經驗這種方式,確保 AI生成內容的質量,從而為平臺帶來持續穩定的收益。
03.
Fable Studio,
一個動畫工作室的 Netflix 夢
當一個動畫工作室有了批量規模塑造高質量內容的能力時,他就不僅僅是一家工作室,而是一個內容平臺。就像皮克斯工作室在1995年推出了第一步《玩具總動員》,直到今天仍然是最強動畫 IP 的塑造者,被迪士尼收購,進一步提高內容生產的可復制性。
Fable Studio 是AI時代的制片廠,不僅是由于其發布了 AI 制作的動畫片 《南方公園》,還源于其 AI 內容制作領域的編排能力,通過 Agent System 的方式為用戶提供一整套 AI 創作動畫視頻的工具,近期他們發布了Showrunner 平臺,用于展示用戶創作的劇情內容。
從視頻創作系統到《南方公園》
Fable Studios 的創業想法起源于由 Fable 的主創成員發表的一篇論文,該論文在 OpenAI 和 Stable Diffusion 的AI 系統基礎上創建,構建了一個 SHOW-1模型,模型能夠在幾分鐘內生成腳本、多個場景和生成的對話,本質是一個節目統籌智能體系統。
該公司在去年將這項技術應用在制作新一集《南方公園》中。AI 完成了從編劇、導演到配音和剪輯的全部流程,觀眾只需要輸入一句話便可以生成屬于自己的《南方公園》影片。目前,這些劇集在X( Twitter)上的觀看次數接近800萬次。
此外,用戶還可以通過上傳自己的照片和聲音來生成自己的角色,生成由自己主演的電視劇。觀眾不再是被動地觀看劇情,而是能夠參與到劇情創作當中,推動故事的發展,甚至將自己融入到劇情中。這種方式模糊了影視創作者和消費者之間的界限,能夠讓更多有想法的人參與到創作過程中來。
節目統籌智能體
這個 Agent 系統,能夠通過系統內的智能體,實現劇集生成的工作流程,其中又包含了故事系統、統籌系統、角色系統、舞臺系統、攝影系統等不同的子系統。
![]()
首先,Showrunner 會通過故事系統,獲取標題、故事梗概以及模擬當前時間內發生的主要事件等高層次信息,從這些信息中,故事系統通過模擬數據作為提示鏈推斷出14個場景。
隨后,統籌系統會負責為每個場景選擇角色,并通過一個情節來推動故事發展,每個場景與一個情節字母(如A/B/C)關聯。角色系統會交替使用不同的角色組合,并跟進它們的故事線,以保持用戶的參與度。
最后,在在舞臺系統和攝影系統的協同下,場景將按照預設的情節有序呈現。
誰在推動故事?
Showrunner 的故事推動本身是由模擬器、用戶和 GPT-4共同承擔的責任。通常由模擬器提供基于 IP 的基礎背景、角色歷史、情感、事件和地點,這些是初始創作過程的種子。用戶介紹他們的意圖,對 Agent 施加行為控制,并提供啟動生成過程的初始提示,同時用戶還充當最終的鑒別器,在過程結束時評估生成的故事內容。GPT-4充當主要的生成引擎,根據從用戶和模擬收到的提示創建和推斷場景和對話。這應該是一個共生過程,每個參與者的優勢都有助于形成一個連貫、引人入勝的故事。
Showrunner 的平臺定義
CEO Edward Saatchi 表示,“Showrunner 的愿景是成為 AI 領域的網飛,當觀眾看完了所有的劇集后,點擊按鈕制作下一集,就可以決定節目的主題,或者讓AI來制作”。官網顯示目前 Showrunner 推出了10部不同類型和風格的動畫片,除了音樂和一些轉場之外,大多使用 AI 工具制作。
Showrunner目前的內容
針對創作者,Showrunner 希望用戶只需輸入10到15個單詞,就可以生成時長從2分鐘到16分鐘不等的場景和劇集,所有劇集都帶有 AI 對話、語音、剪輯、不同的鏡頭類型、一致的角色和故事發展。其目標用戶畫像是那些非技術、非專業的用戶。
在創作者收益方面,showrunner 會在正式推出時,將最好的劇集收錄到劇集目錄中,創作者可以得到一次性獎勵。如果該劇集被其他平臺選中,創作者還可以獲得后續分成。
創作者感知的工作流
04.
結語
不論是以技術的手段去提升視頻生成的效果,還是基于新的創作模式構建分發平臺,都離不開對精品內容的追求。在創作領域,精品內容永遠是商業變現的保證。這也是 AI 能夠在視頻創作領域規;瘧玫幕A。
誰會成為下一個時代的 Netflix?這個問題還沒有答案,但至今為止,我們看到了幾條不同的路徑在加速前進。
AI時代的皮克斯工作室,類似 Fable Studio 等公司,將自己的制作內容的管線通過編排Agent 的方式開放給用戶,形成人機協同的內容共創。用戶創作的內容沉淀在平臺上,形成了新的內容平臺。
新的內容平臺不滿足于過去的單向內容消耗,類似 DreamFlare 等產品,正通過互動式短片、互動游戲等方式構建新的娛樂內容平臺。
還有 Sora、Runway、Keling、Odyssey等有底層視頻模型能力的玩家,已不滿足于工具本身,圍繞其強大模型會逐漸建立起一批內容社區,逐漸向外擴展成為類似 GPTs Store 的內容展示平臺,也有可能是下一代 Netflix 的雛形。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。