谷歌發布了一項名為HyperDreamBooth的革命性模型訓練方法,該方法在生成AI領域取得了顯著的進步,尤其是在個性化模型訓練方面。然而,盡管這一技術具有突破性,谷歌并沒有計劃將其開源。
主要特點:
超快速訓練:能在20秒內完成模型訓練,這比DreamBooth快了25倍,比Textual Inversion快了125倍。
個性化權重的超網絡:從單張人像生成一小組個性化權重,這使得模型能夠捕捉到個體的特征。
高質量和風格多樣性:盡管只需一張參考圖像,生成的模型在質量和風格多樣性上與DreamBooth相當。
極小的模型尺寸:生成的模型比普通DreamBooth模型小10000倍,這極大地減少了存儲需求。
HyperDreamBooth通過使用HyperNetwork技術,有效地從單個人物圖像中生成個性化權重,這些權重隨后被組合到擴散模型中。結合快速微調,該方法能夠在極短的時間內生成具有高度主題細節的面部圖像,同時保留了對多樣化風格和語義修改的敏感性。
谷歌提出的解決方案還包括:
輕量級DreamBooth(LiDB):一個個性化文本到圖像模型,其定制部分僅有約100KB大小,通過在低秩適應權重空間內生成隨機正交不完整基礎來訓練DreamBooth模型。
結合輕量級DreamBooth配置:定制部分與給定主題生成文本到圖像擴散模型權重的架構相結合,提供了強大的方向初始化,使得模型能夠在幾次迭代內實現強大的主題保真度。
秩松弛微調技術:在優化過程中放松LoRA DreamBooth模型的秩,以實現更高的主題保真度。這種方法允許使用HyperNetwork進行初始近似初始化個性化模型,并使用秩松弛微調技術近似高級主題細節。
HyperDreamBooth的發布代表了AI個性化模型訓練的一個重大進步,盡管其不開源的決定可能會限制其他研究者和開發者直接利用這項技術的能力。谷歌的這一貢獻為AI領域提供了新的可能性,同時也為未來的研究和應用設定了新的標準。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。