北京時間今日凌晨,微軟在官網開源了多模態AI Agent基礎模型Magma。與傳統Agent相比,Magma具備跨數字與物理世界的多模態能力,可自動處理圖像、視頻、文本等多種數據類型。此外,Magma內置心理預測功能,能夠準確推測視頻中人物或物體的意圖及未來行為,顯著提升對時空動態的理解能力。
Magma的應用場景廣泛,用戶可借助其自動完成電商訂單、查詢天氣,甚至操作實體機器人或在真實象棋對弈中獲得幫助。官方表示,Magma能夠幫助AI驅動的助手或機器人理解周圍環境并采取相應行動,例如指導家用機器人整理從未見過的物品,或為虛擬助手生成復雜任務的導航說明。
作為視覺語言動作(VLA)基礎模型之一,Magma能夠從海量公開視覺和語言數據中學習知識,融合語言、空間和時間智能,高效應對數字與物理世界中的復雜任務與環境。這一開源模型的發布,標志著AI在跨領域智能應用中的又一重大突破。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。