據 Arxiv 頁面顯示,微軟近日聯手加州大學等高校,共同發布一款多模態大模型產品 MM-Navigator。
MM-Navigator基于 GPT-4V打造,可用于零鏡頭智能手機 GUI 導航任務。通過使用 MM-Navigator,智能手機屏幕可以像人類用戶一樣進行交互,并確定后續行動以完成給定的指示。
研究發現,多模態大模型在零鏡頭 GUI 導航方面表現出色,尤其是 GPT-4V,它具有先進的屏幕解釋、行動推理和精確行動定位能力。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。