3月13日消息,當地時間周三,谷歌發布了兩款新型 AI 模型——Gemini Robotics 和 Gemini Robotics-ER(具象推理),旨在提升機器人在現實世界中的任務執行能力。這一突破標志著機器人技術在通用性、互動性和安全性方面邁出了重要一步,同時也為未來智能機器人的廣泛應用奠定了基礎。
一、技術突破:從多模態理解到具象推理
1. Gemini Robotics:多模態世界理解
據網經社云計算臺(CC.100EC.CN)查詢DeepSeek后獲悉,Gemini Robotics 是一款視覺語言行動模型,基于谷歌最新的 Gemini 2.0 模型開發。它通過加入物理行動的新模態,實現了對現實世界的多模態理解。這一模型的最大亮點在于其通用性,能夠在未經專門訓練的情況下理解新情境,并執行精確的物理操作,如折紙或打開瓶蓋。這種能力使機器人能夠更好地適應復雜多變的環境,為未來的家庭服務、醫療護理等領域提供了技術支持。
2. Gemini Robotics-ER:具象推理與安全性
Gemini Robotics-ER 則專注于復雜動態世界的理解,特別是在動作安全性方面的評估。該模型通過分層安全策略,確保機器人在執行任務時能夠評估潛在風險并采取相應措施。這一功能對于機器人在工業、醫療等高風險環境中的應用尤為重要,為智能技術的安全性提供了保障。

二、應用前景:推動機器人技術的普及
1. 人形機器人的開發
谷歌 DeepMind 與 Apptronik 合作,致力于打造下一代人形機器人。Gemini Robotics-ER 模型的開放將為這一領域注入新的活力,推動人形機器人在服務、制造等領域的應用。通過與多家公司合作,谷歌 DeepMind 正在加速智能技術的商業化進程。
2. 多領域應用的潛力
這兩款模型不僅在家庭服務機器人領域具有廣闊前景,還可應用于工業自動化、醫療護理、物流配送等多個領域。例如,在醫療領域,機器人可以協助醫生完成精細的手術操作;在物流領域,機器人可以高效完成貨物的分揀和搬運。這些應用將顯著提升生產效率,降低人力成本。
三、挑戰與未來展望
盡管 Gemini Robotics 和 Gemini Robotics-ER 展現了強大的技術潛力,但其在實際應用中仍面臨諸多挑戰。例如,如何確保模型在極端環境下的穩定性,以及如何降低技術成本以實現大規模普及。此外,隨著機器人技術的快速發展,倫理和安全問題也亟待解決。
未來,隨著技術的不斷迭代和優化,Gemini Robotics 系列模型有望成為機器人領域的核心技術之一。通過與行業伙伴的深度合作,谷歌 DeepMind 正在為智能機器人的廣泛應用鋪平道路,推動人類社會邁向智能化新時代。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。