π0測試結果

π0.5測試結果
相比之下,自變量的wall-oss-flow 在相同條件下的表現明顯偏弱。測評結果顯示:wall-oss-flow共測試31次,其中2次成功率為60%,1次成功率為50%,1次成功率為20%,其余所有任務成功率均為0。

wall-oss-flow測試結果
“具身進化論”從進度分情況看到,模型雖然在部分任務中能完成初段動作,但多數情況下未能完成關鍵步驟,執行鏈條往往在中段被迫中斷。這與平臺強調的“多階段連續操作能力”形成明顯差距。
公開信息顯示,自變量2023年成立,創始人兼CEO為王潛。今年9月,自變量發布其開源大模型WALL-OSS,自變量在官方宣傳稿中強調該模型“具備強大的泛化性和推理能力,在長程操作任務方面表現優于其他基礎模型”。
王潛甚至曾在接受媒體采訪時表示:“我們(自變量)的模型水平基本上和PI、和google在同一個水平線上。”
但此次RoboChallenge 的評測結果顯示,自變量模型的水平、能力在真實機器人執行任務時未能體現,與PI的模型(π0 和 π0.5)也存在明顯差距。
一位具身智能從業者對“具身進化論”分析,RoboChallenge的獨特價值正是在于提供透明、可復現的真機評估環境,避免主觀展示帶來的偏差。隨著越來越多模型加入測評,業內對“模型真實能力差異”有了更清晰的認知。
對具身智能行業而言,此次結果再次提醒:真正的競爭不在PR宣傳中,而在三方認可的評測,學術基準線,以及機器人能否穩定完成任務的那一刻。
真實世界,正在成為檢驗大模型能力的最終標準。而認識到差距,正是追趕的開始。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。