阿里云今日宣布,通義實驗室正式開源網絡智能體WebSailor,該智能體憑借強大的推理與檢索能力,在OpenAI發布的高難度智能體評測集BrowseComp上位列開源榜單首位。目前,其構建方案及部分數據集已在GitHub開源。
WebSailor專為復雜場景設計,能高效處理模糊問題,通過多步推理和交叉驗證從海量信息中精準檢索答案。通義實驗室采用創新的post-training方法,顯著提升了模型在網頁推理任務中的表現。在BrowseComp評測中,WebSailor-32B和WebSailor-72B版本不僅領先于DeepSeek R1、Grok-3等開源模型,甚至超越部分閉源系統,僅次于OpenAI DeepResearch。
此外,WebSailor在普通任務數據集SimpleQA上也展現出優異性能,驗證了其泛化能力。阿里云表示,該智能體的通用工作流及“高難度任務合成+高效RL優化”策略,可為開源社區解決復雜推理、學術發現等挑戰提供借鑒。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。