官方網頁端、App 和 API 均已更新為正式版 DeepSeek-V3.2。Speciale 版本目前僅以臨時 API 服務形式開放,以供社區評測與研究。
DeepSeek-V3.2
DeepSeek-V3.2 的目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用 Agent 任務場景。
在公開的推理類 Benchmark 測試中,DeepSeek-V3.2 達到了 GPT-5 的水平,僅略低于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 的輸出長度大幅降低,顯著減少了計算開銷與用戶等待時間。
DeepSeek-V3.2-Speciale
DeepSeek-V3.2-Speciale 的目標是將開源模型的推理能力推向極致,探索模型能力的邊界。
V3.2-Speciale 是 DeepSeek-V3.2 的長思考增強版,同時結合了 DeepSeek-Math-V2 的定理證明能力。該模型具備更好的指令跟隨、數學證明與邏輯驗證能力,在主流推理基準測試上的性能表現媲美 Gemini-3.0-Pro。
V3.2-Speciale 模型成功斬獲 IMO 2025(國際數學奧林匹克)、CMO 2025(中國數學奧林匹克)、ICPC World Finals 2025(國際大學生程序設計競賽全球總決賽)及 IOI 2025(國際信息學奧林匹克)金牌。其中,ICPC 與 IOI 成績分別達到了人類選手第二名與第十名的水平。
DeepSeek 官方表示,在高度復雜任務上,Speciale 模型大幅優于標準版本,但消耗的 Tokens 也顯著更多,成本更高。目前,DeepSeek-V3.2-Speciale 僅供研究使用,不支持工具調用,暫未針對日常對話與寫作任務進行專項優化。
不同于過往版本在思考模式下無法調用工具的局限,DeepSeek-V3.2 是該公司推出的首個將思考融入工具使用的模型,并且同時支持思考模式與非思考模式的工具調用。
官方提出了一種大規模 Agent 訓練數據合成方法,構造了大量「難解答,易驗證」的強化學習任務(1800+ 環境,85,000+ 復雜指令),大幅提高了模型的泛化能力。
DeepSeek-V3.2 模型在智能體評測中達到了當前開源模型的最高水平,大幅縮小了開源模型與閉源模型的差距。值得說明的是,V3.2 并沒有針對這些測試集的工具進行特殊訓練。
DeepSeek-V3.2 的思考模式也增加了對 Claude Code 的支持,用戶可以通過將模型名改為 deepseek-reasoner,或在 Claude Code CLI 中按 Tab 鍵開啟思考模式進行使用。
但需要注意的是,思考模式未充分適配 Cline、RooCode 等使用非標準工具調用的組件,官方建議用戶在使用此類組件時繼續使用非思考模式。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。