魔搭ModelScope社區宣布,DeepSeek-V2系列模型現已在魔搭ModelScope社區開源。
據悉,幻方公司在5月6日推出了第二代 MoE 模型 DeepSeek-V2,并開源了技術報告和模型權重,該模型引入了 MLA 架構和自研 Sparse 結構 DeepSeekMoE,以236B 總參數、21B 激活,實際部署在8卡 H800機器上,輸入吞吐量超過每秒10萬 tokens 輸出超過每秒5萬 tokens。

性能方面,在目前大模型主流榜單中,DeepSeek-V2均表現出色:
中文綜合能力(AlignBench)開源模型中最強,與GPT-4-Turbo,文心4.0等閉源模型在評測中處于同一梯隊
英文綜合能力(MT-Bench)與最強的開源模型LLaMA3-70B同處第一梯隊,超過最強MoE開源模型Mixtral8x22B
知識、數學、推理、編程等榜單結果也位居前列
支持128K上下文窗口
和DeepSeek67B相比,DeepSeek-V2節約了42.5%訓練成本,推理的KV Cache節約了93.3%,最大吞吐是之前的576%。
DeepSeek-V2的推理代碼和模型下載鏈接已經在魔搭 ModelScope 社區開源,用戶可以通過該平臺直接下載模型。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。