5月11日,智能文檔處理領域迎來了重要的里程碑,首個視覺-語言模型的統一基準測試IDP Leaderboard正式推出。
該基準通過對9229份文檔和16個數據集的評估,全面分析了當前主流模型在多個核心任務上的表現。
盡管Gemini2.5Flash在綜合實力上表現突出,但在OCR和分類任務中卻出現了意外的下滑,顯示出多模態推理能力與基礎文本識別功能之間的權衡問題。
IDP Leaderboard通過16個數據集和9229份文檔,評估了主流模型在六大核心任務上的表現。
Gemini2.5Flash在綜合實力上領先,但在OCR和分類任務中表現不及前代產品,顯示出模型迭代中的平衡問題。
長文檔處理和表格提取仍是視覺-語言模型的短板,最佳模型在這些任務上的得分仍未突破70%。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。