首次參與打榜,Grok取得第一名,MiroMind為開源模型的第一。馬斯克為此興奮發文,稱之為最好的benchmark

  FutureX與Prophet Arena:AI智能體未來預測基準的誕生

  不久前,字節跳動 SEED 團隊聯合斯坦福大學、復旦大學、普林斯頓大學共同推出Future X,是全球首個動態實時 LLM 智能體未來預測基準。它從全球200多個高質量網站精選只有下周才會有明確結果的問題,讓AI直面正的未來事件:股票價格的漲跌、體育比賽的勝負、政治選舉的結果、科技公司的戰略走向等。

  這種評估方式的核心優勢非常顯著。AI 必須像人類分析師一樣,基于當前可獲得的信息,運用邏輯推理、趨勢分析和概率計算來做出預測。這一機制極大地推動了 AI 智能體在真實世界復雜場景中的實用能力提升,也成為衡量智能體系統核心智能水平的重要標桿。

  Prophet Arena則是另一個AI預測能力評估平臺,通過實時收集和分析真實世界事件,考察AI模型在不確定性推理、信息整合和概率預測等方面的表現。

  MiroMind如何成功預測未來

  MiroMind 在 FutureX 榜單上表現驚艷。8 月第 3 周,首次參與即獲得第六名的成績。而在 9 月的提交中,更實現了雙重突破:搭載 GPT-5 的 MiroFlow 智能體框架在第 1 周和第 2 周連續奪得榜首,同時搭載自研模型 MiroThinker 的 MiroFlow 均位列前五,力壓眾多國際頂尖機構和閉源商業模型。

1758520209545027.jpg

  在測試中,MiroMind 成功預測了 2025 年 9 月 9 日ATP 男子單打排名第 4-6 位的選手,其難點在于網球排名系統極為復雜,涉及積分計算、比賽結果、時間窗口等多個變量。

  MiroMind 的模型在預測中制定了五步策略:

  1. 制定詳細預測計劃:模型首先展現了戰略規劃能力,制定了系統性的預測方案。

  2. 獲取基礎數據:通過網絡檢索獲取 9 月 1 日的男子網球 TOP 10 排名數據,建立預測基準線。

  3. 理解積分規則:深入研究比賽排名與積分的對應關系,特別對比了 2024 年與 2025 年的 dropping 規則,確保計算一致性。

  4. 動態信息更新:搜索 9 月 1 日之后的比賽成績,并分類處理:對已有結果的比賽,直接更新對應選手排名;對尚未結束的比賽,識別其可能影響。

  5. 概率分析與綜合判斷:多情景分析,針對尚未出結果的比賽,模型分析了6種可能情況;引入博彩網站概率數據,作為外部驗證基準;最終基于 outcome 和 probability 加權計算,得出最可能排名結果。

  MiroMind 還成功預測了 2025 年 9 月 11 日 數字加密貨幣 Solana 將突破的一系列關鍵價格檔位,體現了模型在處理價格波動類問題上的系統建模能力與風險控制水平。這輪預測中,MiroMind 則是制定了六步策略:

  1. 構建市場基準線:聚合 CoinGecko、Coinbase、Binance、Kraken 等多平臺實時數據,明確 Solana 當前價格區間及近期價格走勢,建立精準預測起點;

  2. 量化短期波動空間:基于歷史數據計算年化波動率、平均日內振幅等關鍵指標,評估 Solana 在一天內可能達到的價格區間,判斷各檔位的突破概率;

  3. 梳理外部影響因素:系統檢索 9 月 10 日的宏觀經濟事件(如美國 PPI 發布)、Solana 鏈上動態和潛在生態活動,評估是否存在可能引發劇烈波動的催化因素;

  4. 分析市場情緒信號:提取 OKX、Kraken 等平臺的永續合約資金費率與基差數據,判斷市場是否存在明顯的多空傾斜,作為重要情緒指標參考;

  5. 挑選穩健價格檔位:結合價格分布、風險容差與市場結構,挑選那些在大多數行情路徑下都有可能成立的價格檔位,避開臨界邊緣值,確保預測結果穩健可靠;

  6. 交叉驗證與最終判斷:對比統計結果、衍生品信號與第三方市場預期,最終確定最優預測選項,兼顧穩健性與覆蓋率。

  MiroMind 的登頂并非偶然,而是基于AI預測未來的幾項核心能力:

  · 信息洞察力:能快速抓取、理解和整合海量數據——從股市行情到新聞動態,再到社交輿情。沒有全面信息,預測就是空想。

  · 邏輯推理與趨勢感知:能發現模式、識別因果、判斷趨勢。未來不是憑直覺,而是建立在嚴密邏輯和數據分析之上。

  · 概率與不確定性管理:能量化可能性、權衡風險,在不確定環境下做出最優判斷。未來充滿變數,聰明的預測是概率化的決策。

  · 跨領域整合能力:能把金融、政治、科技、社會等多領域信息融會貫通。未來事件往往是多因素交織,單一視角難以洞察全局。

  建設最好預測大模型和創新者平臺

  MiroFlow 框架在 GAIA-Validation 上也取得了 82.4% 的優異成績,并在 HLE、BrowseComp 以及 xBench-DeepSearch 等基準測試中領先眾多國際對手。更值得關注的是,MiroFlow 提供了完全開源、可復現的框架和配置,致力于建設一個創新者平臺。這個平臺為研究者和開發者提供從基礎框架、模型到工具鏈的完整支持,使大家能夠自由實驗、快速迭代,并在多 Agent 協作、多模態理解等前沿領域進行探索。

1758520126919740.png

  MiroFlow 框架之外,MiroMind 團隊推出的自研旗艦基礎智能體模型(Agent Foundation Model)——MiroThinker,不僅具備強大的推理、決策和多模態理解能力,還能在多 Agent 協作中發揮核心作用,在各類榜單中已成為開源模型的引領者,并不斷縮小與閉源商業模型的差距。MiroThinker 很快將以完全開源的形式向全球開發者和研究者開放,提供可復現的模型和實驗環境。

  陳天橋:持續投入,誠邀全球AI人才

  從盛大,到天橋腦科學研究院,再到All in AI,陳天橋四分之一個世紀以來持續探索人類未來科技的邊界:

  · 虛擬世界的創造者,1999年創辦盛大,開創了中國網絡游戲與網絡文學行業。

  · 人類大腦的探索者,2016年創辦全球最大的私人腦科學機構天橋腦科學研究院,在腦機接口等基礎、前沿研究領域碩果累累。

  · 未來世界的塑造者,開展AI+長期記憶、AI預測未來等全新前沿探索。目前MiroMind 正在探索將長期記憶模塊深度嵌入模型,在復雜、多變的環境中做出更精準可靠的預測,實現真正的時間維度智能。

  陳天橋說:“我們正在全力打造一個全球最好的預測大模型,讓AI記住過去,洞察未來。我們持續歡迎全球志同道合的AI優秀人才加入,共同創造未來。”

中文科技資訊微信二維碼logo

  文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

海報生成中...

[No.X026]
瀏覽

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

新聞

市場占比高達35.8%,阿里云引領中國AI云增長

9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

“三位一體”數據保護體系,筑牢企業出海安全“生命

戴爾科技一直致力于通過“三位一體”數據保護體系,為中國企業的數據安全“保駕護航”。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
91精品丝袜国产高跟在线| 久久久国产视频91| 欧美日韩国产首页在线观看| 久久久久久综合网天天| 精品久久电影| 亚洲伦理一区二区| 香蕉视频官网在线观看日本一区二区| 激情五月***国产精品| 国产欧美欧洲在线观看| 豆国产96在线|亚洲| 成年人视频在线观看免费| 亚洲日本国产| 7777精品伊人久久久大香线蕉的| 免费99精品国产自在在线| 欧美福利一区| 日本.亚洲电影| 欧美重口乱码一区二区| 成人黄色在线视频| 91最新在线免费观看| 成人精品在线视频观看| 91精品麻豆日日躁夜夜躁| 成人夜晚看av| 六九午夜精品视频| 年轻的保姆91精品| 电影久久久久久| 成人综合一区| 欧美视频在线视频| 99精品国产在热久久下载| 久久av一区二区三区| 亚洲精品国产精品国自产| 日韩在线短视频| 欧美激情网友自拍| 日韩母乳在线| 亚洲卡通欧美制服中文| 日韩欧美色综合网站| 欧美一级鲁丝片| 高清国语自产拍免费一区二区三区| 亚洲国产婷婷香蕉久久久久久99| 九色porny丨国产精品| 欧美激情在线| 亚洲一区二区三区中文字幕在线| 中文字幕一区在线观看| 91精品视频专区| 欧美俄罗斯性视频| 在线观看特色大片免费视频| 精品国产精品三级精品av网址| 一区精品久久| 97久久综合精品久久久综合| 成人免费看黄yyy456| 欧美性欧美巨大黑白大战| 午夜精品毛片| 久久99久久99小草精品免视看| 亚洲欧美日韩一区在线| 俄罗斯精品一区二区| 欧美日本啪啪无遮挡网站| 欧美电影三区| 99视频在线免费观看| 国产免费一区二区三区香蕉精| 亚洲桃色在线一区| 国产精品一区二区精品视频观看| 91激情五月电影| 国产精品免费一区豆花| 国产精品99精品一区二区三区∴| 成人av男人的天堂| 欧美日韩看看2015永久免费| 麻豆传媒在线免费| 九一国产精品| 亚洲精品粉嫩美女一区| 亚洲免费在线精品一区| 日韩一区二区在线免费| 国产精品精品国产色婷婷| 国产精品不卡一区二区三区| 99精品欧美一区二区三区综合在线| 在线观看www91| www久久日com| 成人看片视频| 欧美伊人久久久久久午夜久久久久| 国内外成人在线视频| 亚洲精品自拍视频| 国产网红女主播精品视频| 国产美女精品| 国产电影一区二区三区| 国产精品美女久久久久久免费| 亚洲午夜久久久久久久| 粉嫩一区二区三区| 欧美日韩亚洲一区二区三区在线观看| 精品视频成人| 国产精品成人免费精品自在线观看| 精品国产乱码久久久久酒店| yy111111少妇影院日韩夜片| 国产精品久久国产精麻豆99网站| 欧美高清视频一区二区三区在线观看| 日韩精品福利视频| 91精品国产高清久久久久久久久| 爱福利视频一区| 久久午夜a级毛片| dy888夜精品国产专区| 国模大胆一区二区三区| 青青草成人网| 亚洲欧美国产精品久久久久久久| 在线电影国产精品| 在线精品国产| 色av吧综合网| 欧美日本黄视频| 欧美区高清在线| 欧美一二三区精品| 美国一区二区三区在线播放| 欧美精品一区二区三区久久久| caoporm超碰国产精品| 国产精品无码专区在线观看| 在线激情影院一区| 国产精品自产拍高潮在线观看| 亚洲精品日韩成人| 高清免费成人av| 久久亚洲资源中文字| 毛片免费不卡| 日韩精品丝袜在线| 久久综合色鬼综合色| 亚洲第一区中文字幕| 日韩欧美极品在线观看| 久久伊人一区二区| 69久久夜色精品国产69蝌蚪网| 欧美日韩夫妻久久| 色偷偷久久一区二区三区| 一区二区三区视频网站| 淫片在线观看| 超在线视频97| 亚洲欧洲精品在线观看| 91在线网址| 日韩精品在线第一页| 欧美jizz| 欧美三日本三级少妇三99| 亚洲永久av| 亚洲男人天堂久| av成人国产| 欧美一级高清免费| 手机在线观看国产精品| 69堂亚洲精品首页| 国产一区二区三区四区五区入口| 狠狠色2019综合网| 日本动漫理论片在线观看网站| 亚洲欧美制服另类日韩| 欧美色图第一页| 777精品视频| 亚洲欧美一区二区三区久本道91| 2023国产一二三区日本精品2022| 日韩欧美电影在线| a√在线中文网新版址在线| 色噜噜狠狠狠综合曰曰曰88av| 国产97人人超碰caoprom| 亚洲毛片一区| 欧美肥胖老妇做爰| 国产一在线精品一区在线观看| 久久精品国产视频| 亚洲深夜福利在线观看| 欧美中文一区| 国产精品视频免费一区| 欧美一区二区视频在线观看| 国产综合久久久久久鬼色| 亚洲人成绝费网站色www| 91爱视频在线| 免费在线播放第一区高清av| 欧美白人最猛性xxxxx69交| 精品久久久久中文字幕小说|