階躍星辰開源Deep Think新框架，小模型解鎖百萬Token測試時計算_中文科技資訊&CITNews

　　論文鏈接：https://github.com/stepfun-ai/PaCoRe/blob/main/pacore_report.pdf

　　GitHub：https://github.com/stepfun-ai/PaCoRe

　　Hugging Face：https://huggingface.co/stepfun-ai/PaCoRe-8B

　　PaCoRe 框架

　　標準的思維鏈(Chain-of-Thought)推理與上下文容量是強耦合的：一旦窗口填滿，推理就必須停止。PaCoRe 通過將推理的主要驅動力從 “串行深度” 轉移到 “并行協同的廣度”，成功解耦了這種關系。

　　圖 1：并行協同推理(PaCoRe)的性能表現。

　　左圖：在 HMMT 2025 上，PaCoRe-8B 展示了驚人的測試時擴展(Test-Time Scaling)能力。通過增加并行軌跡(Parallel Trajectories)和協同輪次(Coordinated Rounds)，性能穩步提升，最終超越了 GPT-5。右圖：在 LiveCodeBench 上，普通的 RLVR-8B 模型無法利用增加的測試時計算量，而 PaCoRe 有效地解鎖了這種綜合能力，隨著計算量的增加帶來了顯著的性能提升。

　　推理機制 (Inference)

　　圖 2：PaCoRe 的推理流程。

　　PaCoRe 的核心是一個按輪次運行的迭代消息傳遞架構。其工作流程如下：

　　3.迭代協同(Iterative Coordination)：這些精簡消息成為下一輪的上下文，使模型能夠在多次迭代中修正理解、發現共識并糾正錯誤。為了確保收斂，最后一輪僅使用單一軌跡，生成最終的精簡消息作為 PaCoRe 推理流水線的輸出。

　　這種循環機制使得系統能夠將 “有效測試時計算量(Effective TTC)”—— 即所有軌跡的 Token 總和 —— 擴展到遠遠超出模型物理上下文窗口限制的程度。

　　訓練方法 (Training)

　　實現這一框架的主要挑戰在于將模型從簡單聚合孤立推理轉移為主動合作。未經訓練的推理模型常常在具有簡單解結構的問題上使用諸如多數表決這樣的簡單規則，而在更加多樣解的問題上，模型常常展現出孤立推理的現象：盡管在上下文中接收到了來自并行分支的豐富見解，但模型往往會忽略它們，試圖從頭開始重新解決問題。

　　為了克服這一問題，研究團隊將綜合階段視為一個情景式強化學習環境。我們采用大規模、基于結果的 RL 來教會模型推理綜合(Reasoning Synthesis) 能力：即審查并行分支、調和相互沖突的證據并提煉出統一解決方案的能力。

　　通過過濾訓練數據，排除那些僅靠啟發式規則就能解決的簡單問題，我們迫使模型發展出真正的綜合能力，將其從一個孤立的求解者轉變為一個高效的協同者。

　　圖 3：PaCoRe 訓練動力學。

　　實驗結果

　　研究團隊將 PaCoRe-8B(初始化自基于 Qwen3-8B-Base 的內部后訓練模型)與當前最具代表性的前沿推理模型進行了對比評估。

　　前沿級的性能表現

　　結果表明，并行協同機制使 8B 模型能夠通過大規模擴展 TTC，獲得遠超標準解碼限制的顯著收益，在一些最復雜的數學和代碼基準測試中超越了最先進的系統。

　　“綜合” 能力的涌現

　　圖 4：訓練過程中模型輸出中 “綜合” 相關語言特征的演變。

　　研究團隊繪制了 PaCoRe 訓練期間，數學和代碼任務生成解決方案中 “交叉檢查” 類詞匯(包括 'reference', ' 參考 ', 'Ref

　　', 'ref

　　')的頻率。訓練在這兩個領域都激發并放大了這種綜合能力。值得注意的是，模型最初在代碼任務上很少進行交叉檢查，這佐證了圖 1 中代碼任務在 PaCoRe 訓練前測試時擴展性差的現象。

　　研究團隊通過追蹤訓練過程中 “交叉檢查”(cross-checking)語言標記的普遍性來探究 PaCoRe 的底層機制。如上圖所示，基于結果的強化學習推動了這種行為在兩個領域的穩步上升。模型顯式地學會了引用同伴的消息(Referencing peer messages)，這種行為在未經 PaCoRe 訓練的模型中幾乎不存在。這證實了 RL 根本性地改變了推理動態，使模型能夠有效地利用大規模并行計算。

　　訓練數據的通用有效性

　　除了框架本身，研究團隊還發現為 PaCoRe 構建的訓練語料庫是一種密度極高的學習資源。經驗觀察表明，將我們發布的數據集作為標準 RLVR 的主要基底，也能帶來穩健的性能提升。這表明我們的問題集 —— 經過精心篩選以要求真正的綜合能力 —— 是訓練通用強推理模型的高效催化劑。

　　結論與未來方向

　　PaCoRe 建立了一條通往大規模測試時擴展(Test-Time Scaling)的無限路徑。通過圍繞 “并行協同” 構建推理架構并針對 “綜合能力” 進行訓練，研究團隊以將測試時計算擴展到數百萬 Token，從而允許較小的開放權重模型在復雜任務上超越專有的前沿系統。

　　階躍星辰團隊將發布模型權重、訓練數據和推理代碼，以加速社區的研究。

　　展望未來，團隊將 PaCoRe 視為通向以下更大目標的基礎性一步：

　　1.擴展極限(Scaling the Extremes)：計劃將 PaCoRe 應用于更強大的基礎模型，擴展任務領域，并進一步擴大廣度(并行軌跡)和深度(協同輪次)，以攻克目前被認為無法解決的挑戰。

　　2.提升 Token 智能密度(Boosting Token Intelligence Density)：雖然目前通過 “量” 來擴展，但研究團隊的目標是最大化每一個計算單元的效用。這包括通過更好的組織、合作和軌跡間的勞動分工，實現更高效的并行探索。

　　3.涌現多智能體智能(Emergent Multi-Agent Intelligence)：研究團隊有興趣探索綜合策略(Synthesis Policy)與消息傳遞機制的聯合訓練，構建一個極簡卻豐富的協作多智能體學習環境，這將是研究涌現式溝通、自組織和群體智能的寶貴試驗場。

　　4.銜接預訓練與后訓練的 “銜尾蛇”(Ouroboros)：研究團隊打算利用 PaCoRe 流程開發先進的合成數據生成技術，以反哺并改進當前的預訓練和后訓練過程，形成良性循環。

中文科技資訊微信二維碼logo

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評，目前站內累計模型數超過80萬個，涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景，基本覆蓋所有主流創作風格。

OPPO A6l發布：售價1799元搭載六年長壽大電池

華為Mate X7今日開售：售價12999元起

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

9月9日，國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場，1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

9月24日，華為坤靈召開“智能體驗，一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機，分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告，2025年第二季度》顯示，上半年全球智能家居清潔機器人市場出貨1,2萬臺，同比增長33%，顯示出品類強勁的市場需求。

專題

禮儀主持_商業活動模特演藝服務公司
九章智算云Alaya NeW Cloud 2.0發布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關于我單位網站被仿冒一

返回主頁 ┊ 關于我們 ┊ 內容聯系 ┊ 聯系我們 ┊ 免責聲明 ┊ 原創新聞 ┊ 門戶版

Copyright www.zxwl-tech.com 中文科技資訊 2009-2025 all rights reserved 網站聯系微信 xishuinet

關鍵詞：CITNews|Citnews中文科技資訊|中文科技資訊網|科技資訊網|中國科技資訊|中國科技新聞網|中國科技資訊網|快科技|新科技|中文科技數碼頭條號|中文移動新媒體

京ICP備18037198號-1 京公網安備 11010502041587號

国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
5566中文字幕一区二区电影| 日本道免费精品一区二区三区| 久操免费在线| 精品国产第一页| 神马久久资源| 黄色成人在线视频| 国产精品二线| 精品久久精品久久| 国产精品我不卡| 久久久久一本一区二区青青蜜月| 亚洲免费小视频| 国产精品一区二区在线观看不卡| 国产伦精品一区二区三区在线| 亚洲免费av片| 国产精品美女久久久久久久| 国产精品日本一区二区| 欧美酷刑日本凌虐凌虐| 18videosex性欧美麻豆| 无码小电影在线观看网站免费| 大地资源网3页在线观看| 精品蜜桃在线看| 欧美日本二区| 国产精品男人的天堂| 亚洲国产精品字幕| 欧美不卡高清一区二区三区| 日本电影亚洲天堂| 国内成人在线| 99riav视频在线观看| 久久九九免费| 婷婷亚洲最大| 国模精品视频| 日韩欧美国产激情| 亚洲一区二区在线观看视频| 亚洲国产中文字幕| 国产a级全部精品| 亚洲欧美在线看| 中文字幕一区二区三区四区久久| 日韩国产精品一区二区| 99re亚洲国产精品| 欧美日韩999| 亚洲卡通欧美制服中文| 日本亚洲免费观看| 成人黄色在线观看| 91国产精品成人| 国产日韩欧美在线| 国产精品对白| 在线视频国产一区| 精品国产亚洲在线| 91大神在线播放精品| 精品国产999| 中文字幕在线视频区| 亚洲毛片在线免费观看| 亚洲电影一级黄| 欧美精品一区二区三| 国产一区二区三区四区老人| 99精品在免费线中文字幕网站一区| 欧美国产日韩一区| 欧美中文字幕久久| 综合综合综合综合综合网| 成人免费观看av| 欧美特黄一级大片| 国产精品爽爽爽| 在线成人免费观看| 国产精品videosex极品| 日韩av二区在线播放| 91视频免费在线观看| 国产精品白丝jk白祙喷水网站| 久久精品二区三区| 91久久黄色| 黄色欧美日韩| 国产精品亚洲第一| 成人黄色在线视频| 美女脱光内衣内裤视频久久影院| 日韩欧美电影在线| 亚洲女同女同女同女同女同69| 亚洲精品久久久久久国产精华液| 波波电影院一区二区三区| 欧美私人网站| 国产精品成人一区二区网站软件| 日韩欧美视频一区二区三区四区| 播放一区二区| 一本色道久久综合狠狠躁篇的优点| 青草热久免费精品视频| 狠狠色狠狠色综合日日小说| 成人免费高清视频在线观看| 亚洲精品欧美精品| 久久综合伊人77777尤物| 国产超碰精品| 日韩有码一区| 日本高清成人vr专区| 性做久久久久久久久| 国产激情精品久久久第一区二区| 一级特黄大欧美久久久| 999精品一区| 精品在线99| 一区二区三区日韩精品视频| 亚洲国产精品综合久久久| 91在线观看免费高清| 91产国在线观看动作片喷水| 91精品国产综合久久精品| 亚洲国产精品综合小说图片区| 成人免费看黄yyy456| 国产高清在线| 久久久国产一区| 69视频在线播放| 国产黄网站在线观看| 国产亚洲精品久久飘花| 亚洲成人7777| 亚洲午夜影视影院在线观看| 亚洲字幕在线观看| 18av在线视频| 国产丝袜一区视频在线观看| 国产亚洲自拍一区| 亚洲精品88| 国产探花在线观看| 精品毛片三在线观看| 欧美成人精品一区二区三区在线看| 欧美另类videos死尸| 亚洲女同精品视频| **亚洲第一综合导航网站| 成人影视亚洲图片在线| 亚洲综合图片区| 九九精品视频在线观看| 亚洲bt欧美bt精品777| 国产欧美日韩免费| 精品一区二区国产| 国产午夜一区二区| 国产精品福利电影一区二区三区四区| 欧美激情亚洲视频| 精品国产免费人成电影在线观...| 国产视频在线一区二区| 久久av中文字幕片| 性金发美女69hd大尺寸| 日韩av中文字幕在线播放| 污影院在线观看| 蜜臀av一区| 精品女厕一区二区三区| 久久6精品影院| 亚洲最快最全在线视频| 日韩啪啪电影网| 黄色免费在线网站| 久久97精品久久久久久久不卡| 国产一区二区伦理片| 国产区一区二区三区| 国产精品欧美久久久| 欧美精品成人一区二区三区四区| 久久亚洲成人精品| 精品一区二区三区免费视频| 精品香蕉一区二区三区| 97国产精品免费视频| 日本电影在线观看网站| 日韩福利电影在线观看| 亚洲欧美在线免费观看| 97caopor国产在线视频| 国产一区二区三区免费视频| bt7086福利一区国产| 亚洲色图13p| 国产精品国产三级国产aⅴ无密码| 欧美人与物videos另类| 亚洲男人av在线| 久久精品av麻豆的观看方式| 精品国产乱码一区二区三区四区| 久久久久综合网| 久久久久www|