三大核心技術,直指智能體痛點

  為了支撐上述能力,Nemotron 3引入了三項緊密耦合的核心技術創新:

  1.Mamba-Transformer MoE架構

  該架構的創新之處在于將三種核心技術進行了深度融合:高效處理長序列的Mamba層、確保精密推理的Transformer層,以及實現可擴展計算效率的MoE(專家混合)路由機制。它們共同構成了一個高效協同的運算整體。

  圖:Nemotron 3采用混合架構,從而在最大化推理吞吐量的同時,依然保持了頂尖的準確性

  Mamba層的核心優勢在于能以極低的內存開銷追蹤長距離的依賴關系,即使面對數十萬乃至上百萬Token的超長序列,其性能依然穩定。這為處理長篇文檔、復雜代碼或持續對話提供了基礎。

  Transformer層則通過其精細的注意力機制,專門負責捕捉任務中深層的結構與邏輯。無論是代碼的語法關聯、數學公式的推導步驟,還是多步驟任務的規劃依賴,它都能進行精準建模,為模型賦予強大的推理能力。

  MoE組件的作用是在控制計算成本的前提下,智能地擴展模型的能力。其原理如同一個由眾多專家組成的智庫:對于每個輸入的Token,系統只會動態調用最相關的一部分“專家”進行處理,而非動用全部資源。這種“按需調用”的模式,顯著降低了運算延遲,并大幅提升了整體吞吐效率。

  正因如此,這套混合架構天然適配需要高并發處理的多智能體場景。想象一個由眾多輕量級AI助手組成的集群:它們可能同時在生成任務計劃、分析上下文信息或調用各種工具執行工作流。該架構能夠為每個并發的智能體實例提供高效、獨立的計算支持,從而確保整個系統流暢、敏捷地運轉。

  2.多環境強化學習訓練

  為了讓Nemotron 3的行為模式更貼近能夠解決實際問題的智能體,英偉達在發布前對其進行了關鍵一步的“實戰演練”,在名為NeMo Gym的開源強化學習平臺中進行后訓練。

  圖:Nemotron 3 Nano憑借其混合專家(MoE)架構實現了最高的吞吐效率,并通過在NeMo Gym平臺上的強化學習訓練,獲得了領先的推理準確度

  這個平臺提供了多種模擬現實世界的虛擬環境。在這些環境中,模型不再僅僅是回答單個問題,而是被評估其執行一連串復雜動作的序列能力。具體任務可能包括:準確調用一個應用程序接口來查詢數據、編寫一段能真正運行并解決問題的代碼,或者構思一個包含多個階段、且最終結果可被驗證的詳細計劃。

  這種基于完整行為軌跡的強化學習訓練,其核心目標是讓模型“學會思考”,從而在真實的應用中表現得更穩定可靠。它能有效減少模型在長鏈條任務中可能出現的“推理漂移”(即思維逐漸偏離正軌),并提升其處理具有固定邏輯和結構化步驟的任務流程的能力。

  一個經過這種訓練后變得“可靠”的模型,在實際部署時,更不容易在執行中途“卡殼”或做出前后矛盾的決策。同時,這極大地降低了將前沿大模型轉化為解決具體領域問題的“專家智能體”的門檻和成本。

  3.100萬Token上下文窗口

  Nemotron 3的100萬Token上下文窗口,使其能夠將完整的任務背景、歷史記錄和復雜計劃保存于單一“工作區”,實現真正意義上的長程、持續推理。這消除了因傳統文本切割導致的信息碎片和邏輯斷層。

  其實現得益于核心的高效混合Mamba-Transformer架構,它能在低內存開銷下處理超長序列,而MoE(專家混合)路由機制則通過按需激活專家,將處理龐大上下文所需的實際計算量控制在可行范圍內。

  對于企業級的深度文檔分析、跨會話智能體協作或整體代碼庫理解等復雜任務,這一能力能直接提升事實準確性、保障邏輯連貫性,是構建可靠、持久AI應用的關鍵基礎。

  即將推出的關鍵技術

  為了在更大規模的Super和Ultra版本中實現更強的性能與效率,Nemotron 3引入了三項進階的關鍵技術:

  潛在MoE:用相同成本調用更多“專家”

  圖:標準MoE與潛在MoE架構對比

  Nemotron 3 Super 和 Ultra 采用了潛在MoE技術。在此設計中,模型的各個“專家”模塊并非直接處理原始的Token數據,而是先在一個共享的、維度更低的潛在表征空間 中進行運算,再將結果轉換回Token空間。

  這種設計的精妙之處在于,它能讓模型以基本相同的推理計算成本,動態調用多達4倍的專家數量。這相當于在不增加“腦力”負擔的情況下,顯著擴充了可用的“專業智庫”,使模型能夠對更微妙的語義差異、特定領域的抽象概念,以及需要多步推導的復雜推理模式,實現更精細、更專業化的處理。

  多Token預測:一次生成多個詞,提升響應速度

  圖:多Token預測技術允許模型在訓練時同時預測未來多個Token,顯著提升模型的響應速度

  多Token預測技術改變了模型逐詞生成的慣例,允許其在一次前向計算中,同時預測后續的多個Token。這對于需要生成長篇邏輯推理(如思維鏈)、結構化輸出(如代碼、JSON)或未來行動軌跡的任務而言,能顯著提高生成吞吐量。

  其效果直觀體現為:在規劃、代碼生成或長對話等場景中,智能體的響應延遲更低,整體反應更為敏捷流暢,極大地改善了交互體驗。

  NVFP4訓練格式:高精度與低成本的平衡

  Super和Ultra模型的預訓練使用了英偉達自研的4位浮點格式NVFP4。該格式的核心價值是在訓練與推理的成本與模型精度之間實現了業界頂尖的平衡。

  專為Nemotron 3優化的NVFP4訓練方案,確保在25萬億Token數據集上,訓練過程既能保持穩定,又能保證最終模型的準確性。在實際訓練中,絕大部分的浮點乘累加運算都在NVFP4格式下高效完成,從而在控制巨量計算開銷的同時,鍛造出高性能的模型。

  開源Nemotron訓練數據集

  英偉達還將發布用于模型開發全過程的開放數據集,為如何構建高性能、可信賴的模型提供了前所未有的透明度。

  新發布的數據集包括:

  Nemotron-預訓練集:一個新的包含3萬億Token的數據集,更廣泛地涵蓋了代碼、數學和推理內容,并通過合成增強和標注流程進行了優化。

  Nemotron-后訓練集 3.0:一個包含1300萬樣本的語料庫,用于監督微調和強化學習,是Nemotron 3 Nano實現對齊和推理能力的動力來源。

  Nemotron-RL數據集:一套精選的強化學習數據集和環境,用于工具使用、規劃和多步推理。

  Nemotron智能體安全數據集:一個包含近1.1萬條AI智能體工作流軌跡的集合,旨在幫助研究人員評估和緩解智能體系統中新出現的安全與安保風險。

  結合英偉達的NeMo Gym、RL、Data Designer和Evaluator等開源庫,這些開放數據集使開發者能夠訓練、增強和評估他們自己的Nemotron模型。

  英偉達生成式AI軟件副總裁卡里·布里斯基表示,公司希望展示其從前代模型中學習與改進的承諾。“我們相信,我們具備獨特的優勢,能夠服務廣大開發者,他們希望通過結合我們新的混合專家模型架構和100萬Token的上下文長度,來獲得完全定制模型、構建專用AI的靈活性。”布里斯基說道。

  英偉達表示,Nemotron 3模型的早期采用者包括埃森哲、CrowdStrike、Cursor、德勤、安永、甲骨文云基礎設施、Palantir、Perplexity、ServiceNow、西門子和Zoom等公司。

中文科技資訊微信二維碼logo

  文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

海報生成中...

瀏覽

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

新聞

市場占比高達35.8%,阿里云引領中國AI云增長

9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
成熟亚洲日本毛茸茸凸凹| 国产视频一区二区不卡| 国产视频一区在线观看一区免费| 91精品国产91久久久| 亚洲影视九九影院在线观看| 国产精品69久久| 色香阁99久久精品久久久| 日韩一级视频| 日本不卡视频在线观看| 欧美草逼视频| 免费看电影在线| 欧美高清一区| 日韩精品一区二区三区中文精品| www.成人网.com| 亚洲欧美日韩国产成人精品影院| 国产精品久久久久久久久久小说| 欧美综合在线视频| 黄色免费在线看| 伊人伊成久久人综合网站| 欧美在线中文字幕| 综合网中文字幕| 国产91aaa| 亚洲女在线观看| 国自在线精品视频| 一区在线中文字幕| 欧美有码在线| 亚洲高清久久久久久| 婷婷亚洲五月色综合| 91精品国产调教在线观看| 久久99久久久久| 欧美精品一本久久男人的天堂| 亚洲精品国产品国语在线| 欧美日韩国产综合一区二区三区| 久久悠悠精品综合网| 亚洲精品一级二级三级| 欧美天堂亚洲电影院在线播放| 亚洲国产精品99久久| 欧美一区二区精品| 国产高清视频一区二区| 综合激情一区| 亚洲成人精品在线观看| 尤物yw午夜国产精品视频| 免费在线观看黄色网| 嗯啊主人调教在线播放视频| 欧美猛烈性xbxbxbxb| avtt综合网| xxxxxhd亚洲人hd| 看全色黄大色大片免费久久久| 亚洲精品久久7777777| 精品国产一区二区三区久久久久久| 久久综合五月| 欧美在线播放一区| 亚洲欧美国产日韩中文字幕| 国产亚洲婷婷免费| 亚洲国产国产| 精品露脸国产偷人在视频| 国产在线播放一区二区| 高清欧美电影在线| 四虎影视永久免费在线观看一区二区三区| 国产欧美日韩一区二区三区在线| 欧美人与物videos另类| 9人人澡人人爽人人精品| 色999韩欧美国产综合俺来也| 伊人免费在线| 神马午夜在线视频| 国产精品1区2区3区在线观看| 电影一区电影二区| 亚洲一区导航| 日韩情爱电影在线观看| 好看的亚洲午夜视频在线| 欧美三级网址| 亚洲女人天堂成人av在线| 久久99久久99小草精品免视看| 日本欧美色综合网站免费| 蜜桃伊人久久| 国产精品三区www17con| 色婷婷综合成人av| 日韩欧美亚洲区| aa国产成人| 爽好多水快深点欧美视频| 欧美福利视频| 欧美激情aaaa| 91在线在线观看| 亚洲无线一线二线三线区别av| 国内成人精品2018免费看| 91亚洲国产精品| 欧美亚洲专区| 国产精品美女久久久久av爽李琼| 国内精品视频在线观看| 国产精品香蕉一区二区三区| 久久九九免费| 亚洲美女视频一区| 日韩一区二区三区国产| 三级中文字幕在线观看| 欧美黄色一区| 欧美在线观看禁18| 欧美系列一区| 国产精品久久久久久久久借妻| 国产精品入口日韩视频大尺度| 永久免费观看精品视频| 亚洲影视一区| 狼狼综合久久久久综合网| 日本在线观看一区| 国产精品扒开腿做爽爽爽视频| 亚洲激情影院| 欧美永久精品| 亚洲h动漫在线| 97在线视频一区| 九色91视频| 成人av电影在线播放| 99精品在免费线中文字幕网站一区| 天堂√中文最新版在线| 日日狠狠久久偷偷四色综合免费| 97国产精品videossex| 国产在线观看一区| 欧美日韩国产小视频| 亚洲综合999| 国产欧美最新羞羞视频在线观看| 日本sm极度另类视频| 69久成人做爰电影| 日韩免费高清| 日产精品久久久一区二区| 成人区精品一区二区| 日韩免费高清视频| 欧美写真视频网站| 视频一区二区三区中文字幕| 国产精品大尺度| 国产一区二区不卡| caoporn国产精品| 亚洲高清123| 日韩精品高清视频| 一区二区三区四区乱视频| 国产在线观看www| 欧美老肥妇做.爰bbww| 欧美日韩中出| 国产精品第一页第二页第三页| 视频亚洲一区二区| 午夜久久福利| 精品一区二区三区在线观看| 亚洲视频网在线直播| 免费成人黄色网| 欧美偷拍一区二区| 一区二区三区国产好| 日韩在线不卡视频| 中文字幕欧美日韩va免费视频| 成人黄色在线免费观看| 欧美日韩性生活| 亚洲国产欧美一区二区三区久久| 无码av中文一区二区三区桃花岛| 国产日韩欧美高清在线| 123成人网| 欧美mv和日韩mv国产网站| 欧美在线三级电影| 黄色激情在线播放| 国精品**一区二区三区在线蜜桃| 欧美日韩精选| 日韩在线中文| 激情视频一区二区三区| 欧美一级欧美三级在线观看| 日本一道高清亚洲日美韩| 天海翼亚洲一区二区三区| 国产一区欧美一区| 日韩欧美一区二区三区在线| 色综合久久久久综合一本到桃花网|