国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

遇見·新視界”:LG UltraGear電競顯示器全景式體驗,多款新品陸續登場把舞臺拍成電影——佳能“佳直播PRO”助力譚維維《聲聲世世》音樂會幕后2025世界頂尖科學家論壇青年科學家大會在滬舉辦,深度對話頂尖大師總裁敲門,福利到家!京東11.11總裁送貨直播豪送E卡與免單大獎熱賣榜單已出爐 京東攜手11.11驚喜大使劉宇寧陪你逛3C數碼AI發電日Fender攜2025新品亮相上海國際樂器展 多元活動深度聯結本土音樂生態openvela首屆全球開發者大會圓滿落幕,NuttX創始人Greg親臨現場10月24日程序員節 京東11.11時尚辦公文具爆款直降 低至五折宇樹發布H2,優必選斬單,人形機器人走向實用主義長城汽車:2025 年第三季度營收 612.47 億元,同比增長 20.51%北汽藍谷:2025 年第三季度營收 58.67 億元,同比下降 3.45%九號公司:2025 年第三季度凈利潤 5.46 億元,同比增長 45.86%廣汽集團:2025 年第三季度營收 241.06 億元,同比下降 14.62%福特暫停F-150 Lightning生產,優先保障燃油混動車型OPPO與螞蟻集團簽署戰略合作:10月底推出“支付寶碰一下發紅包”功能秋冬室內空氣擔憂多?TCL小藍翼C7新風空調柜機保障室內呼吸健康TP-Link 聯洲推出入門級 Wi-Fi 7 電競無線路由器 GE400,雙頻 BE6500FM Agent登頂OpenAI MLE-Bench,由百度智能云研發星塵智能升級平臺亮相機器人頂會IROS 技術與商業化雙線突破解碼IROS 2025:中國機器人產業正在形成的六大確定性趨勢
  • 首頁 > 云計算頻道 > 大模型

    32專家MoE大模型免費商用!性能全面對標Llama3,單token推理消耗僅 5.28%

    2024年05月30日 15:46:53 來源:量子位公眾號

      每個 token 只需要 5.28% 的算力,精度就能全面對標 Llama 3。

      開源大模型,再添一位重量級選手——

      來自浪潮信息的 32 專家 MoE 模型,源 2.0-M32。

      那么,這到底是怎樣的一款模型?

      1/19 算力消耗,性能對標 Llama 3

      首先了解一下模型的基本信息,源 2.0-M32 模型采用 MoE 架構,專家數量為 32,總參數量 40B,激活專家數為 2,激活參數量 3.7B。

      精度上,源 2.0-M32 在多個測評數據集上全面對標 Llama3(70B,以下同),在 MATH(數學競賽)和 ARC-C(科學推理)榜單還上超越了 Llama3。

      舉個例子,在求解一道中文數學題目時,源 2.0-M32 能夠用中文進行完整、準確作答,而 Llama3 雖然能理解中文題目,但回答時還是用了英文。

      而且看一下 Llama3 的答案,雖然前面的過程也沒什么問題,但最終得到的結果錯得離譜,硬生生把一堆整數的和算出了小數點。

      在實現與業界領先開源大模型性能相當的同時,在模型的訓練、推理和微調過程中,源 2.0-M32 的資源消耗也都顯著更低。

      在訓練階段,使用 2 萬億 token 對源 2.0-M32 進行預訓練,計算量只有同參數規模稠密模型的 9.25%。

      在推理階段,在達到相當精度的條件下,源 2.0-M32 平均每個 token 消耗的算力為 7.4GFLOPS,Llama3 則需要 140GFLOPS,前者的消耗僅為后者的 1/19,即 5.28%。

      換言之,源 2.0-M32 每 Token 算力下的平均精度是 Llama3 的18.8 倍,擁有更高的模算效率

      微調上,使用 1 萬條平均長度為 1024 token 的數據進行微調,Llama3-70B 消耗為 0.05PD(PetaFLOPs/s-Day),源 2.0-M32 只用 0.0026PD,僅為 Llama3 的 5.2%。

      當然不得不說的是,雖然源 2.0-M32 的微調消耗已經降低到了 Llama3 的 5.2%,但微調本身對于一些用戶來說就是無法負擔的成本。

      而得益于源 2.0-M32 強大的少樣本學習能力,讓用戶即使沒有條件進行微調,也能快速構建大模型應用。

      以代碼生成為例,僅需很少量的樣本引導,源 2.0-M32 在 HumanEval 上獲得的精度就能從 74.4 提升到 78.1,增幅達到了 4.97%。

      浪潮信息提供了預訓練、微調和推理服務腳本,開發人員可以高效完成部署。

      模型部署可端可云,可以在自有的云服務上部署,也可以在浪潮信息推出的企業大模型開發平臺EPAI中快速構建,還可以通過浪潮信息開源的本地大模型對話工具YuanChat,在 PC 端完成快速部署。

      而且源 2.0-M32 模型激活參數量僅 3.7B,算力需求只有 2B 模型(單專家)的 1 點多倍,用筆記本就能帶動

      總之,浪潮信息始終追求更高效的智能涌現——本次發布 " 源 2.0-M32" 大模型,就是希望資源有限的條件下,實現能耗更低、推理和訓練效果更優的大模型開發。

      那么,浪潮信息是如何實現用更少的算力開銷,對標行業領先模型的呢?

      算法、算力、數據的全面創新

      自浪潮信息涉足 AI 領域以來,一直將" 算法、算力、數據 "視為 AI 應用的 " 三駕馬車 "。

      實際上,整個 " 源 " 系列大模型的研發過程亦是如此,所有的相關研究,都是圍繞著這三個維度展開的。

      在算法上,源 2.0-M32 選擇了 MoE 架構,解決了稠密模型訓練成本過高、數據和算力不足的問題。

      從 Llama1(65B)、Llama2(70B)到 Llama3(70B)的迭代過程可以看出,三代模型的參數量接近,但隨著訓練 Token 數從 1.4T 增加到了 15T,模型表現也隨之顯著提升。

      數據來自 Llama1 與 Llama2 的論文

      大模型的擴展率揭示出:增大模型的參數量與增大訓練的 token 數對模型能力提升的作用類似,如果按照 Llama3 的訓練數據量(15T tokens)外推,500B 參數的模型若想充分的訓練,所需的高質量文本 token 數高達 107T,已經遠遠超過了當前業界已知的數據量。

      退一步講,即使真的有這么多數據,訓練過程所需的算力投入同樣無法承受。

      按照計算,如果用 107T 訓練 token 訓一個 500B 參數規模的 Dense 模型,需要的算力是 321000Z(10^21)Flops。

      即使在 2 萬顆加速卡的集群上,訓練效率按 40% 來算(實際還不一定能達到),也需要耗時 464 天,單是電費就要花費約 3 億元。

      相比之下,MoE 模型的一個顯著優勢就是,能夠在遠少于稠密模型所需的計算資源下,進行有效的預訓練。

      同時,源 2.0-M32 沒有采用 Mixtral 等 MoE 模型中更常見的 8 專家結構,而是將專家數量設定為了 32,運行時只激活兩個專家。

      這一參數的選擇,是研發團隊進行了大量的實驗調優之后確定的。

      浪潮信息人工智能首席科學家吳韶華介紹說,模算效率是浪潮信息設計自己的大模型時的核心出發點,在提升模型能力的同時,盡可能降低算力開銷。

      業界中像 Mixtral 這樣的模型,獲得更高精度的方式是固定專家數量,增加單個專家的參數量,但源 2.0-M32 則反其道而行之。

      吳韶華介紹,在研發團隊的實驗中,隨著專家數量從 8 個專家增加到 32 個專家,在模型精度上取得了非常不錯的回報。

      但即使總的專家數量增加到了 32 個,激活的專家依然只有兩個。在這種情況下,激活參數量不變,算力開銷不變。

      至于源 2.0-M32 中的單個專家,則是選用了源 2.0-2B 模型,這樣做的考量是控制單個專家的參數量不至于過大,以便在企業場景應用中可以有更好的模算效率。

      除了在專家數量的設置上另辟蹊徑,團隊也對源 2.0-M32 的門控網絡進行了全新設計,采用了獨創的Attention Router 門控網絡,相比傳統的門控網絡獲得了精度提升。

      當前流行的 MoE 結構大都采用簡單的調度策略,其本質是對 token 與代表每個專家的特征向量求點積,隨后挑選點積結果最大的幾個專家。

      這種方式只考慮了 token 和專家的關系,卻忽略了專家與專家之間的相關性,但實際過程中往往需要多個專家協同參與計算,如果忽視專家之間相關性,無疑會降低模型的精度。

      而源 2.0-M32 大模型中的 Attention Router,就創造了一種專家間協同性的度量方法,解決了傳統的門控機制中專家關聯性缺失的問題。

      具體來說,對于每一個專家,研發團隊都構建了 3 個向量,并利用類似 Attention 的機制來構建專家之間的關系。最終選擇的專家不僅與 Token 匹配度高,兩個專家的協同效果也更好。

      此外,源 2.0-M32 也沿用了源 2.0 系列中首創的局部注意力過濾增強(LFA)機制,和經典的 Llama 結構相比,模型在幾百億 token 數據的訓練之后,在 100 億 token 的測試集上做測試,會有 3.5% 的精度提升。

      在數據層面,源 2.0-M32 一共使用2 萬億 token進行訓練,相比之前的 2.0 版本大幅提升。

      整個訓練過程也非常穩定,沒有出現數值不穩定或異常的中斷的情況,最終訓練損失為 1.22。

      數據類型上看,源 2.0-M32 這個模型的 2 萬億 token 中,差不多有一半的數據都是代碼,包含中文代碼和英文代碼。

      同時,團隊也引入了互聯網數據和各類學科數據等類型,來補充數據的多樣性。

      另外,研發團隊還通過源 2.0 合成數據的工具,獲得并增加了超過 1000 萬條的合成數據,重點是針對于數學和中文代碼。

      因為互聯網上中文數學的語料實在太少,研發團隊曾經清洗了 10PB 左右的互聯網數據,但實際只得到了幾十 GB 的中文數學數據。

      所以,這片空白需要通過數據合成來進行填補,這也是研發團隊持續做的工作。

      在算力層面,源 2.0-M32 延續了源 2.0 提出的分布式訓練方法,綜合運用流水線并行 + 數據并行的策略,顯著降低了大模型對芯片間 P2P 帶寬的需求,為硬件差異較大訓練環境提供了一種高性能的訓練方法。

      針對 MoE 模型的稀疏專家計算,采用合并矩陣乘法的方法,模算效率得到大幅提升。

      將開源進行到底

      了解了模型背后的技術細節,浪潮信息又為什么能夠打造出如此高效的大模型技術和產品呢?

      主觀上,浪潮信息始終堅持在算法、架構等層面進行創新,對于這樣做的原因,吳韶華這樣介紹:

      如果想提升大模型的能力,沿用當前的結構當然是一個比較好的路徑。

      但我們始終堅持:要從算法層面和模型架構層面做探索、創新,這樣才能更快速的實現模型能力的提升。

      客觀上,也至少包括以下三點原因。

      一是從 AI 時代開始之前,浪潮信息就是專業的算力供應商,在算力側擁有大量的生態伙伴,對不同類型算力特點有深入的研究,能夠更高效地對算力進行利用。

      實際上,自從 2021 年的源 1.0 開始,浪潮信息的一系列模型就都實現了比業界更高的訓練效率。

      同時期的 GPT-3,算力的利用效率只有 21.3%,而源 1.0 效率則達到了 44.8%,達到了業界領先水平。

      二是在浪潮信息內部,也有非常多的場景和團隊,包括客服、軟件研發、生產制造、運維等等,都有很多實際的應用案例,或者實際需要模型去做規;D型的場景。

      這些場景為源大模型的使用、迭代提供了天然的試驗場,同時從中能夠積累更多的經驗、更多的能力,從而滿足更多的需求。

      三是始終堅持開源開放,同樣對模型能力的進化非常有幫助。

      源系列模型的開源從 1.0 版本就已開始,從源 1.0 到源 2.0 再到今天的源 2.0-M32,始終在堅持做開源,也已賦能了很多開發者。

      這些開發者基于源 1.0 做了很有趣的應用探索,給了浪潮信息很好的反饋,指明了在模型能力上和開發者實際的應用需求上,到底應該關注在哪些層面。

      吳韶華表示,從源 1.0 開源至今,浪潮信息一直在開源活動中持續受益,后續也會很堅定的繼續開源。

      總之,從創新研發到開源開放,浪潮信息將堅持致力于研發基礎大模型,為企業用戶降低大模型使用門檻,加速推進產業智能化升級。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    8x国产一区二区三区精品推荐| 97超级在线观看免费高清完整版电视剧| 丁香婷婷久久| 激情丁香综合五月| 欧美高清视频在线高清观看mv色露露十八| 免费欧美在线| 肉肉视频在线观看| 日韩和欧美的一区二区| 日本韩国在线不卡| 欧美精品在线观看一区二区| 成人黄色毛片| 欧美成人亚洲成人| 视频一区免费观看| 免播放器亚洲| 999国产精品永久免费视频app| 久久综合久久99| 91精品国产高清久久久久久| 性做久久久久久免费观看| 亚洲欧美另类久久久精品2019| 性做久久久久久| 一区二区三欧美| 懂色av一区二区三区在线播放| 国产精品原创| 91女主播在线观看| 西野翔中文久久精品国产| 自拍偷拍欧美精品| 欧美wwwsss9999| 肉色欧美久久久久久久免费看| 久久久午夜电影| 国产三级精品三级在线观看国产| 亚洲动漫第一页| 亚洲午夜一级| 成人免费av资源| 亚洲丁香婷深爱综合| 136福利精品导航| 免费毛片在线不卡| 欧美黑人xxxxx| 在线观看av不卡| 欧美成人sm免费视频| 精品在线小视频| 高清欧美性猛交xxxx黑人猛交| 国产精品久久久久久久久免费桃花| 亚洲最大在线视频| 激情欧美一区二区三区| 日韩视频免费在线观看| 亚洲少妇自拍| 一区二区亚洲精品| 中文字幕一区二区三区视频| 免费精品一区二区三区在线观看| 久久久综合激的五月天| 色综合欧美在线| 五月国产精品| 色女人在线视频| 国产精品av一区二区| 亚洲www在线观看| 精品中文字幕一区二区三区四区| 色哟哟国产精品免费观看| 国产欧美精品| 奇米亚洲午夜久久精品| 成人精品免费看| 亚洲区一区二区| 国产精品第十页| 欧美激情一区二区三区在线| 在线中文字幕日韩| 久久―日本道色综合久久| 福利电影一区二区| 国产精品日日摸夜夜添夜夜av| 亚洲日本护士毛茸茸| 久久大胆人体| a级日韩大片| 一本色道久久综合亚洲精品不卡| 亚洲黄色免费| 国产一区二区剧情av在线| 国产一区二三区| 久久精品99久久久香蕉| 国产在线观看免费一区| 国产精品国模在线| av电影在线观看不卡| 99r精品视频| 国产精品一区在线播放| 天然素人一区二区视频| 欧美色videos| 黄色网页在线观看| 国产麻豆一区二区三区在线观看| 性亚洲最疯狂xxxx高清| 欧美人与动xxxxz0oz| 五月天亚洲综合| 久久久久久久久丰满| 天天综合国产| 成人午夜精品| 国产精品1区| 老司机亚洲精品| 大桥未久在线视频| 亚洲综合中文字幕在线观看| 欧美日韩精品中文字幕一区二区| 日韩欧美一区二区三区| 超碰99在线| 国产一区二区区别| 亚洲高清视频的网址| 久久国产精品免费一区二区三区| 伊人精品综合| 国产高清视频一区| 日韩欧美一区免费| 嗯啊主人调教在线播放视频| 欧美激情一区二区三区成人| 久久精品九九| 欧美日韩午夜电影网| 亚洲午夜国产成人av电影男同| 国产精品欧美久久久| 激情成人亚洲| 亚洲欧美日韩一区二区三区在线| 99亚洲乱人伦aⅴ精品| 国产精品你懂的| 欧美视频专区一二在线观看| 福利微拍一区二区| 91高清在线| 精品一区二区三区四区| 日韩欧美二区三区| 亚洲另类一区二区| 精品国产乱码久久久久久蜜柚| 国产精品中文字幕久久久| 国产成人一区二区三区小说| 亚洲国产精品一区二区三区| 欧美激情电影| 国产精品99久久久久久董美香| 久久精品午夜一区二区福利| 国产精品久久777777毛茸茸| 亚洲精品午夜精品| 国产精国产精品| 久久久久久久久丰满| 亚洲电影av在线| 丝袜中文在线| 91传媒免费看| 免费精品国产的网站免费观看| 国产亚洲欧洲高清| 精品免费二区三区三区高中清不卡| 欧美一区二区三区免费视频| 自拍偷拍欧美视频| 日韩精品视频三区| 精品一二三四区| 国产精欧美一区二区三区| 欧美精品videos| 日韩成人精品在线观看| 久久五月天婷婷| 免费成人高清视频| 欧美中文字幕视频在线观看| 亚洲mv大片欧洲mv大片| 久久久精品欧美丰满| 欧美精品福利| 狠狠躁少妇一区二区三区| 欧美精品一区在线观看| 亚洲1234区| 欧美日韩在线精品一区二区三区| 亚洲mv大片欧洲mv大片精品| 色综合久久88色综合天天免费| 老牛影视免费一区二区| 国产在线观看a视频| 夜鲁夜鲁夜鲁视频在线播放| 亚洲国产不卡| 97超碰在线公开在线看免费| 99久久99久久精品免费观看| 亚洲一区电影| 一区二区三区在线电影| 91免费视频观看|