国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 云計算頻道 > 大模型

    OpenAI科學家盛贊中國大模型:算法非常強,算力用到極致!

    2024年12月30日 09:21:30 來源:AIGC開放社區公眾號

      OpenAI創始團隊成員、高級研究科學家Andrej Karpathy很罕見地,分享了一個來自中國的開源大模型——DeepSeek-v3。

      Karpathy表示,DeepSeek僅用了280萬小時的GPU算力,就訓練出了比Llama-3405B(使用3080萬小時GPU)更強的前沿模型,整體成本節省了11倍左右,將算力發揮到了極致。

      這為小模型和受算力限制的組織打開了全新世界——即便在算力有限的情況下,使用高質量數據、更好的算法同樣能訓練出高性能大模型。

      此外, DeepSeek在MMLU、DROP、Codeforces、AIME等多個主流基準測試中,性能大幅度超過了GPT-4o、Claude-3.5-Sonnet、Qwen2.5-72B等著名開閉源模型,成為目前最強開源大模型之一。

      國外網友表示,看來限制對中國的芯片供應并沒有扼殺他們的進步,反而促進了技術創新。有趣的是,資源限制不僅僅是障礙,它們還能強有力地推動創造力。

      看了這個網友評論還是挺心酸的,國內被限制AI芯片,無法獲得更高的算力,我們靠著智慧、創新精神依然沖破封鎖——天行健 君子以自強不息!

      中國人得到“檸檬”后,會榨干它的每一滴汁,然后做出美味的檸檬水。希望美國那些資源受限的實驗室也能取得同樣的成就。

      中國即將成為超級人工智能大國。

      這個模型很出色,但實現這一成就的團隊更優秀,人類的創造力真是無窮無盡。

      DeepSeek為彌補較小模型限制,進行的改進是否也可以應用于更大的模型?我們能否期待在使用10萬個 GPU 的集群時也獲得類似11倍的能力提升?

      很想嘗試DeepSeek的API,但是從今早開始一直失敗的。

      非常喜歡開源模型,他們迫使西方世界不得不降低價格。

      Deepseek的團隊是一群超有才華的前量化分析師。量化分析師以榨取每一點性能提升而聞名。他們又一次成功了,只是這次是在不同的領域。高智商的人真是世界的福音。

      他們的訓練效率非常瘋狂。

      使用的訓練數據與 Llama3405B 大致相同,約為15萬億。但在相同的訓練數據下,算力卻減少了10倍。

      哇塞,終于有人破解了訓練效率難題。當其他人都在用數十億美元計算他們的AI預算時,DeepSeek僅用他們的零頭就能開發出前沿大模型?磥,僅僅投入更多的GPU并不總是解決問題的辦法。

      這位老哥直接上圖片,DeepSeek直接打跑OpenAI、Meta~

      Deep Seek v3模型簡單介紹

      Deep Seek V3的架構延續了第二代的高效推理和低成本訓練策略,主要包括多頭潛在注意力(MLA)和混合專家(MoE)兩大塊。

      MLA是V3的核心創新之一,主要用于減少推理過程中的內存占用。MLA將鍵和值壓縮為一個潛在向量,并在推理過程中僅緩存該向量,而不是完整的鍵和值矩陣。

      MLA的壓縮過程通過下投影矩陣和上投影矩陣實現。下投影矩陣將輸入向量壓縮為潛在向量,上投影矩陣將潛在向量還原為鍵和值。通過這種方式,MLA在推理過程中僅需緩存潛在向量和分離的鍵,從而顯著減少了內存占用。

      MLA還對查詢進行了低秩壓縮,進一步減少了訓練過程中的激活內存。所以,MLA是V3極大降低算力的主要原因之一。

      傳統的MoE架構,面對大規模的數據處理任務時,容易出現專家負載不均衡的情況。這種不均衡會導致嚴重的后果,其中最為突出的就是路由崩潰問題。當某些專家承擔了過多的負載,而其他專家則相對空閑時,路由機制可能會因為無法有效分配任務而陷入混亂,進而導致模型無法正常工作。

      由于專家負載的不平衡,計算資源無法得到合理分配,使得整體計算過程變得緩慢且低效。在處理復雜的語言任務時,需要大量的算力來支持模型的推理和決策過程。

      而V3對MoE進行了改良,引入了一套先進的動態調整機制,專門用于優化專家負載。在訓練過程中,使得MoE會實時監測每個專家的負載情況,通過一系列復雜而精確的算法,根據實際負載動態地調整任務分配。這種動態調整并非簡單的平均分配,而是根據專家的實時處理能力和當前任務的特點進行智能分配。

      例如,當某個專家的負載過高時,模型會自動將一部分任務轉移到負載較輕的專家上,確保每個專家都能在合理的負載范圍內工作。

      此外,V3的MoE 還使用了特殊的方法,會為每個專家設置一個動態的負載閾值,當負載超過該閾值時,觸發負載調整機制。在調整過程中,模型會綜合考慮多個因素,例如,專家的歷史處理效率、當前任務的緊急程度以及整個系統的負載均衡情況等,所以,V3的 MoE 既解讀了路由崩潰的難題,還將算力發揮到了極致。

      其實寫到這里心里有一個疑問,Deep Seek要是有10萬張***,能開發出像o3那樣的超強大模型嗎?

      Deep Seek除了開源最新模型之外,他們還提供了免費的在線服務,想嘗試的小伙伴可以去體驗一下。值得一提的是,還可以使用像o1模型那樣的深度思考模式,并且會把整個推理過程全部寫出來。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    日韩免费高清在线观看| 国内精品久久久久伊人av| 精品成人久久| 国产不卡视频在线观看| 国内在线免费视频| 色妞欧美日韩在线| 成人短视频软件网站大全app| 中文字幕一区二区视频| 欧美一二三区在线观看| 蜜桃精品噜噜噜成人av| 色婷婷综合久久久中文字幕| 成人av午夜影院| 欧美成在线视频| 国产一区在线电影| 国产精品9999| 欧美一区二区啪啪| 成人精品一区二区三区电影黑人| 国产原创一区二区| 成人在线播放| 麻豆国产欧美日韩综合精品二区| 日韩一级高清毛片| 日本不卡二区高清三区| 成人性生交大片免费| www.亚洲免费| 亚洲一区二区三区视频在线播放| 久久青草久久| 制服丝袜亚洲精品中文字幕| 1区2区3区国产精品| 欧美国产日韩一区二区| 亚洲一区二区成人| 欧美性猛交xxxx富婆| 18久久久久久| 日本中文字幕不卡免费| 91精品国产色综合久久不卡电影| 欧美在线视屏| 国产精品ⅴa在线观看h| 日韩视频在线免费观看| 舔着乳尖日韩一区| 色婷婷激情一区二区三区| 国产精品成人av性教育| 国产精品久久毛片a| 91久久精品日日躁夜夜躁国产| 色狠狠久久aa北条麻妃| 国产乱子精品一区二区在线观看| 欧美午夜精品一区二区蜜桃| av网址在线播放| 亚洲性生活视频| 欧美色综合影院| 欧美久久一二区| 美女精品视频一区| 久久se这里有精品| 亚洲欧美在线综合| 国产精品普通话| 亚洲国产精品久久久男人的天堂| 精品国产一区二区三区久久影院| 色婷婷香蕉在线一区二区| 在线中文字幕播放| 日韩成人在线网站| 在线看三级电影| 欧美猛男男办公室激情| 一区二区三区在线免费看| 日韩av三区| 欧美日韩性生活视频| 国产日韩三级| 国产免费一区二区三区在线观看| 日韩av观看网址| 麻豆一区在线| 亚洲老妇xxxxxx| 精品国产一区二| 久久国产精品久久久久久| 欧美亚洲图片小说| 91精品啪在线观看国产81旧版| 久久九九免费视频| 国产激情一区二区三区| 亚洲人体视频| 日本久久二区| 中文字幕免费观看一区| 草莓视频丝瓜在线观看丝瓜18| 色88888久久久久久影院| 蜜桃视频在线观看一区二区| 国产激情视频一区二区三区欧美| 欧美男人天堂| 成人精品国产一区二区4080| 日韩欧中文字幕| 欧美人在线观看| 高清shemale亚洲人妖| 欧美色网一区| 久草这里只有精品视频| 精品国产乱码久久久久久久| 日韩一区二区视频| 欧美专区中文字幕| 国产欧美精品va在线观看| 欧美美女喷水视频| 久久九九热re6这里有精品| 欧美大成色www永久网站婷| 久久99国产精品视频| 色综合久综合久久综合久鬼88| www.欧美精品一二三区| 国产精品自拍在线| 日韩国产欧美在线视频| 免费视频最近日韩| 久久久久久毛片免费看| 日韩一级在线| 一本到高清视频免费精品| 日本成人激情视频| 姬川优奈av一区二区在线电影| 加勒比久久高清| 波多野结衣在线aⅴ中文字幕不卡| 精品无人区麻豆乱码久久久| 日韩一区二区三区观看| 中文日韩欧美| 视频在线观看99| 欧美老少做受xxxx高潮| 亚洲人成网在线播放| 不卡一区在线观看| 精品一区精品二区| 成人欧美一区二区| 高潮白浆女日韩av免费看| 欧美一区二区三区啪啪| 久久久久久国产精品一区| 国产日韩精品一区二区浪潮av| av在线播放不卡| 大胆人体一区| 欧美videos大乳护士334| 亚洲国产欧美在线| 狠狠狠色丁香婷婷综合久久五月| 久久久久久国产精品美女| 五月天中文字幕一区二区| 天堂√8在线中文| 91网址在线观看| 中老年在线免费视频| 久久国产免费看| 黄色成人av在线| 国产成人综合网| 奇米精品一区二区三区在线观看一| 欧美私人啪啪vps| 亚洲精品a区| 欧美国产日韩电影| 欧美日韩三级| 精品国产91亚洲一区二区三区婷婷| 国模吧一区二区三区| 伊人222成人综合网| 激情综合色综合久久| 日韩人体视频一二区| 久久99国产精品久久| 欧美极度另类性三渗透| 亚洲久色影视| 精品一区二区三区亚洲| 国产日韩欧美精品| 国产精品99| 欧美三级视频| 精品影院一区二区久久久| av电影在线观看一区二区三区| 国产精品美女www| 6080亚洲理论片在线观看| 欧美日韩一区免费| 国内精品久久久久久久果冻传媒| 国产精品污网站| 另类小说欧美激情| 一本色道久久综合亚洲91| 日韩毛片一区| 欧美aⅴ99久久黑人专区| 国产精品视频xxx| 欧美人体视频xxxxx|