国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

解鎖2026世界杯觀賽“新姿勢”,聯想AI平板攜天禧AI 3.5打造掌上沉浸主場聯想motoX70Air云上舞白冰鉆限定版AI手機即將上市 自帶14顆手工精鑲冰鉆 超奢華只有紅魔還在做24+1TB 姜超:成本暴增 友商一臺都沒有英特爾®至強® D處理器:賦能智能網卡,破解算力-網絡協同瓶頸豐田全新超跑GR GT發布:配641馬力大V8商家仿冒心系天下W26 老機當新機賣!中國電信回應告別“人海戰術”!陳天橋:未來公司值多少錢,不看人數看“認知”“卷”不動了?讓AI銷售團隊替你卷!百度商家智能體升級片來了卡薩帝冰箱亮相廣州設計周亞馬遜云科技推出Amazon Graviton5----迄今性能最強、能效最高的自研CPU第八屆“綻放杯”圓滿落幕,華為助力千行百業5G應用“全面綻放”機構:2025年第三季度中國PC市場同比增長2%火山引擎發布豆包語音識別模型2.0提升多語種識別精度現代汽車推出 AI 驅動的 MobED 機器人,2026年上市Vidu發布 Q2“生圖全家桶”:4K 生圖 + 圖像編輯 + 圖轉視頻,全都免費用中國新勢力首家!理想汽車累計交付突破150萬輛瑞典Oceanbird Wing 560翼帆開放訂購,2026量產在即,加速布局中國市場賦能綠色航運億邦智庫第七次《產業互聯網發展報告》重磅發布一加Ace 6T首銷10分鐘賣爆!打破今年同檔機型全天銷售紀錄魯大師11月電動兩輪車榜:潮玩思路重塑市場,九號領跑智能化
  • 首頁 > 云計算頻道 > 大模型

    大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

    2023年09月18日 14:30:55 來源:微信公眾號量子位

      本文來自于微信公眾號 量子位 (ID:QbitAI),作者:蕭蕭 。

      只需給大模型“加點小零件”,推理速度立刻提升2倍!

      不需要額外訓練一個模型,也不需要對計算硬件做優化,單張A100最快幾小時就能微調完成。

      這項新研究名叫Medusa(美杜莎),來自普林斯頓、UIUC、CMU和康涅狄格大學,FlashAttention作者Tri Dao也在其中。

      目前,它已經成功部署到伯克利70億參數的“駱馬”Vicuna中,后續還會支持其他大模型,已經登上GitHub熱榜:

      但其實,在這種方法推出之前,業界并非沒有大模型推理加速方法,主流的就是DeepMind推出的投機采樣(speculative decoding)。

      相比這種方法,Medusa有什么不一樣的地方?投機采樣的2個“bug”

      要想加速大模型推理,需要先知道究竟是什么“限制”了它的速度。

      相比計算量的增加,大模型推理速度更容易受到內存帶寬的影響(memory bound)。

      這是因為,大模型由于參數量巨大、遠超緩存容量,因此推理時需要先把權重從外部內存(顯存)讀取一次到緩存中,這個過程受內存帶寬限制,速度通常很慢。

      因此,模型做批量推理(batch inference)時,一次處理100個tokens和一個tokens時間上區別不大。

      基于這個特點,DeepMind去年11月想出了一個名叫投機采樣的神奇操作——

      訓練一個更小的模型(draft模型),給大模型提前生成一批“候選詞”,相比于讓大模型自己“思考”生成,直接做“選擇”就好。

    圖片

      由于小模型生成速度比大模型快好幾倍,一旦大模型覺得小模型已有的詞“可用”,就直接拿來,不用自己再緩慢生成一遍。

      這個過程,有點像是輸入法的聯想詞候選,在我們(大模型)想好下一個詞用什么之前,輸入法(小模型)先給列出一些備選項:

      要是看到覺得不錯,就從中選一個用;要是覺得生成的都不行,就pass掉自己重新打。

      這種投機采樣方法確實取得了顯著成效,甚至能輕輕松松在M2Ultra上以高精度跑340億參數LLaMA大模型。

      BUT,這種方法存在兩個問題。

      一方面,給大模型找個生成“候選詞”的draft小模型,沒那么容易。

      這個小模型可不是隨便抓個生成模型就能用,除了接口統一、概率分布接近等要求,生成質量也不能比大模型差太多。

      對于Meta發布的LLaMA這種模型可能還好,既有幾百億參數的大模型版本,又有幾十億參數的小模型版本,可以把參數量更小的版本拿來當draft模型使用。

      但對于其他開源大模型,這種方法就不太適用了,自己去搭建訓練一個小模型,不僅時間成本更高,生成效果可能還不達預期。

      另一方面,雙模型的組合,使得后續要想做系統調優變得更復雜。

      這是因為,相比于大模型自身是一個系統,新增加的draft模型相當于又引入了一個系統。

      這樣會導致模型部署起來更復雜,包括額外的網絡傳輸、不同的硬件條件都需要考慮到,在做計算優化時難度也會進一步提升。

      為了解決這些問題,Medusa出現了。 不用小模型,加幾個“頭”就行

      Medusa(美杜莎,一種長有多個頭的妖怪)是一種新的大模型推理加速方法。

      相比投機采樣,它選擇直接給Transformer大模型多加幾個解碼頭(decoding heads),每個頭都是一個單層前饋網絡。

      這幾個多出來的解碼頭,可以讓大模型直接一次多生成幾個詞,而不是“擠牙膏式”一個一個生成。

      生成準確率也還可以,在預測“下一個詞的下一個詞”時,Medusa準確率達到了60%,還在不斷優化中。

      隨后,結合樹狀注意力機制(tree-based attention mechanism)并行驗證這些詞,從而實現推理加速。

      基于Medusa,Vicuna的70億、130億和330億參數大模型推理速度,均有了1.9倍以上的效率提升:

      針對70億參數的模型,研究者們還在不同任務上測試了一下加速效果,顯示最高在代碼生成上有2.15倍的速度提升。

      最關鍵的是,用上Medusa后,并不需要將整個大模型重新訓練一遍。

      相比之下,它可以和大模型一起訓練,只需要凍結大模型的參數就行,甚至單個GPU就能搞定。

      由于不增加額外的模型,對于分布式推理也很友好。 作者介紹

      這項研究有兩位共同一作。

      共同一作蔡天樂,普林斯頓大學博士生,研究方向包括優化、表示學習、架構設計等,本科畢業于北京大學數學科學學院,獲得應用數學和計算機科學雙學位。

      共同一作Yuhong(Jesse)Li,伊利諾伊大學香檳分校(UIUC)博士生,研究方向是高效機器學習,本科畢業于北京郵電大學。

      此外,這項研究也有FlashAttention作者、斯坦福博士Tri Dao的參與。

      FlashAttention是一種能加快注意力并減少內存占用的方法,相比PyTorch標準注意力實現,最高能提速9倍。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    2023国产一二三区日本精品2022| 97精品国产97久久久久久春色| 嫩草一区二区三区| 亚洲福利视频专区| 亚洲国产综合自拍| 国产精品一区二区av交换| 欧美激情视频一区二区三区免费| 欧美精品丝袜久久久中文字幕| 国产一区二区三区在线观看网站| 图片区日韩欧美亚洲| 日韩欧美成人免费视频| 亚洲精品成a人ⅴ香蕉片| 91视频免费进入| 高端美女服务在线视频播放| 午夜欧美大尺度福利影院在线看| 日韩免费在线视频| ...xxx性欧美| 国产精品美女久久久浪潮软件| 久久九九免费视频| 在线观看一区视频| 欧美高清性xxxxhd| 奇米色一区二区三区四区| 久cao在线| 欧美中文字幕一区二区三区亚洲| 97精品国产97久久久久久久久久久久| 欧美尤物美女在线| 中文字幕一区二区三区在线观看| 刘亦菲一区二区三区免费看| 成人好色电影| 亚洲桃色在线一区| 国产精品国产三级国产aⅴ无密码| 国产精品亚洲不卡a| 日本欧美精品在线| 成人在线免费观看视频| 日韩在线你懂得| 欧美性色aⅴ视频一区日韩精品| 999国内精品视频在线| 国a精品视频大全| 国产乱理伦片在线观看夜一区| 成人另类视频| 午夜精品一区二区三区在线观看| 精品一区二区三区在线观看| 日av在线播放中文不卡| 日韩黄色在线观看| 日本不卡免费高清视频在线| 成人精品电影在线观看| 51av在线| 国产精品欧美久久| 国产精品三区四区| 很黄很黄激情成人| 精品国产伦一区二区三区观看方式| 国产精品免费精品自在线观看| 国产精品亚洲一区二区三区在线观看| 国产日本欧美一区| 亚洲最新在线观看| 久久久久久久久国产一区| 国产成人l区| 国产乱码精品一区二区三区四区| 国产精品久久不能| 国产综合成人久久大片91| 亚洲欧美tv| 亚洲美女视频网站| 久久久久国产精品麻豆| 亚洲欧美久久234| 九色综合日本| 26uuu久久综合| 欧美日韩电影在线播放| 国模精品视频一区二区| 国产农村妇女毛片精品久久莱园子| 中国人与牲禽动交精品| 青青草国产精品97视觉盛宴| 国产成人精品日本亚洲| 欧美一级在线播放| 国产精品丝袜久久久久久高清| 91av在线影院| 这里只有精品在线观看| 日韩欧美国产电影| 人禽交欧美网站| 日韩av电影免费观看高清完整版| 亚洲欧洲另类| 亚洲视频自拍偷拍| 欧美又粗又大又爽| 国产真实精品久久二三区| 91看片在线观看| 一区二区三区丝袜| 久久激情婷婷| 国产精品久久久久aaaa| 久久噜噜噜精品国产亚洲综合| 日韩精品一区二区三区第95| 成人片在线免费看| 日本一区不卡| 久久99这里只有精品| 国产在线观看精品一区二区三区| 久久一区中文字幕| 亚洲图片你懂的| 综合久久婷婷| 久久久久久久久久久久久久一区| 精品国产一区二区三区成人影院| 在线电影av不卡网址| 日本黄网免费一区二区精品| 99久久婷婷国产综合精品青牛牛| 91成人国产在线观看| 国产精品白丝jk喷水视频一区| 色综合电影网| 亚洲午夜激情在线| 国产麻豆日韩| 最新亚洲国产| 国产91精品精华液一区二区三区| 亚洲一区电影777| 久久精品亚洲一区二区三区浴池| 中文字幕在线不卡一区| 久久久www免费人成黑人精品| 麻豆九一精品爱看视频在线观看免费| 91探花福利精品国产自产在线| 免费日韩一区二区三区| 97精品国产91久久久久久| 精品欧美一区二区久久久伦| 午夜成人在线视频| 国产精自产拍久久久久久蜜| 久久久一二三| 国产在线激情视频| 香蕉久久夜色| 国产福利视频一区二区三区| 国产精品一香蕉国产线看观看| 美女毛片一区二区三区四区最新中文字幕亚洲| 国产 日韩 欧美 综合 一区| 久久激情电影| 久热在线中文字幕色999舞| 日韩精品2区| 国产精品中出一区二区三区| 国产精品美女在线观看直播| 在线激情影院一区| 一区二区三区在线播放| 牛牛视频精品一区二区不卡| 香蕉视频在线看| 在线视频日韩精品| 欧美亚洲在线视频| 日本一区中文字幕| 99视频在线精品| 成人一级视频| 国产精品久久久久久亚洲调教| 精品国产亚洲一区二区三区在线| 亚洲免费视频观看| 蜜臀av性久久久久蜜臀aⅴ流畅| 91免费小视频| 怡红院av一区二区三区| 国产精品系列在线观看| 成人中文字幕电影| 国产原创一区| 九九热线有精品视频99| 欧美一区在线直播| 欧美三级自拍| 成人免费观看男女羞羞视频| 成人亚洲激情网| 欧美极品日韩| 欧美一区二区三区视频免费播放| 久久午夜av| 久久精品久久精品| 国产精品国产精品国产专区蜜臀ah| 中文字幕成人在线| 亚洲成人av| 亚洲综合色成人| 欧美野外wwwxxx| 538国产精品视频一区二区|