国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

卓世科技榮膺甲子光年“2025中國AI Agent領域最具商業潛力榜”全球核心路由器市場需求強勁復蘇 Q3增幅高達68%從 Galaxy Z TriFold 看三星如何用“減法”設計重構大屏體驗聲網對話式 AI 引擎2.0 讓 AI 更懂開口時機 支持預注冊聲紋識別與電話外呼全系皆四驅 領克10 EM-P新增千里浩瀚H5版型:16.58萬起奇瑞墨甲交付第1000只機器狗 將投入家庭陪伴、廠區看護索尼ZV-E10M2相機升值!官方解鎖4K 120p、FHD 240p智繪金融,網行天下 2025華為金融網絡創新峰會成功舉辦徠芬入局洗地機,還能再創“增長神話”嗎?激增141%,預計2025年全球Mini LED電視出貨將突破1300萬臺聯影智能交出答卷AI醫療行業迎來爆發期城市數據基礎設施建設圓桌:打破數據孤島,釋放數據價值阿爾卑斯攜慧湃一體化解決方案亮相第21屆產品創新數字化國際峰會IAR云就緒平臺擴展對瑞薩RH850/U2x的支持,賦能新一代汽車電子開發西門子和nVent將發布專為英偉達 AI智算中心構建的聯合參考架構全球新能源車型銷量TOP20中中國占17席 小米SU7第八理想高管:從理想ONE之后我們再也不玩三缸機了 代價太大一句話完成支付!支付寶“智能眼鏡AI付”上線Rokid開發平臺小鵬汽車2026年產品規劃大揭秘:將推出10余款車型飛豬《2025年租車自駕游報告》:租車用戶規模擴大近三成
  • 首頁 > 數據存儲頻道 > 數據.存儲頻道 > 存儲資訊

    消費級GPU成功運行1760億參數大模型

    2022年08月22日 19:30:43 來源:機器之心

      在消費級 GPU 上運行大規模模型是機器學習社區正面臨的挑戰。

      語言模型的規模一直在變大,PaLM 有 540B 參數,OPT、GPT-3 和 BLOOM 有大約 176B 參數,模型還在朝著更大的方向發展。

      這些模型很難在易于訪問的設備上運行。例如,BLOOM-176B 需要在 8 個 80GB A100 GPU(每個約 15000 美元)上運行才能完成推理任務,而微調 BLOOM-176B 則需要 72 個這樣的 GPU。PaLM 等更大的模型將需要更多的資源。

      我們需要找到方法來降低這些模型的資源需求,同時保持模型的性能。領域內已經開發了各種試圖縮小模型大小的技術,例如量化和蒸餾。

      BLOOM 是去年由 1000 多名志愿研究人員在一個名為「BigScience」的項目中創建的,該項目由人工智能初創公司 Hugging Face 利用法國政府的資金運作,今年 7 月 12 日 BLOOM 模型正式發布。

      使用 Int8 推理會大幅減少模型的內存占用,卻不會降低模型的預測性能。基于此,來自華盛頓大學、Meta AI 研究院等(原 Facebook AI Research )機構的研究員聯合 HuggingFace 開展了一項研究,試圖讓經過訓練的 BLOOM-176B 在更少的 GPU 上運行,并將所提方法完全集成到 HuggingFace Transformers 中。

      論文地址:https://arxiv.org/pdf/2208.07339.pdf

      Github 地址:https://github.com/timdettmers/bitsandbytes

      該研究為 transformer 提出了首個數十億規模的 Int8 量化過程,該過程不會影響模型的推理性能。它可以加載一個具有 16-bit 或 32-bit 權重的 175B 參數的 transformer,并將前饋和注意力投影層轉換為 8-bit。其將推理所需的內存減少了一半,同時保持了全精度性能。

      該研究將向量量化和混合精度分解的組合命名為 LLM.int8()。實驗表明,通過使用 LLM.int8(),可以在消費級 GPU 上使用多達 175B 參數的 LLM 執行推理,而不會降低性能。該方法不僅為異常值對模型性能的影響提供了新思路,還首次使在消費級 GPU 的單個服務器上使用非常大的模型成為可能,例如 OPT-175B/BLOOM。

      方法簡介

      機器學習模型的大小取決于參數的數量及其精度,通常是 float32、float16 或 bfloat16 之一。float32 (FP32) 代表標準化的 IEEE 32 位浮點表示,使用這種數據類型可以表示范圍廣泛的浮點數。FP32 為「指數」保留 8 位,為「尾數」保留 23 位,為數字的符號保留 1 位。并且,大多數硬件都支持 FP32 操作和指令。

      而 float16 (FP16) 為指數保留 5 位,為尾數保留 10 位。這使得 FP16 數字的可表示范圍遠低于 FP32,面臨溢出(試圖表示一個非常大的數字)和下溢(表示一個非常小的數字)的風險。

      出現溢出時會得到 NaN(非數字)的結果,如果像在神經網絡中那樣進行順序計算,那么很多工作都會崩潰。bfloat16 (BF16) 則能夠避免這種問題。BF16 為指數保留 8 位,為小數保留 7 位,意味著 BF16 可以保留與 FP32 相同的動態范圍。

      理想情況下,訓練和推理應該在 FP32 中完成,但它的速度比 FP16/BF16 慢,因此要使用混合精度來提高訓練速度。但在實踐中,半精度權重在推理過程中也能提供與 FP32 相似的質量。這意味著我們可以使用一半精度的權重并使用一半的 GPU 來完成相同的結果。

      但是,如果我們可以使用不同的數據類型以更少的內存存儲這些權重呢?一種稱為量化的方法已廣泛用于深度學習。

      該研究首先在實驗中用 2-byte BF16/FP16 半精度代替 4-byte FP32 精度,實現了幾乎相同的推理結果。這樣一來,模型減小了一半。但是如果進一步降低這個數字,精度會隨之降低,那推理質量就會急劇下降。

      為了彌補這一點,該研究引入 8bit 量化。這種方法使用四分之一的精度,因此只需要四分之一模型大小,但這不是通過去除另一半 bit 來實現的。

      兩種最常見的 8-bit 量化技術為 zero-point 量化和 absmax(absolute maximum)量化。這兩種方法將浮點值映射為更緊湊的 int8(1 字節)值。

      例如,在 zero-point 量化中,如果數據范圍是 -1.0——1.0,量化到 -127——127,其擴展因子為 127。在這個擴展因子下,例如值 0.3 將被擴展為 0.3*127 = 38.1。量化通常會采用四舍五入(rounding),得到了 38。如果反過來,將得到 38/127=0.2992——在這個例子中有 0.008 的量化誤差。這些看似微小的錯誤在通過模型層傳播時往往會累積和增長,并導致性能下降。

      雖然這些技術能夠量化深度學習模型,但它們通常會導致模型準確率下降。但是集成到 Hugging Face Transformers 和 Accelerate 庫中的 LLM.int8(),是第一種即使對于帶有 176B 參數的大型模型 (如 BLOOM) 也不會降低性能的技術。

      LLM.int8()算法可以這樣解釋,本質上,LLM.int8()試圖通過三個步驟來完成矩陣乘法計算:

      從輸入隱藏狀態中,按列提取異常值(即大于某個閾值的值)。

      將 FP16 中的異常值與 int8 中的非異常值進行矩陣乘法。

      在 FP16 中對非異常值進行去量化,將異常值和非異常值相加,得到完整的結果。

      這些步驟可以在下面的動畫中總結:

      最后,該研究還關注了一個問題:速度比原生模型更快嗎?

      LLM.int8() 方法的主要目的是使大型模型更易于訪問而不會降低性能。但是,如果它非常慢,那么用處也不大了。研究團隊對多個模型的生成速度進行了基準測試,發現帶有 LLM.int8() 的 BLOOM-176B 比 fp16 版本慢了大約 15% 到 23%——這是完全可以接受的。而較小的模型(如 T5-3B 和 T5-11B)的減速幅度更大。研究團隊正在努力提升這些小型模型的運行速度。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    最新成人av网站| 成人免费网站在线观看视频| av片在线观看永久免费| 成人欧美一区二区三区在线观看| 日本免费新一区视频| 极品av在线| 国产精品综合av一区二区国产馆| 久久久久久久影院| 久久亚洲一区二区三区四区五区高| 欧美激情视频在线观看| 欧洲在线视频一区| 久久国产日本精品| 国产免费久久av| 91丨九色丨尤物| 欧美酷刑日本凌虐凌虐| 亚洲午夜av| 欧美在线观看视频| 日韩三区四区| 日韩成人中文电影| 懂色av一区二区在线播放| 精品一区二区三区在线观看| 日本精品视频在线播放| 澳门成人av网| 国产精品毛片在线| 九七影院97影院理论片久久| 91性高湖久久久久久久久_久久99| 色综合婷婷久久| 亚洲在线观看视频网站| 99爱在线观看| 亚洲欧洲精品一区二区精品久久久| 欧美videofree性高清杂交| 欧美成人免费va影院高清| 国产情人综合久久777777| 日本免费一区二区三区等视频| 日韩电影免费观看高清完整版在线观看| 成人直播视频| 精品大片一区二区| 欧美欧美午夜aⅴ在线观看| 亚洲国产电影在线观看| 亚洲一区二区av在线| 成人av电影在线| 99国产精品久久久久久久久久久| 日韩不卡中文字幕| 国内成人精品2018免费看| 欧美性videosxxxxx| 精品一区二区男人吃奶| 国产成人视屏| 亚洲专区欧美专区| 久久久www免费人成黑人精品| 亚洲欧洲av一区二区三区久久| 91中文字幕在线观看| 国产精品久久久久久久久久久不卡| 欧美videossex| 欧美国产日本高清在线| 99精品视频在线播放观看| 欧美mv和日韩mv国产网站| 精品国产一区二区三区久久久久久| 日韩中文字幕一区二区高清99| 色婷婷亚洲mv天堂mv在影片| 成人精品天堂一区二区三区| 亚洲伊人网站| 精品视频色一区| 亚洲精品电影网站| 亚洲一区亚洲| 亚洲人挤奶视频| 亚洲一区二区在线免费看| 日韩欧美精品在线视频| а√在线中文在线新版| 91中文在线视频| 日韩欧美一区二区三区免费看| 久久福利电影| 婷婷久久伊人| 欧美激情aⅴ一区二区三区| 国产精品一卡二卡在线观看| 国产日韩在线观看av| xxxxxhd亚洲人hd| 国产视频亚洲色图| 91亚洲人成网污www| 中文字幕成在线观看| 亚洲国产精品悠悠久久琪琪| 国内不卡一区二区三区| 刘亦菲一区二区三区免费看| 亚洲国产欧美自拍| 成人三级视频在线观看一区二区| 久久国产电影| 99a精品视频在线观看| 国产伦精品一区二区三区视频| 日韩欧美三级在线| 欧美日韩亚洲国产精品| 亚洲毛片视频| 久久久av亚洲男天堂| 91精品在线麻豆| 麻豆精品一区二区三区| 欧美成人午夜| 国产美女久久精品| 一区二区三区四区在线免费观看| 精品免费日韩av| 成人国产免费电影| eeuss影院在线观看| 777电影在线观看| 国产精品三级av在线播放| 日韩一二三在线视频播| 成人看片爽爽爽| √最新版天堂资源网在线| 黄色在线免费观看网站| 亚洲欧洲国产专区| 亚洲免费成人av电影| 日韩高清a**址| 人交獸av完整版在线观看| 韩国一区二区在线观看| 日韩精品有码在线观看| 免费不卡在线观看| 欧美精品一二区| 91欧美一区二区| 欧美精品一区在线播放| 成人国产精品免费观看视频| 天天操夜夜操国产精品| 国产成人精品在线看| 久久久久久久成人| 51vv免费精品视频一区二区| 日本成人7777| 亚洲日本丝袜连裤袜办公室| 中文字幕乱码久久午夜不卡| 亚洲无av在线中文字幕| 亚洲精品一区二三区不卡| 国产精品一级片在线观看| 国内精品一区二区三区四区| 国产亚洲欧美中文| 精品一区在线| 色婷婷精品大在线视频| 蜜臀av一区二区在线免费观看| 欧美在线观看网站| 六月丁香综合| 日韩av中文字幕在线免费观看| 日韩子在线观看| 日韩中文av在线| 国产66精品久久久久999小说| 无码国模国产在线观看| 九九久久综合网站| 久久久噜噜噜久噜久久综合| 日韩国产精品一区二区三区| 亚洲乱码日产精品bd| 日韩中文字幕不卡| 91亚洲一区| 日本不卡不码高清免费观看| 性孕妇free特大另类| 亚洲精品专区| 欧美成人激情视频免费观看| 精品国产一区二区三区久久影院| 欧美日韩国产精品一区二区不卡中文| 午夜精品毛片| 成人欧美视频在线| 免费看污久久久| 日韩高清不卡av| 欧美日韩亚洲另类| 亚洲影视综合| 欧美成人二区| 精品孕妇一区二区三区| 91禁国产网站| 国产精品一香蕉国产线看观看| 欧美日韩国产天堂| 日本成人伦理电影| 国产精品国产自产拍高清av水多| 久久精品亚洲精品国产欧美|