国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

解鎖2026世界杯觀賽“新姿勢”,聯想AI平板攜天禧AI 3.5打造掌上沉浸主場聯想motoX70Air云上舞白冰鉆限定版AI手機即將上市 自帶14顆手工精鑲冰鉆 超奢華只有紅魔還在做24+1TB 姜超:成本暴增 友商一臺都沒有英特爾®至強® D處理器:賦能智能網卡,破解算力-網絡協同瓶頸豐田全新超跑GR GT發布:配641馬力大V8商家仿冒心系天下W26 老機當新機賣!中國電信回應告別“人海戰術”!陳天橋:未來公司值多少錢,不看人數看“認知”“卷”不動了?讓AI銷售團隊替你卷!百度商家智能體升級片來了卡薩帝冰箱亮相廣州設計周亞馬遜云科技推出Amazon Graviton5----迄今性能最強、能效最高的自研CPU第八屆“綻放杯”圓滿落幕,華為助力千行百業5G應用“全面綻放”機構:2025年第三季度中國PC市場同比增長2%火山引擎發布豆包語音識別模型2.0提升多語種識別精度現代汽車推出 AI 驅動的 MobED 機器人,2026年上市Vidu發布 Q2“生圖全家桶”:4K 生圖 + 圖像編輯 + 圖轉視頻,全都免費用中國新勢力首家!理想汽車累計交付突破150萬輛瑞典Oceanbird Wing 560翼帆開放訂購,2026量產在即,加速布局中國市場賦能綠色航運億邦智庫第七次《產業互聯網發展報告》重磅發布一加Ace 6T首銷10分鐘賣爆!打破今年同檔機型全天銷售紀錄魯大師11月電動兩輪車榜:潮玩思路重塑市場,九號領跑智能化
  • 首頁 > 數據存儲頻道 > 數據.存儲頻道 > 存儲資訊

    CPU,正在被AI時代拋棄?

    2024年07月11日 16:30:39 來源:中文科技資訊

      在某三甲醫院的門診中,匯集了來自各地的病患,醫生們正在以最專業的能力和最快的速度進行會診。期間,醫生與患者的對話可以通過語音識別技術被錄入到病例系統中,隨后大模型 AI 推理技術輔助進行智能總結和診斷,醫生們撰寫病例的效率顯著提高。AI 推理的應用不僅節省了時間,也保護了患者隱私;

      在法院、律所等業務場景中,律師通過大模型對海量歷史案例進行整理調查,并鎖定出擬定法律文件中可能存在的漏洞;

      ……

      以上場景中的大模型應用,幾乎都有一個共同的特點——受行業屬性限制,在應用大模型時,除了對算力的高要求,AI 訓練過程中經常出現的壞卡問題也是這些行業不允許出現的。同時,為確保服務效率和隱私安全,他們一般需要將模型部署在本地,且非常看重硬件等基礎設施層的穩定性和可靠性。一個中等參數或者輕量參數的模型,加上精調就可以滿足他們的場景需求。

      而在大模型技術落地過程中,上述需求其實不在少數,基于 CPU 的推理方案無疑是一種更具性價比的選擇。不僅能夠滿足其業務需求,還能有效控制成本、保證系統的穩定性和數據的安全性。但這也就愈發讓我們好奇,作為通用服務器,CPU 在 AI 時代可以發揮怎樣的優勢?其背后的技術原理又是什么?

      1、AI 時代,CPU 是否已被被邊緣化?

      提起 AI 訓練和 AI 推理,大家普遍會想到 GPU 更擅長處理大量并行任務,在執行計算密集型任務時表現地更出色,卻忽視了 CPU 在這其中的價值。

      AI 技術的不斷演進——從深度神經網絡(DNN)到 Transformer 大模型,對硬件的要求產生了顯著變化。CPU 不僅沒有被邊緣化,反而持續升級以適應這些變化,并做出了重要改變。

      AI 大模型也不是只有推理和訓練的單一任務,還包括數據預處理、模型訓練、推理和后處理等,整個過程中需要非常多軟硬件及系統的配合。在 GPU 興起并廣泛應用于 AI 領域之前,CPU 就已經作為執行 AI 推理任務的主要硬件在被廣泛使用。其作為通用處理器發揮著非常大的作用,整個系統的調度、任何負載的高效運行都離不開它的協同優化。

      此外,CPU 的單核性能非常強大,可以處理復雜的計算任務,其核心數量也在不斷增加,而且 CPU 的內存容量遠大于 GPU 的顯存容量,這些優勢使得 CPU 能夠有效運行生成式大模型任務。經過優化的大模型可以在 CPU 上高效執行,特別是當模型非常大,需要跨異構平臺計算時,使用 CPU 反而能提供更快的速度和更高的效率。

      而 AI 推理過程中兩個重要階段的需求,即在預填充階段,需要高算力的矩陣乘法運算部件;在解碼階段,尤其是小批量請求時,需要更高的內存訪問帶寬。這些需求 CPU 都可以很好地滿足。

      以英特爾舉例,從 2017 年第一代至強® 可擴展處理器開始就利用英特爾® AVX-512 技術的矢量運算能力進行 AI 加速上的嘗試;再接著第二代至強® 中導入深度學習加速技術(DL Boost);第三代到第五代至強® 的演進中,從 BF16 的增添再到英特爾® AMX 的入駐,可以說英特爾一直在充分利用 CPU 資源加速 AI 的道路上深耕。

      在英特爾® AMX 大幅提升矩陣計算能力外,第五代至強® 可擴展處理器還增加了每個時鐘周期的指令,有效提升了內存帶寬與速度,并通過 PCIe 5.0 實現了更高的 PCIe 帶寬提升。在幾個時鐘的周期內,一條微指令就可以把一個 16×16 的矩陣計算一次性計算出來。另外,至強® 可擴展處理器可支持 High Bandwidth Memory (HBM) 內存,和 DDR5 相比,其具有更多的訪存通道和更長的讀取位寬。雖然 HBM 的容量相對較小,但足以支撐大多數的大模型推理任務。

      可以明確的是,AI 技術的演進還遠未停止,當前以消耗大量算力為前提的模型結構也可能會發生改變,但 CPU 作為計算機系統的核心,其價值始終是難以被替代的。

      同時,AI 應用的需求是多樣化的,不同的應用場景需要不同的計算資源和優化策略。因此比起相互替代,CPU 和其他加速器之間的互補關系才是它們在 AI 市場中共同發展的長久之道。

      2、與其算力焦慮,不如關注效價比

      隨著人工智能技術在各個領域的廣泛應用,AI 推理成為了推動技術進步的關鍵因素。然而,隨著通用大模型參數和 Token 數量不斷增加,模型單次推理所需的算力也在持續增加,企業的算力焦慮撲面而來。與其關注無法短時間達到的算力規模,不如聚焦在“效價比”,即綜合考量大模型訓練和推理過程中所需軟硬件的經濟投入成本、使用效果和產品性能。

      CPU 不僅是企業解決 AI 算力焦慮過程中的重要選項,更是企業追求“效價比”的優選。在大模型技術落地的“效價比”探索層面上,百度智能云和英特爾也不謀而合。

      百度智能云千帆大模型平臺(下文簡稱“千帆大模型平臺”)作為一個面向開發者和企業的人工智能服務平臺,提供了豐富的大模型,對大模型的推理及部署服務優化積攢了很多作為開發平臺的經驗,他們發現,CPU 的 AI 算力潛力將有助于提升 CPU 云服務器的資源利用率,能夠滿足用戶快速部署 LLM 模型的需求,同時還發現了許多很適合 CPU 的使用場景:

      ●SFT 長尾模型:每個模型的調用相對稀疏,CPU 的靈活性和通用性得以充分發揮,能夠輕松管理和調度這些模型,確保每個模型在需要時都能快速響應。

      ●小于 10b 的小參數規模大模型:由于模型規模相對較小,CPU 能夠提供足夠的計算能力,同時保持較低的能耗和成本。

      ●對首 Token 時延不敏感,更注重整體吞吐的離線批量推理場景:這類場景通常要求系統能夠高效處理大量的數據,而 CPU 的強大計算能力和高吞吐量特性可以很好地滿足要求,能夠確保推理任務的快速完成。

      英特爾的測試數據也驗證了千帆大模型平臺團隊的發現,其通過測試證明,單臺雙路 CPU 服務器完全可以輕松勝任幾 B 到幾十 B 參數的大模型推理任務,Token 生成延時完全能夠達到數十毫秒的業務需求指標,而針對更大規模參數的模型,例如常用的 Llama 2-70B,CPU 同樣可以通過分布式推理方式來支持。此外,批量處理任務在 CPU 集群的閑時進行,忙時可以處理其他任務,而無需維護代價高昂的 GPU 集群,這將極大節省企業的經濟成本。

      也正是出于在“CPU 上跑 AI”的共識,雙方展開了業務上的深度合作。百度智能云千帆大模型平臺采⽤基于英特爾® AMX 加速器和大模型推理軟件解決方案 xFasterTransformer (xFT),進⼀步加速英特爾® 至強® 可擴展處理器的 LLM 推理速度。

      3、將 CPU 在 AI 方面的潛能發揮到極致

      為了充分發揮 CPU 在 AI 推理方面的極限潛能,需要從兩個方面進行技術探索——硬件層面的升級和軟件層面的優化適配。

      千帆大模型平臺采用 xFT,主要進行了以下三方面的優化:

      ●系統層面:利用英特爾® AMX/AVX512 等硬件特性,高效快速地完成矩陣 / 向量計算;優化實現針對超長上下文和輸出的 Flash Attention/Flash Decoding 等核心算子,降低數據類型轉換和數據重排布等開銷;統一內存分配管理,降低推理任務的內存占用。

      ●算法層面:在精度滿足任務需求的條件下,提供多種針對網絡激活層以及模型權重的低精度和量化方法,大幅度降低訪存數據量的同時,充分發揮出英特爾® AMX 等加速部件對 BF16/INT8 等低精度數據計算的計算能力。

      ●多節點并行:支持張量并行(Tensor Parallelism)等對模型權重進行切分的并行推理部署。使用異構集合通信的方式提高通信效率,進一步降低 70b 規模及以上 LLM 推理時延,提高較大批處理請求的吞吐。

      第五代至強® 可擴展處理器能在 AI 推理上能夠取得如此亮眼的效果,同樣離不開軟件層面的優化適配。為了解決 CPU 推理性能問題,這就不得不提 xFT 開源推理框架了。

      xFT 底層適用英特爾 AI 軟件棧,包括 oneDNN、oneMKL、IG、oneCCL 等高性能庫。用戶可以調用和組裝這些高性能庫,形成大模型推理的關鍵算子,并簡單組合算子來支持 Llama、文心一言等大模型。同時,xFT 最上層提供 C++ 和 Python 兩套便利接口,很容易集成到現有框架或服務后端。

      xFT 采用了多種優化策略來提升推理效率,其中包括張量并行和流水線并行技術,這兩種技術能夠顯著提高并行處理的能力。通過高性能融合算子和先進的量化技術,其在保持精度的同時提高推理速度。此外,通過低精度量化和稀疏化技術,xFT 有效地降低了對內存帶寬的需求,在推理速度和準確度之間取得平衡,支持多種數據類型來實現模型推理和部署,包括單一精度和混合精度,可充分利用 CPU 的計算資源和帶寬資源來提高 LLM 的推理速度。

      另外值得一提的是,xFT 通過“算子融合”、“最小化數據拷貝”、“重排操作”和“內存重復利用”等手段來進一步優化 LLM 的實現,這些優化策略能夠最大限度地減少內存占用、提高緩存命中率并提升整體性能。通過仔細分析 LLM 的工作流程并減少不必要的計算開銷,該引擎進一步提高了數據重用度和計算效率,特別是在處理 Attention 機制時,針對不同長度的序列采取了不同的優化算法來確保最高的訪存效率。

      目前,英特爾的大模型加速方案 xFT 已經成功集成到千帆大模型平臺中,這項合作使得在千帆大模型平臺上部署的多個開源大模型能夠在英特爾至強® 可擴展處理器上獲得最優的推理性能:

      ●在線服務部署:用戶可以利用千帆大模型平臺的 CPU 資源在線部署多個開源大模型服務,這些服務不僅為客戶應用提供了強大的大模型支持,還能夠用于千帆大模型平臺 prompt 優化工程等相關任務場景。

      ●高性能推理:借助英特爾® 至強® 可擴展處理器和 xFT 推理解決方案,千帆大模型平臺能夠實現大幅提升的推理性能。這包括降低推理時延,提高服務響應速度,以及增強模型的整體吞吐能力。

      ●定制化部署:千帆大模型平臺提供了靈活的部署選項,允許用戶根據具體業務需求選擇最適合的硬件資源配置,從而優化大模型在實際應用中的表現和效果。

      4、寫在最后

      對于千帆大模型平臺來說,英特爾幫助其解決了客戶在大模型應用過程中對計算資源的需求,進一步提升了大模型的性能和效率,讓用戶以更低的成本獲取高質量的大模型服務。

      大模型生態要想持續不斷地往前演進,無疑要靠一個個實打實的小業務落地把整個生態構建起來,英特爾聯合千帆大模型平臺正是在幫助企業以最少的成本落地大模型應用,讓他們在探索大模型應用時找到了更具效價比的選項。

      未來,雙方計劃在更高性能的至強® 產品支持、軟件優化、更多模型支持以及重點客戶聯合支持等方面展開深入合作。旨在提升大模型運行效率和性能,為千帆大模型平臺提供更完善的軟件支持,確保用戶能及時利用最新的技術成果,從而加速大模型生態持續向前。

      更多關于至強® 可擴展處理器為千帆大模型平臺推理加速的信息,請點擊英特爾官網查閱。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    [No.S013]

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    精品一区免费av| 性欧美.com| 久久精品视频中文字幕| 欧美性受xxxx黑人xyx性爽| 俺去了亚洲欧美日韩| 欧美大片在线看| 丁香婷婷深情五月亚洲| 亚洲尤物视频网| 亚洲不卡1区| 高清日韩一区| 精品捆绑美女sm三区| 成人免费91在线看| 久久久久久精| 欧美色欧美亚洲另类二区| 91精品视频在线看| 国内精品久久久久久野外| 欧美一区二区三区啪啪| 久久午夜国产精品| 国产色婷婷亚洲99精品小说| 久久久精品国产免大香伊| 国产91足控脚交在线观看| 午夜影院欧美| 日韩av网站大全| 国产一区二区观看| 激情五月***国产精品| 水蜜桃精品av一区二区| 国产激情美女久久久久久吹潮| 日韩免费av| 在线精品视频一区二区三四| 久热精品在线视频| 国产精品欧美日韩一区| 国产一区二区三区四区老人| 国产农村妇女毛片精品久久莱园子| 69视频在线观看| 欧美午夜精品久久久久久人妖| 欧美最顶级丰满的aⅴ艳星| 成人羞羞网站| 亚洲成色精品| 欧美剧情电影在线观看完整版免费励志电影| 欧美一级理论片| 精品一区二区三区中文字幕老牛| 欧美精品在线网站| 欧美精品日韩一区| 精品精品国产高清一毛片一天堂| 在线一区电影| 中文字幕有码在线视频| 亚洲综合伊人| 欧美肥臀大乳一区二区免费视频| 色婷婷av在线| 国产精品vip| 天堂资源在线亚洲| 国产精品自拍毛片| 免费在线观看91| 欧美有码视频| 欧美日韩精品免费观看视频| 国产a精品视频| 成人影片在线播放| 国产精品国产三级国产三级人妇| 成人网视频在线观看| 欧美哺乳videos| 国产一区视频观看| 91p九色成人| 久久视频在线视频| 日韩一区二区精品葵司在线| 偷窥少妇高潮呻吟av久久免费| 日韩精品一区二区三区免费观影| 国产精品久久久久久久免费大片| αv一区二区三区| 日韩欧美国产大片| 91精品国模一区二区三区| 亚洲乱码免费伦视频| 国产这里只有精品| 国产精品免费久久久| 久久久久国产精品厨房| 日韩欧美一区中文| 日本精品一区二区三区不卡无字幕| 一区二区免费视频| 久久久91精品国产一区不卡| 国产精品久久久久久久久免费丝袜| 成人亲热视频网站| 成人免费视频网址| 欧美精品videos性欧美| 一区二区三区四区日本视频| 黑人另类av| 中文字幕精品影院| 中文字幕久久精品一区二区| 精品国产乱码久久久久久88av| 成人免费福利在线| japanese23hdxxxx日韩| 欧美大片在线观看一区| 国产午夜精品全部视频在线播放| 成人精品在线视频| 蜜桃精品在线| 国产日韩精品视频一区二区三区| 久久三级毛片| 久久精品一级爱片| 日韩视频在线你懂得| 久久久久久久久丰满| 欧美成人一区二区三区片免费| 国产精品久久久久久久龚玥菲| 亚洲国产欧美一区二区三区同亚洲| 色偷偷噜噜噜亚洲男人的天堂| 日本一区视频在线观看免费| 亚洲国产精品久久人人爱| 亚洲人亚洲人色久| 亚洲丝袜另类动漫二区| 久久久久国产精品午夜一区| 欧美日韩亚洲成人| 香蕉久久一区二区不卡无毒影院| 日韩国产综合| 精品亚洲精品福利线在观看| 一级做a爰片久久毛片美女图片| 婷婷久久青草热一区二区| 欧美日韩激情网| 精品欧美一区二区三区| 国产xxx精品视频大全| 激情综合网天天干| 国产色综合天天综合网| 一区二区三区视频免费在线观看| 国产精品久久久久久久久久免费| 日日嗨av一区二区三区四区| 日韩国产激情| 欧美高清一级片| 亚洲超碰97人人做人人爱| 国产亚洲美女久久| 在线视频中文字幕一区二区| 成人精品电影在线观看| 不卡专区在线| 成人免费福利视频| 欧美在线在线| 久久精品国产亚洲夜色av网站| 久久久久久亚洲精品不卡| 你懂的国产精品永久在线| 色噜噜色狠狠狠狠狠综合色一| 精品高清在线| 九七电影韩国女主播在线观看| 国产伦精品一区二区三区视频青涩| 天堂蜜桃91精品| 国产电影一区| 亚洲精品美女久久久| 日日夜夜免费精品视频| 欧美天天综合| 国产麻豆精品95视频| 欧美性猛交xxx高清大费中文| 中国字幕a在线看韩国电影| 91精品国产自产91精品| 亚洲精品白浆高清久久久久久| 中文字幕日本一区二区| 在线日本成人| 亚洲国产日韩一区二区| 在线观看一区二区精品视频| 久久精品免费电影| 黄色一区二区三区| 中文字幕一区二区三区在线观看| 久久久青草青青国产亚洲免观| 66精品视频在线观看| 欧美视频一区| 久久www免费人成看片高清| 亚洲欧洲色图综合| 国内精品**久久毛片app| 国产精品美女久久久浪潮软件| 久久麻豆一区二区| 最好看的2019的中文字幕视频| 午夜精品免费在线|