国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

最新新聞：

蔚來智駕芯片神璣NX9031開啟“賺錢”模式已向一公司提供技術授權東風汽車布局低空技術，首臺馬赫動力2.0T飛行發動機交付華為“碰一碰”新專利公布：重塑內容分享模式引領設備交互新范式級數AI與阿里云達成全棧AI戰略合作奇瑞風云 T9L 官宣 2025 廣州車展首發亮相諾基亞公布全新戰略：聚焦 AI 驅動的網絡變革，整合為兩大核心業務板塊夸克 AI 眼鏡與支付寶合作升級，新增骨傳導拾音、準心等獨家能力東軟云科技入選福布斯中國“2025出海全球化領軍品牌TOP30”11月24日榮耀500系列發布來京東1元鎖定“龍馬金繩”真金禮盒同款iPad Air京東比Apple官方便宜上千元全國可用的政府補貼真香縱橫G700迪拜上市：中國豪華越野的全球奢享宣言華為Mate X7今日開啟預訂搭載第二代紅楓影像等配置百度Q3 AI收入96億元同比增50%，蘿卜快跑出行量翻倍榮耀500全系搭載驍龍8系旗艦芯華為MatePad Edge首次實現平板、電腦深度融合：四指橫滑無縫切換千問登場，阿里瞄準C端關鍵一戰 “雙十一”履約時效“卷”至分鐘級，順豐同城全場景全渠道單量顯著增長工信部：到2027年，建成200個左右高標準數字園區飛利浦Evnia弈威推27M2N6501L顯示器：27" QHD 240Hz QD-OLED QuestMobile2025年雙十一洞察報告：平臺間用戶爭奪戰激烈

首頁 > 云計算頻道 > 大模型

大模型的“成本瘦身”運動

2023年11月03日 14:39:21 來源：腦極體公眾號

　　數據大、參數量大、算力大，大模型的某些能力才會“涌現”，這一點在科技圈廣為流傳。

　　做大模型的主流思想是:不要輕易說模型“不行”，如果“它還沒行”，那就做得更大一點。

　　所以，不到一年的時間，大模型的參數規模增長100倍，如今已經突破了萬億級別，資源消耗量巨大，也帶來了越來越高的存儲成本、推理成本、運維成本、落地成本……以及社會成本。

　　目前，大模型仍處于商業化的黎明，如何回收大模型的投入，還存在很多未知數與不確定，而大模型一直在變大，成了一門極其燒錢的生意，背靠微軟的Open AI，2022年就虧損了5.4億美元左右。

　　不斷膨脹的成本，就是一張張真金白銀的賬單，壓在大模型企業身上的一根根“稻草”。Anthropic的首席執行官Dario Amodei最近預測，在未來兩年內，他們的模型成本將達到100億美元。

　　除了企業自身，社會也同樣在承擔大模型的隱形成本。谷歌就曾報告稱，訓練 PaLM 在大約兩個月內耗費了大約3.4千瓦時的電量，相當于300個家庭每年的能源消耗總量。大模型高能耗給環境帶來的負擔和成本，最終由整個社會來買單的。

　　很顯然，無論是商業上、環境上，比拼模型體量都是不可持續的。

　　一味求大的時代，已經過去了。

　　問題是，怎么給大模型“減負”呢?

　　事實上，通用大模型的頭部廠商，一直都在積極地開展“成本瘦身”運動。

　　比如微軟在Microsoft Build2020上曾公開了為GPT-3提供支持的AI supercomputing超級計算機，可以讓AI模型的訓練效率比其他平臺高16倍，更快的訓練可以降低時間成本與風險成本。

　　國產大模型也不例外。

　　盤古大模型早在2.0版本中，就嘗試采用稀疏+稠密架構，以降低訓練成本。文心一言推出一個月以后，也通過技術手段將大模型的推理性能提升近10倍，推理成本降到原來的十分之一。

　　避免走向臃腫沉重，成為人人都能使用的工具，大模型的“成本瘦身運動”，勢在必行。具體怎么實現?本文就來談一談這個問題。

　　一口吃不成胖子

　　大模型的哪些成本可以優化，哪些成本無法削減，哪些成本還要進一步加大投入?搞清楚這些之前，首先得知道是怎么胖的。才能在保證大模型的性能表現和用戶體驗(健康)的前提下，合理且精準地進行“成本瘦身”。

　　簡單來說，AI三要素——數據、算力、算法，仍然是決定大模型成本的最關鍵因素。

　　先說數據。Garbage in， garbage out，在大模型時代依然適用。

　　數據質量會直接決定大模型的能力。OpenAI招聘了多位博士來處理各行業的專業數據，并找了獨角獸企業Scale AI等多家數據標注公司，給GPT-3進行大規模的數據集投喂。同時，算法模型會不斷迭代升級，對數據量的需求會隨著使用量的上升和性能優化而持續不短的時間。

　　中文大模型的成本高，一個主要原因就是，中文數據量和質量，與英文還存在差距，訓練中文大模型，需要采集和處理的中文語言數據更多。另一方面，英語語法結構相比中文更簡單，中文文本的復雜性和多樣性，有的中文詞匯可以表達多種含義，語境豐富，上下文理解的歧義多、難度大，也增加了中文模型的訓練難度，需要額外的資源來支撐中文大模型的訓練。

　　再說算力。

　　大模型的訓練、運行、服務、迭代等一整個全周期，都要計算和存儲資源。

　　大模型的訓練，主打一個“暴力美學”，參數越大，訓練所用的計算資源就越多。GPT-3所使用的超級計算機，包含了一萬個GPU、285000個處理器內核。國內的文心4.0，也是基于飛槳平臺在萬卡集群訓練出來的。

　　這還不算完。大模型在部署后開放服務，隨著使用量的增加，要完成的推理任務也越來越多。24小時進行大量的“思考”和“輸出”，這個推理過程，也會持續消耗計算資源，就像人腦在處理大量復雜任務時，需要消耗糖原，很容易感到饑餓，得大吃一頓來補充能量。所以，大模型的推理成本也是很高的。

　　175B的GPT-3部署后的推理至少需要五個A100GPU，而國內面向全社會開放服務的大模型，比如文心一言，據說推理成本也是上一代的8-10倍。

　　最后說說算法。

　　降低大模型對計算資源的巨大依賴，一個主流方案是優化模型，在性能不變的基礎上，以更快的推理速度、更小的延遲、更低的資源需求來運行，相當于ROI投入產出比更高了，訓練、推理環節所需要的算力資源，單位成本更低。

　　有多少人工，就有多少智能，沒有人才不可能搞出真正能打的大模型。算法開發、測試、迭代、產品化等，都需要大量技術人才。人力成本究竟高不高，還要看大模型的商業模式是否穩健。

　　學歷拉滿的人才隊伍，在研發階段，是相當有競爭力的。問題在于，怎么掙錢呢?API調用或使用量收費，一個token不到一美分，回本盈利可能遙遙無期;付費訂閱(專業版)，頭部大模型具有虹吸效應，大家都會選擇OpenAI或BATH等大廠，自家大模型能否被用戶接受并愿意付費，是未知數;給行業客戶定制開發，ToB要深入了解行業，調研開發測試迭代，讓年薪幾十上百萬的算法工程師，在工地礦山農場一待幾個月，項目的毛利率估計不會太好看。

　　所以，一個大模型能不能成功，不僅僅是靠算法本身的能力，還要看從開發到落地的商業循環是否可持續。

　　管住嘴，邁開腿

　　如果我們把大模型的成本“瘦身”，比作一個希望減去多余贅肉的人，那么這個目標，可以拆解為兩種基本途徑:

　　一是制造“熱量差”。就是管住嘴邁開腿，控制投入，減去多余的成本，加速商業化提高收入，自然就瘦了。

　　二是變成“易瘦體質”。充分了解大模型的機理，用新的架構來解決Transformer注意力機制的問題，擁有“怎么吃都不胖”的體質。

　　聽起來，第二種是不是非常有誘惑力呢?

　　不用苦哈哈的控制成本、吸引用戶、定制服務，輕輕松松躺著掙錢，還有這種好事兒?確實。

　　目前，所有的大語言模型都用的Transformer架構，而這種架構難以處理長文本及高分辨率圖像，邏輯推理、知識歸納等就靠“大力出奇跡”，成本高昂。很多基礎原理仍然不清楚，這就導致很多現存問題束手無策，比如“幻覺”的產生，推理能力有限等。

　　圖靈獎得主 Yann LeCun就不止一次批評過大語言模型的技術范式，認為“LLM 對世界的理解非常膚淺”，他希望構建一個“世界模型”，先學習世界運作方式，而后形成一個內部模型，再通過這個內部模型來完成各種任務。除此之外，關于AGI通用智能還有許多科學家從各自的研究領域去探討。

　　總結一下，當前的大語言模型，很多原理尚不清晰，技術仍在變化中。未來可能會出現其他技術范式，顛覆當前一味求大的模型，那時可能就不需要過高的成本，也就不用痛苦地“瘦身”了。

　　可能你已經發現了，研究底層的原理、找到一種更強大的AGI技術，這事兒雖然聽起來很酷，但實在沒譜，目前還沒有一個清晰的時間表。而這一輪大語言模型的技術范式，在工程實踐上是可行的，在產業中能work的，有提質增效的明確效果的。先用起來，把握住現在，才是科技企業的當務之急。

　　所以，大模型企業只能管住嘴、邁開腿，盡快控制成本、加速商業化，制造良性可持續發展的“熱量差”。

　　制造“熱量差”的四化運動

　　那么，究竟該怎么制造“熱量差”呢?綜合目前市面上的主流手段，我們將其總結為“四化運動”:數據規�；�、模型壓縮化、計算高效化、商業分層化。

　　數據規�；峭ㄟ^規模效應，來提高數據的邊際效益，獲得最佳性價比。規模效應主要通過三種方式來實現，一是產業集中的規�；瑖覍用嬉呀浢鞔_提出，要“加快培育數據要素市場”，涉及數據生產、采集、存儲、加工、分析、服務等多個環節，產業化有助于減少大模型企業的數據成本。二是AI工具的應用，減少數據工程各個環節的人工參與，加快預訓練數據的處理，為模型訓練降本提效。三是反饋數據的規�；�。大模型對微調數據(SFT/RLHF)的需求量和質量要求很高，一些更早向全社會開放服務的大模型，如百度文心一言、商湯“商量SenseChat”、百川智能“百川大模型”、科大訊飛“星火大模型”等，“數據飛輪”更早開始轉動，有望更快一步達到邊際效益最優的數據規模。

　　數據是有邊際效益的。OpenAl 已經可以讓用戶來決定，是否允許其使用聊天數據進行訓練，也就是說，可以不再依賴用戶反饋數據了，那么數據的存儲和計算成本自然就能控制住了。

　　模型壓縮化，就是提高模型的性能，以更少的資源實現更高性能，將資源密集型的大模型，通過壓縮技術，轉化為更加緊湊高效的版本。類似于將脂肪轉化為肌肉，肌肉的密度更大，體重(性能)不變，人卻變瘦(更小)了。

　　目前，大模型壓縮的常見手段，主要有三種:量化、剪枝、知識蒸餾。

　　量化，相當于抽脂，簡單粗暴但是有效。模型的精度越高，所需要的存儲空間就越大。但在推理時，其實并不需要捕捉復雜模型中十分微小的梯度變化，所以量化可以直接降低模型的參數精度，“抽”去一部分細節性信息，從而減少占用空間，同時也不過于降低推理能力。比如以問生圖的生成式 AI 模型Stable Diffusion，此前只能在云端運行，高通AI Research使用量化技術，讓模型可以在更低精度水平保持準確性，首次實現了在 Android 智能手機上部署 Stable Diffusion。量化技術，也在文心、盤古等國產大模型中有所應用。

　　剪枝，類似“切除手術”，直接減去一些對效果沒什么影響的旁枝，比如大量冗余的結構、神經元，這些權重較小的部分刪減掉，對模型效果帶來的影響不大，也減少了模型的大小。當然，剪枝是一門“手藝活兒”，剪枝越精確，給模型準確率的損失就越小，壓縮效果越好。

　　知識蒸餾，就是讓大模型“蒸桑拿”，千億模型一通蒸餾，產出若干個性能接近、結構更簡的小模型，落地成本更低。挑戰在于，千億規模的模型蒸餾，也要消耗極高的計算資源，而且，從千億蒸餾到幾千萬，數據量差距過大，容易影響蒸餾的效果。無損蒸餾，是各大廠商的技術賽點之一。

　　既然模型壓縮技術，也會消耗計算資源，那么提高算力基礎設施的計算效率，就變得格外重要了。

　　計算高效化，是大模型廠商能夠以更高效益來提供模型服務的前提。

　　芯片和計算集群的性能，是研究和優化的重點。微軟云azure專門為OpenAI打造了適用于AI計算的超級計算機。國內廠商，百度、華為都擁有自研芯片、深度學習框架，可以通過端到端優化來提升計算效率，提升大模型的訓練速度和推理速度，從而降低訓練時間和成本。

　　而對于產業大模型、行業大模型等非通用大模型來說，規模效應和硬件優化技術有限，自行構建和維護基礎設施的成本是非常高的，使用云服務來訓練和部署服務，是成本更優的選擇。

　　歸根結底，大模型要提升商業收入，來達到優化ROI、回收成本的目的。目前，各類大模型的商業化，體現出了明顯的分層化特點。

　　簡單來說，就是不同體量、不同功能、不同方向的大模型，商業化路徑也開始涇渭分明。

　　通用大模型，以規模效益、高價值市場，為主要目標。OpenAI的用戶量巨大，發展API經濟具有規模效應，前期投入可以隨著業務量增長而被均攤。BATH(百度、阿里、騰訊、華為)等都有各自的云業務，積累了較為豐富的行業服務經驗，尤其是金融、礦山、政務等大型政企的客戶觸達能力，具備較大的商業轉化潛力，因此除了面向大眾服務的訂閱模式、商業版付費模式等，也可以開展高價值的ToB項目定制開發。ToB客戶的高要求推動模型體驗和效果提升，也可以服務ToC市場，通過規模化來進一步攤平成本。

　　行業大模型，則在主動收束產品和業務邊界，圍繞核心業務和功能，以更少的資源來開發專精的小模型，在投入和商業化之間取得一個很好ROI平衡。比如金融領域，度小滿的“軒轅70B”融入了大量的專業金融語料，提高對金融知識的理解能力，可控性、安全性上滿足金融客戶的特別要求，獲得了上百家金融機構申請試用。

　　總而言之，大模型并不是只有通用、泛化一條路，千行百業的私有化、個性化部署，會產生價格、隱私、安全等多方面的決策因素，也帶來大量的細分商機。通用大模型與行業大模型、專有小模型，分層+合力打開商業化之路。和而不同，考驗著產業鏈上每一個角色的智慧。

　　為了長遠、可持續的服務，管住嘴、邁開腿，大模型的“成本瘦身”是必經之路。

　　這個過程或許痛苦，卻會凝練出一條護城河，守護整個行業的健康發展。

　　20世紀40年代，計算機剛剛誕生的時候，人們驚嘆于這座“機器怪獸”的龐大身軀，但隨后開啟了信息時代的飛躍。智能手機剛剛誕生時，功能機廠商曾對它極盡諷刺，沒想到這種人人皆可觸網的普惠聯接，推起了移動互聯網的繁榮。

　　隨著大模型越來越好、成本越來越低，“人人皆可AI”，也將不再是一個遙遠的夢。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評，目前站內累計模型數超過80萬個，涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景，基本覆蓋所有主流創作風格。

一加Ace 6T官宣：全球首發驍龍8 Gen5

真我GT8 Pro阿斯頓馬丁F1限量版開售，16GB+1TB售價5499元

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

9月9日，國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場，1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

9月24日，華為坤靈召開“智能體驗，一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機，分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告，2025年第二季度》顯示，上半年全球智能家居清潔機器人市場出貨1,2萬臺，同比增長33%，顯示出品類強勁的市場需求。

專題

禮儀主持_商業活動模特演藝服務公司
九章智算云Alaya NeW Cloud 2.0發布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關于我單位網站被仿冒一

返回主頁 ┊ 關于我們 ┊ 內容聯系 ┊ 聯系我們 ┊ 免責聲明 ┊ 原創新聞 ┊ 門戶版

Copyright www.zxwl-tech.com 中文科技資訊 2009-2025 all rights reserved 網站聯系微信 xishuinet

關鍵詞：CITNews|Citnews中文科技資訊|中文科技資訊網|科技資訊網|中國科技資訊|中國科技新聞網|中國科技資訊網|快科技|新科技|中文科技數碼頭條號|中文移動新媒體

京ICP備18037198號-1 京公網安備 11010502041587號

国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
9国产精品午夜| 三级欧美在线一区| 国产精品欧美大片| 99在线视频影院| 午夜久久美女| 亚洲激情播播| 亚洲精品女av网站| 国产一区二区三区黄| 成人黄色av网站在线| 久久免费一区| 成人免费一区二区三区视频网站| www.欧美三级电影.com| 亚洲成人精品影院| 欧美在线一区二区三区四| 亚洲国产成人av网| 欧美精品一区二区精品网| 人体久久天天| 国产资源精品在线观看| 国产精品中文在线| a级高清视频欧美日韩| 欧美日韩国产一区二区在线观看| 久久精品小视频| 亚洲一区二区自拍| 日本在线电影一区二区三区| 欧美+亚洲+精品+三区| 高清国产一区二区三区四区五区| 国产精品1区二区.| 亚洲精品小视频| 精品久久久久久久人人人人传媒| 激情国产一区| 久久日一线二线三线suv| 91视频观看免费| 日韩视频精品在线观看| 精品亚洲二区| 尤物在线精品| 日韩视频在线你懂得| 欧美国产日韩一区二区| 中文字幕亚洲欧美日韩高清| 国产伦精一区二区三区| 国产九区一区在线| 一二三区精品视频| 国产午夜亚洲精品一级在线| 免费精品一区二区三区在线观看| 国产对白叫床清晰在线播放| 欧美18一19xxx性| 亚洲奶大毛多的老太婆| 亚洲成人蜜桃| 俺也去精品视频在线观看| 女女同性女同一区二区三区91| 日本成人免费在线| 国产在线一区二区三区播放| 精品国产一区二区在线观看| 精品国产sm最大网站| 中文幕一区二区三区久久蜜桃| 国产精品日韩精品中文字幕| 国产亚洲精品成人av久久ww| 污污片在线免费视频| 亚洲午夜剧场| 国产成人在线视频网站| 欧美国产精品人人做人人爱| 成人免费福利| 欧美日韩综合在线免费观看| 精品久久久久久亚洲精品| 久久国产精品视频| 久久久久久国产三级电影| 麻豆成人91精品二区三区| 欧美一级免费观看| 午夜亚洲精品| 麻豆专区一区二区三区四区五区| 欧美老女人在线| 国产日韩欧美夫妻视频在线观看| 99视频一区二区| 91精品国产综合久久福利| 国产成人天天5g影院在线观看| 精品久久久久中文字幕小说| 黄色在线播放网站| 成人午夜伦理影院| 亚洲色图校园春色| 日韩精品在在线一区二区中文| 成人激情在线观看| 97超碰人人模人人爽人人看| 欧美午夜精品久久久久久超碰| 国产盗摄一区二区三区| 亚洲最大的成人av| 国产精品伦一区二区| 精品不卡在线视频| 日本欧美在线观看| 国产麻豆日韩欧美久久| 欧美一卡二卡三卡四卡| 亚洲国产成人爱av在线播放| 51久久夜色精品国产麻豆| 久久成人综合| 欧美激情不卡| 亚洲网站在线播放| 国产在线观看一区二区三区| 久久综合伊人77777尤物| 免费视频亚洲| 亚洲精品白浆| 亚洲国产欧美日韩| 伊人久久综合影院| 日韩专区欧美专区| se01亚洲视频| 国产精品毛片一区二区三区四区| 91麻豆免费看片| 国模一区二区三区| 久久亚洲一区二区三区明星换脸| 国产高清在线一区二区| 国产a久久麻豆| 国产午夜一区| 99视频在线播放| 希岛爱理av免费一区二区| 久久久久久伊人| 亚洲aⅴ天堂av在线电影软件| 91麻豆精品一区二区三区| 欧美性猛交99久久久久99按摩| 精品国产乱码久久久久久1区2匹| 亚洲草草视频| 成人午夜高潮视频| 中文字幕亚洲区| 亚洲大胆av| 八戒八戒神马在线电影| 国产剧情一区二区三区| 国产精品丝袜久久久久久app| 欧美韩日精品| 成人勉费视频| 2020国产精品视频| 国产精品国产三级国产aⅴ浪潮| 国产超碰在线一区| 国产精品永久在线| 一本色道久久88精品综合| 亚洲18女电影在线观看| 欧美性视频精品| 嗯用力啊快一点好舒服小柔久久| 四虎影视4hu4虎成人| 欧美激情极品视频| 91桃色在线| 大地资源网3页在线观看| 国产一区二区三区网站| 91色琪琪电影亚洲精品久久| 卡通动漫精品一区二区三区| 日韩视频一区在线观看| 在线观看成人免费视频| 国产成人日日夜夜| 亚洲精品三区| 欧美精品videos性欧美| 国产激情综合五月久久| 91精品国产99久久久久久| 成人福利免费在线观看| 国产伦精品一区二区三区视频金莲| 日韩电影免费在线观看网站| 一区二区三区中文在线| 九九精品视频在线| 欧美日韩一区二区欧美激情| 久久久电影一区二区三区| 国产高清成人在线| 亚洲精品中文在线| 久久综合给合久久狠狠狠97色69| 99久久免费精品| 久久久精品国产一区二区三区| 欧美乱妇20p| 色呦呦日韩精品| 久久国产影院| 国产精品久久久久久久久久久免费看| 久久综合久久综合这里只有精品|