然而,Agent要從Demo走向大規模生產,仍面臨高成本、技術復雜、落地困難等挑戰。這正是“AI云原生”的意義所在。在6月11日舉辦的Force大會上,火山引擎展示了正在打造的一整套AI云原生“新底座”,通過對大模型、智能體開發、多模態數據湖、AI基礎設施和安全等的全面升級,打破智能體規模化落地的壁壘,讓Agent真正走入企業日常生產系統。
01
Tokens消耗5個月漲了4倍
Agent離企業越來越近
Force大會上,火山引擎總裁譚待公布了一組數據,去年12月,豆包大模型的日均tokens調用量是4萬億;截至今年5月底,已經超過16.4萬億,并仍然保持著高速增長。這組數據背后,是廣大行業企業管理者,對智能化轉型抱有的期望和動力。“他們在推動內部,用智能體取代傳統AI工具。”火山引擎云基礎產品負責人羅浩在今年走訪各地企業注意到這一趨勢。
Tokens規模快速增長背后,是模型能力的快速提升,在不斷解鎖新場景;鹕揭嬷悄芩惴ㄘ撠熑藚堑嫌^察,當下模型能力正沿三條主線進化:首先是推理與思考,尤其當它們結合圖像、視頻理解后,智能將爆發,智能體能力也將顯著增強;其次是視頻生成從“玩具”開始走向生產級,豆包的Seedance 1.0 Pro和Google Veo3等模型,已在短視頻廣告與電商內容制作等中落地;再次是多步驟復雜任務逐漸成熟。
這些模型的演進趨勢,給行業落地帶來巨大影響。以去年12月和今年5月火山引擎Tokens消耗構成來對比,隨著深度推理和思考模型的發布,AI工具調用的Tokens消耗增長了4.4倍,其中AI搜索增長10倍,AI 編程增長了8.4倍。視覺理解模型則讓K12在線教育的Tokens消耗增長了12倍,而新出現的智能巡檢,視頻檢索等場景也快速實現日均百億tokens的突破。

大模型的應用也在不斷深化。目前走在最前沿的智能手機、汽車、金融以及教育等行業,大模型應用落地和創新正在加速。
2025年被業界認為是智能體爆發之年。“我們希望大模型不再僅僅完成信息的識別、處理和生成,而是能夠自主推理、規劃行動并執行任務,從而成為構建復雜業務閉環的智能體。”譚待說。“到今年底,你能將一個比如說價值50元的事情交給模型或手機助手,讓它端到端嘗試性幫你完成,準確率可能在80%~90%。”吳迪舉例說。
然而,Agent目前在產業界Demo多,真正走入生產環境的少。普華永道2025年5月的調查顯示,88%的企業因Agent計劃增加AI預算,但真正跨應用、跨工作流連接的Agent,目前僅占19%。
Agent從技術走向業務,還面臨共性困境:其中最受關注的是部署成本高昂,收益卻難以回報。一家品牌曾為推廣Agent投入上百萬元,結果營收提升不足1%,卻占用了全年IT預算近五分之一。其次是技術部署也步履維艱。德勤今年5月的報告顯示,僅30%的Agent實驗,能在3-6個月內實現規模化落地。更不用說信任與風險管理,僅20%的企業受訪者信任Agent處理財務交易。此外,數據治理、組織變革、員工采納滯后問題同樣突出。
目前,智能體仍然不是“即插即用”的萬能產品,它更像是一塊“半成品拼圖”。智能體在企業的落地是一個復雜的系統工程,除了模型能力之外,仍需要大量能力上的補足。誰能把手中的“拼圖”先拼好,用更扎實的基礎建設、更貼近業務場景和可持續運營的思維,與專業能力融合,才能讓智能體成為企業智能生產力的新引擎,而非昂貴擺設。
實際上,我們正處于一個技術范式躍遷的時代:PC時代,主角是Web;移動時代,主角是App;而進入AI時代,主角正在變成智能體(Agent)。而開發范式也正在重塑——從程序員手編寫算法和規則,到大模型主導調用邏輯。

這一變革,推動整個技術棧發生深刻變化。AI云原生,正是支撐這場范式躍遷的技術底座。它不僅承載模型和Agent的高效開發,還幫助企業在AI時代構建出真正可用、可規;闹悄荏w。AI云原生也成為火山引擎的聚焦點。
02
AI云原生,是Agent規模落地基礎
在本次Force大會上,火山引擎密集推出了AI原生云從底部到頂部一系列新品,它正試圖打造一整套“AI云原生”新底座,支撐智能體走出Demo,進入行業大規模應用。
“AI云原生”理念最早在去年12月Force大會提出,核心思想延續了傳統云原生“解放用戶、專注應用”的精神。但與傳統“先搭云、再搭應用”不同,AI云原生強調“模型主導、將模型作為智能體生產流程的驅動力”。2025年2月,火山引擎也進一步明確,AI云原生的核心是“以模型為中心”。
要支撐AI云原生,底層架構幾乎需要全棧重塑。計算從CPU中心,轉向GPU優先,計算、存儲、網絡架構全面升級。與此同時,安全、大數據、推理框架、Agent開發.....幾乎需要全部升級。
大會上的一張PPT顯示,從安全、基礎設施、多模態數據湖、大模型到Agent開發,火山引擎都有動作。
其中,大模型和Agent開發平臺是關鍵要素。此前,豆包大模型研發團隊長期保持低調,但從這次公布的內容來看,模型信息已逐步透明化。新發布的豆包大模型1.6、視頻生成模型Seedance 1.0 Pro、實時語音模型等新品。豆包1.6突出了深度思考、多模態和工具使用能力,這可以推動多步驟復雜任務智能體。
火山引擎放出了模型價格,這引發了全場的關注,企業只需要原來三分之一左右價格,就能獲得一個能力更強、原生多模態的新模型。
譚待介紹,影響模型成本最關鍵的是輸入輸出長度,所以豆包1.6采用統一定價模式,不論用戶關閉或開啟深度思考模式,不論是文本還是視覺,tokens的價格都完全一樣。
為此,火山引擎基于對上下文長度分布的調度優化,可以創新性地實現區間定價:輸入區間32K-128K的范圍內,豆包1.6的價格是輸入1.2元每百萬tokens,輸出16元每百萬tokens;輸入區間128K-256K的范圍內,豆包1.6的價格是輸入2.4元,輸出24元。而對于絕大部分企業使用集中的0-32K范圍,通過技術的優化,豆包1.6的價格是每百萬tokens 輸入0.8元,輸出8元。
現場公布的Seedance價格引發了與會者的驚嘆,這是目前市場的最低價——Seedance 1.0 pro的價格為每千tokens1分5厘,相當于每生成一條5秒的1080P視頻,只需3.67元。“假如你有1萬塊錢預算,可以做2700條5秒的1080P視頻,這樣的模型和性價比,將促進創意和商業的繁榮應用。”
除了模型本身,要開發出好的Agent,需要提供強化學習、Prompt優化、MCP Hub、知識庫、運行沙盒等開發平臺,火山引擎提供了相應的配套能力。
吳迪特別提到了強化學習。隨著多步驟復雜任務Agent進入生產生活,業界對準確率要求將變得前所未有地高。這也將引發以強化學習為代表的后訓練熱潮。“我們也做一個大膽預測,強化學習整體算力消耗和IT支出,在2027年附近逼近預訓練上的投入。”
但強化學習處于黎明期,面臨很多挑戰,吳迪提到了字節跳動自研的veRL強化學習框架,已于2024年10月開源,收獲意外好評,在RL訓練的精度與易用性上展現出超預期表現,也有將近30多個行業工具/框架基于veRL之上來發展自己的生態。
在模型之下的數據基礎設施層面,也在發生變化;鹕揭鏀抵瞧脚_負責人郭東東介紹,企業數據正呈現兩大趨勢:一是非結構化數據,如圖像、視頻、音頻、文本比重持續上升,預計2027年在企業數據體系中占比超40%;二是結構化與非結構化數據的深度融合。
火山引擎推出了多模態數據湖解決方案,幫助企業搭建適應AI時代的數據新基建,從單純支撐BI報表,轉變為驅動AI模型訓練與模型應用的構建。同時,伴隨企業內部“數據專家”角色正在演變為更主動與智能的Agent,火山引擎所推出的企業級數據智能體Data Agent產品正式啟動售賣,實現業務數據全域貫通、深度理解和運用企業數據資產,主動思考并洞察數據,為業務提供可參考的深度洞察。
在數據基礎設施之下,是火山引擎AI基礎設施。無論是豆包大模型還是DeepSeek這樣的開源大模型,背后都是這一基礎設施在發揮強大支持,F在,火山引擎把這些基礎能力原子化,組合為三個方案,分別是AgentKit,TrainingKit和ServingKit,提供給企業。
其中,AgentKit圍繞Agent打造的工具和平臺進行了整體SDK封裝,核心解決了大模型與外部MCP工具的快速集成,以及在云端部署的問題。
TrainingKit支持訓練的全鏈路,除了針對傳統大規模預訓練,實現60%+的MFU(Model FLOPs Utilization,算力利用率),針對模型訓練從預訓練向后訓練轉移的趨勢,專門集成了veRL框架,同時支持百萬+核秒Sandbox并發,提升后訓練效率。
ServingKit則通過支持對各種開源框架的優化、對主流模型的算子優化,將推理性能比社區的最新版本提升了2-3倍。
圍繞AI云原生,安全是基礎。“針對大模型的攻擊,形態更加隱蔽,通過精心設計的提示詞或問句,讓模型不斷輸出內容,消耗推理算力,最終影響企業的核心業務。”火山引擎安全產品負責人劉森分析,另一類針對大模型的攻擊,與用戶隱私和數據密切相關。比如,新能源車的“大模型座艙”服務,可能會在攻擊下泄露用戶隱私。
火山引擎發布了兩款AI安全產品:AICC私密計算,面向公有云環境、保障推理效率前提下,實現敏感數據流轉和應用安全。同時,大模型應用防火墻,為企業智能體應用構建安全可信的大模型推理空間。火山引擎已與聯想一起,打造了國內PC領域的首個可信AI密態計算方案,保障大模型推理場景下的用戶數據隱私安全。
03
落地序幕已經拉開
結合火山引擎的“AI 云原生”理念,以及圍繞這一理念搭建起的全套技術棧,多個行業的龍頭企業正在加速與火山引擎,實現智能體落地的創新。
在消費行業,瑞幸咖啡基于豆包大模型,打造了首個AI點單智能體Lucky,能深入分析用戶歷史訂單數據,精準預測偏好,實現語音下單、猜你喜歡、點單更省時等功能。飛鶴奶粉用豆包大模型和火山引擎 HiAgent 平臺,構建了近百個智能體,用在品宣、營銷、辦公等內部場景。“我們選擇與火山引擎合作,主要是因為他們在AI和大數據方面的領先優勢。”瑞幸咖啡副總裁溫文顯說。
在汽車行業,寶馬借助豆包大模型升級了汽車營銷服務,截至目前,雙方合作的AI智能營銷工具已經支持全國約300家BMW經銷商。梅賽德斯-奔馳在全新純電長軸距CLA的人機交互系統中,接入豆包大模型,能回答各類問題,一句話幫車主找到需要的功能和應用并完成設置,還能夠識別人類情感,為車主提供情緒價值。
“當前,八成主流車企正在使用豆包大模型進行AI創新。”譚待說。不止營銷、智能座艙等場景,火山引擎還進一步深入到了企業更核心的場景,如研發、AI for Science等環節。比亞迪前不久發布的兆瓦閃充電池,在研發初期,便引入了字節跳動BAMBOO 模型,依托火山引擎的云基礎設施,進行電解液配方快速篩選,加速電池快充技術的研發進程。
在物流行業,順豐科技基于豆包大模型和HiAgent智能體開發平臺,實現了通用知識和順豐專業知識的融合,并通過零代碼、低代碼的方式打造了每個人專屬的AI辦公助理。
在互聯網行業,新浪微博面向搜索這一核心戰場,順勢推出了融合大模型能力的微博智搜,可大幅提升用戶搜索體驗。而微博選擇與火山引擎合作,通過ServingKit工具包等,做到在投入相同物理資源的情況下,能夠拿到比社區版本2倍甚至3倍以上的性能和吞吐收益,實現了技術降本。
另外,在消費電子、金融、教育等目前落地走在較為前列的幾大行業,火山引擎已實現批量化落地。
火山引擎總裁譚待透露,目前,在消費電子行業,全球Top10手機廠商中,已有9家選擇和火山引擎深度合作,將大模型應用在了語音助手,創作工具,效率提升等諸多場景。
在金融行業,火山引擎正在為客戶提供 AI APP、智能展業、投顧、投研等大模型應用方案,已服務招商銀行、浦發銀行、北京銀行等70%的系統重要性銀行,國泰海通證券、華泰證券、國信證券等數十家券商和基金公司。其中,國信證券基于豆包大模型、智能體構建平臺等能力,結合內部沉淀的投資顧問投研邏輯,推出了“會思考”的國信股市助手智能體,華泰證券打造出了華泰股市投資服務智能體。
在教育行業,火山引擎提供大模型解決方案,已與北京大學、浙江大學、南開大學等超五成985高校達成合作,持續推動高等教育智能化轉型。上海市虹口區還攜手火山引擎,依托 HiAgent 智能體開發平臺,打造了國內首個區域級教育智能體應用生態系統 ——“虹口區教育智能體導航系統”(HEADS),探索 AI 融入教學全流程。上線百日,全區教師已自主構建177個教育智能體。
而業界看到,AI能否像水電一樣“即開即用”,很大程度上要看這場底層架構重塑能走多遠、走多快。通過“AI云原生”全棧新服務,火山引擎正在把AI能力變成機車設施,推動“AI as a Service”成為現實。“我們也相信,火山引擎將攜手越來越多的客戶和伙伴,一起做好大模型應用落地,在AI時代加速創新。”譚待說。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。