世界是復雜的,沒有人知道未來會怎樣,但如果單純從技術的角度,我們總是能夠沿著技術發展的路徑,找到一些主導未來趨勢的脈絡。
從Sora到Suno,從OpenAI到Copilot、Blackwell,這些熱詞在大眾眼里或許還分不清楚,但很多人已經用上各種“ChatGPT”,或聊天或創作。不知不覺間,我們已經卷入新一輪AI浪潮中。
這輪人工智能浪潮,自ChatGPT這類生成式AI工具問世,被迅速引爆。AI大模型從研究走向應用,復用成本大幅降低,各種應用得以更快滲透進各行各業。
IDC發布報告稱,2027年全球人工智能IT總投資規模有望從2022年的1324.9億美元增至2027年的5124.2億美元,年復合增長率(CAGR)為31.1%。
聚焦生成式AI,IDC預測,全球生成式AI市場年復合增長率將達85.7%,到2027年全球生成式AI市場規模將接近1500億美元。
英偉達CEO黃仁勛表示,生成式AI已經開啟了全新的投資周期,已經進入了“十年周期”(技術從出現、傳播到大規模應用所需的時間)的第一年。
當生成式AI從一個“奇點”到迎來“大爆炸”時刻,其將在現實世界發生哪些改變?又將激發怎樣的潛力?

生成式AI迎來“三個轉變”
過生成式AI技術可分為四個層次,即面向消費者應用;大語言模型(LLM)等基礎技術;支持服務的云基礎設施;以及對于開發和運營至關重要的半導體。
從技術發展看,今年生成式AI將從純理論探討階段,全面進入到業務應用階段。過去一年,大部分企業和機構并沒有真正打造出生成式AI系統;而今年,生成式AI系統將全面進入到生產當中,企業將真正地開始使用生成式AI工具。
對于生成式AI本身,即將迎來三個方面的轉變。
首先,要把生成式AI投入到企業以及業務用例的過程中,就要從構建訓練基礎架構轉向構建推理基礎架構。
到目前為止,大部分企業往往是通過對開源基礎模型進行調優、優化或者是互聯,來實現自己的某些功能和需求。
對于各個企業、各個垂直行業領域的企業來說,無論是GenAI還是GPT4,大語言模型的訓練成本是高昂的。特別是對于垂直行業的企業用戶,不會在業務推進過程中直接采用這些模型。
如果未來需要將AI能力賦予企業的業務,那么企業就需要進一步開發已有的模型,從而讓這些模型在部署到垂直行業的生產中時,可以真正地轉化為生產力。
而這種轉變也對企業提出了更加明確的要求:如何更好地設計出這種推理基礎架構?該把它們放在哪里?如何確保其安全?
其次,是企業的關注點將越來越多地將從寬泛的實驗轉向自上而下的戰略推進,即挑選出少數幾個真正具有變革意義的生成式AI應用項目。
去年,很多企業都在考慮采用生成式AI技術。但如今,企業已經認識到,要應用生成式AI技術,每個項目都非常龐大,需要占用大量人力、物力、財力,才能構建和實施一個能夠投入生產的生成式AI系統。
到了今年,一方面,生成式AI領域將會有成百上千乃至上萬的潛在用例,但另一方面,由于每一個企業的資源有限,因此只能選擇其中幾個重點實施。
對于企業的CIO和領導者,必然會面臨一個問題:就是從幾百個AI項目中,優先選擇幾個進行實施。這其中的風險在于:一旦選對了,這些項目將對業務產生正向影響;而萬一選錯,可能就會造成大量的資源浪費。
要想做出一個正確的選擇,各個企業必須要充分理解GenAI價值,以及生成式AI最有可能從哪些方面能夠為企業提升生產力而賦能。
第三,是用戶對于AI投入的成本考量,從對“訓練成本”的計算轉向對“運營成本”的衡量。
在理論研究和訓練階段,生成式AI的成本取決于構建模型的復雜程度,以及架構開發和維護人員的規模,除此之外再無其他成本可言。
但當企業用戶開始實施部署和應用生成式AI工具時,現實的運營成本就會成為企業用戶面臨的最大經濟考量。
以戴爾科技為例,其最初開始建立自己的生成式AI系統時,基本上會在三個月的時間里用到20臺服務器,此刻其整體運營成本是未知的。
但當這套系統開始被戴爾科技內部的工程師應用時,6000名工程師每個月就需要大約5000萬次處理量,因此該系統最大的成本不是建立一個模型的成本,而是基于大規模處理而產生的巨額運營成本。
這對企業用戶而言,從訓練成本到運營成本的考慮,將是未來必將面對的一個相當現實的問題。
從本質上說,生成式AI的轉變其實是技術從研發到應用的商用化過程中必然要經歷的過程。
只是由于AI自身業務形態的改變,也將帶來更多行業的改變,其中的一個影響就是會帶動一批相關技術和應用,成為未來的熱點和趨勢。
如何激發生成式AI更大潛力
僅僅一年,隨著各大資本和巨頭入場,AI從底層大模型,到基礎設施,到機器學習操作(MLOps),再到消費端應用,生成式AI的生態已經初步建立。
隨著今年生成式AI的進一步訓練和穩定,行業發展將加速向下游移動,生成式AI將進一步改變人們的生活,乃至改變整個世界,其為企業提供了無限的想象空間,使產品和服務的研發過程更加高效、有趣。
面對生成式AI市場的巨大潛力,亞馬遜、谷歌、微軟、Meta等科技巨頭不甘示弱。去年12月,谷歌多模態大模型Gemini發布,包含三個版本:Nano、Pro和Ultra。
Pro對標GPT-3.5,Ultra對標GPT-4,可以處理文本之外的信息,包括圖像、視頻和音頻。同時,谷歌上線文生圖模型Imagen 2、視頻生成模型VideoPoet,推出醫療人工智能大模型MedLM,將大模型與醫療保健行業緊密結合。
去年11月,微軟將集成了GPT的Bing Chat更名為Copilot,可以免費使用GPT-4、DALL·E 3功能,并且擁有了獨立網站,Copilot將嵌入所有微軟旗下應用中。微軟還推出Copilot Studio,使用者可以自定義GPT、創建新插件、自定義工作流。
Meta則接連發布了650億參數的開源大模型 LLaMA和700億參數的LLaMA2。近日,Meta推出全新開源大模型Code Llama 70B,其準確率達到了53%,超過了GPT-3.5的48.1%,是目前評分最高的開源大模型。
2023年以來,看似默默無聞的亞馬遜頻頻出擊。去年9月,亞馬遜宣布將向人工智能初創公司Anthropic投資40億美元,近日,其再次宣布追加投資27.5億美元,完成了對Anthropic40億美元的投資,決心可見一斑。窗體頂端
更為重要的是,亞馬遜云科技提出了基于生成式AI的三層技術棧。
第一層是高性能基礎設施,過去五年,亞馬遜云科技持續加大在自研芯片方面的投入,比如Amazon Trainium和Amazon Inferentia芯片,可以提供在云上訓練模型和運行推理的最低成本。
除此之外,在GPU方面,NVIDIA多款先進算力均率先在亞馬遜云科技落地。
第二層是最廣泛的基礎模型選擇。亞馬遜云科技認為“沒有一個模型可以適用于所有業務場景”,因此推出Amazon Bedrock,企業可以靈活選擇適合自己的模型,更容易地構建應用,并在保證數據安全和隱私基礎上,進行定制化模型的開發,還無需大量的標注數據。
Amazon Bedrock提供各種領先的基礎模型供客戶選擇:既有知名的開源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非開源模型。
基于Amazon Bedrock云托管服務,企業可以通過API訪問從文本到圖像的一系列強大的基礎模型。
值得一提的是,亞馬遜和Anthropic在生成式AI領域有著廣泛的合作,Anthropic在Amazon Bedrock上提供的Claude 3系列模型是全球最領先的大模型之一,共包含三個模型:Haiku、Sonnet、Opus,從模型尺寸來看,可以理解為模型的中杯、大杯、超大杯。
客戶可以根據自己的商業需求,從中選擇最合適的智能、速度和價格組合。
Haiku:是響應速度最快的模型,也是成本最低的選項,在大多數純文本任務上的表現仍然相當出色,也同時包含多模態能力(比如視覺)。
Sonnet:適用于需要平衡性能和成本的場景,它在純文本任務上的表現與后面的Opus相當,但在成本上更為經濟,適合于那些需要性能稍微好點,但預算有限的企業和個人用戶。
Opus:具有強大的推理、數學和編碼能力,接近人類的理解能力,適用于需要高度智能和復雜任務處理的場景,如企業自動化、復雜金融預測、研究和開發等。
對于Claude 3,更有行業人士認為其終結了GPT-4時代。Claude 3有兩大亮點,一個是長文本,二是多模態能力。
長文本是Claude 3的一個顯著優勢,體現為在讀論文、小說等字數更多的文本時,Claude 3更擅長理解和回答用戶的相關問題。
此次Claude 3大大提升了上下文對話窗口,達到200k,可以理解為單次和模型對話能夠輸入的文本。
具體而言,Claude 3 200k的對話長度,相當于能夠單次處理超過15萬英文單詞,而GPT-4 Turbo的上下文窗口為128k,大約是9.6萬個英文單詞。同時,Claude 3也第一次允許圖像和文檔上傳。
和ChatGPT一樣,Claude 3能夠“認”出來圖里的是什么東西,直接描述,回答用戶的問題。更令人印象深刻的是,Claude 3在分析一些復雜問題時,已經能夠和人一樣,先拆解問題,并且交由子模型來進行調度。
第三層就是應用生成式AI技術的開箱即用的云服務,進一步降低使用門檻。目前已經推出Amazon Q這一AI助手,可以根據客戶業務進行定制,專用于辦公場景需要。
還與像Amazon QuickSight,包括智能客服的產品Amazon Connect,面向編程開發人員的平臺Amazon CodeWhisperer,都實現了非常有效的結合。
可以看到,從底層基礎設施到上層應用拓展,今年亞馬遜云科技在生成式AI領域不斷發力。不同的客戶可以根據需求選擇不同層級的產品,通過這三層來支持他們的業務創新。
此外,對于如何幫助企業快速具備生成式AI能力,亞馬遜云科技擁有豐富的專業技術支持資源,包括SA、產品專家、人工智能實驗室、數據實驗室、快速原型團隊、專業服務團隊,幫客戶打通應用生成式AI的“最后三公里”工程化挑戰。
對于作為扮演“底層架構師”角色的亞馬遜云科技而言,大模型固然重要,但關鍵技術能力的集合才是提升企業生產力的根本動力。
亞馬遜云科技大中華區產品部總經理陳曉建表示,“盡管大模型非常重要,但僅靠大模型對企業的生產是遠遠不夠的。從模型能力到真正的運營生產之間,企業還需要增加很多輔助能力。企業需要一系列周邊的能力來正確、合理、安全、高效地使用大模型,這就是亞馬遜云科技一系列產品所提供的價值所在。”
生成式AI領域接下來發展的最關鍵一步是什么?陳曉建表示,首先,從最底層來看,芯片性能仍然落后于需求。雖然半導體芯片的發展已經非?,但模型本身參數規模的擴大實際上遠超芯片的能力。
“以前一個幾百萬參數的模型,就覺得已經很大了,但現在動輒達到數百億的規模;A服務商仍需關注如何將底層能力、業務復雜度和大模型復雜度相匹配,使硬件發展趕上軟件發展規模。”
其次,他認為大模型能力本身還有很多發展空間,今天看到的模型可能代表了一個博士生水平,但是能不能做得更好?比如達到教授或者院士水平?
包括亞馬遜云科技在內的諸多生成式AI供應商需要在未來持之以恒地去做模型能力方面的工作。
在最上層與各行各業務相結合方面,陳曉建表示,相關的SaaS解決方案非常多。
從這點上看,將生成式AI能力與垂直場景的解決方案結合需要做巨大的工作。“我們需要思考大模型如何為人類社會各行各業中的應用提供更好的模型能力、更易用的方式和更低的成本。”
無論如何,人們對未來的期許總是充滿希望。對于科技未來的走向,以AI為代表的技術進化,正在成為一場考驗人類想象力的比賽。
科技企業能做的,就是通過技術普惠,降低AI參與門檻,先把大模型打造成像電、水一樣隨取隨用的公共資源,再將生成式AI技術應用于各行各業,變成真正能夠推動人類發展的生產力。
相關閱讀
從“算力核彈”到生成式AI,新紀元還有多遠?
打造生成式AI應用,什么才是關鍵?
AI Agent:大模型的下一個高地
生成式AI來了,我們還能相信自己的眼睛嗎?
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。