3月5日消息,OpenAI最強競對Anthropic發布Claude 3系列模型,已經實現了對GPT-4的全面超越。
Anthropic是由前OpenAI員工創立的公司,在過去一年獲得了來自亞馬遜40億美元的投資。
此次,Anthropic宣布推出Claude 3模型系列,該系列包括三個模型,按能力升序排列依次是:Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus。
從Anthropic公布的測試數據看,其最高能力模型Claude 3 Opus的能力已經全面碾壓GPT-4。
如Anthropic所說,Claude 3模型將設定新的行業基準!
目前,Claude 3 Opus和Sonnet已可以在Claude.ai和Claude API中使用。Sonnet正在Claude.ai上提供免費體驗,Claude Pro用戶則可以使用Opus。目前,Claude 3 Sonnet已可在159個國家可用,而Claude 3 Haiku很快將會上市。
同時,今天起Claude 3 Sonnet也可以通過Amazon Bedrock,以及Google Cloud的Vertex AI Model Garden使用,Opus和Haiku很快就會在這兩個平臺同時推出。
如果說微軟通過綁定Open AI的GPT模型,在人工智能領域和亞馬遜、谷歌等大廠的競爭中一騎絕塵,那么,隨著全面碾壓GPT-4的Claude 3 Opus的出現,在這場競爭中亞馬遜也將吹起全面反擊的號角。
現在壓力給到微軟和Open AI,在馬斯克的訴訟中,GPT-5何時發布?而Anthropic和Open AI的那些恩怨情仇還將繼續上演……
Claude 3 Opus模型性能全面超越GPT-4
根據Anthropic公布的技術文檔,Opus是Claude 3 模型家族中最智能的模型,在人工智能系統的大多數常見評估基準上都優于GPT-4,包括本科生級專家知識(MMLU)、研究生級專家推理(GPQA)、基礎數學(GSM8K)等。它在復雜任務上表現出接近人類水平的理解力和流利性。
Claude 3模型在分析和預測、細致入微的內容創建、代碼生成以及西班牙語、日語和法語等非英語語言的對話方面都顯示出更強的能力。
總之,就是在各項測試領域,Claude 3 Opus的性能都已超越GPT-4。
響應速度方面,據介紹,Claude 3 Haiku是市場上速度最快、性價比最高的模型。它可以在不到三秒的時間內閱讀(約10k token)的包含圖表和圖形信息和數據密集的研究論文,并給出分析反饋。
Anthropic表示正式發布后,預計Haiku性能將進一步提高。
對于絕大多數工作負載,Sonnet比Claude 2和Claude 2.1快2倍,智能水平更高。它擅長于要求快速響應的任務,如知識檢索或銷售自動化。Opus提供了與Claude 2和2.1相似的速度,但具有更高的智能水平。
Claude 3模型可以處理各種視覺信息數據,包括照片、圖片、圖表和技術圖表。
Anthropic稱,一些客戶的知識庫,高達50%是如PDF、流程圖或演示幻燈片以格式存儲的信息。Claude 3 Opus在圖表理解和多步推理上表現優秀。
以例子來看,通過輸入一張來自皮尤研究中心圖表(如上)“年輕人比長輩更有可能使用互聯網”,然后詢問“G7國家的年輕人和老年人之間的平均差異百分比是多少?”
模型順利理解了G7概念,識別哪些國家是G7,并從輸入的圖表中檢索數據并使用這些值進行數學運算。
另外,全新的Claude模型在減少“過度拒絕”,與Claude 2.1相比,Claude 3 Opus模型在具有挑戰性的開放式問題上的準確性提高了兩倍,錯誤答案的水平也有所降低。
在長語境理解能力方面,Claude 3系列的3個模型,都至少支持20萬token的上下文窗口,都能處理超過100萬token的輸入。在200Ktoken的NIAH測試(大海撈針測試)中,Claude 3 Opus準確率超過99%。
同時,Anthropic透露,計劃在未來幾個月內頻繁發布Claude 3模型系列的更新。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。