OpenAI 的首席執行官 Sam Altman 在一次采訪中強調了使用高質量數據來訓練人工智能模型的重要性。他表示,無論是人類生成的數據還是合成數據,高質量數據對 AI 系統至關重要。
Altman 在 AI for Good Global Summit 的一次采訪中提到了 AI 系統對高質量數據的需求。他認為,無論是來自人類還是合成生成的低質量數據都會成為問題。Altman 表示:“我認為你需要的是高質量數據。有低質量的合成數據,也有低質量的人類數據。”
目前,OpenAI 已經擁有足夠的數據來訓練 GPT-4之后的下一代模型,Altman 表示。公司正在嘗試生成大量合成數據,以探索不同的 AI 訓練方法。然而,關鍵問題在于 AI 系統如何能夠用更少的數據學到更多,而不僅僅是產生大量合成數據進行訓練。
Altman 認為,如果訓練模型的最佳方式是 “生成類似于一千萬億標記的合成數據并將其反饋回去”,那將是 “非常奇怪的”。對于 Altman 來說,高效地從數據中學習是關鍵,他將核心問題描述為 “如何用更少的數據學到更多?” 他警告稱,OpenAI 和其他公司仍需找到最適合訓練日益強大的 AI 系統的數據和方法。
科學支持 Altman 的觀點,表明更好的數據會帶來更好的 AI 性能。這也符合 OpenAI 最近斥資數億美元從主要出版商那里獲得訓練數據的戰略。在這個快速發展的領域,尋找適合訓練 AI 系統的最佳數據和技術仍需要做出許多科學進展。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。