國家知識產權局最新公告顯示,杭州深度求索人工智能基礎技術研究有限公司申請的“一種廣度數據采集的方法及其系統”專利于4月1日正式公布。該技術旨在優化網頁數據采集流程,通過智能篩選鏈接、分析內容質量及優化下載分配,顯著減少低效或重復下載,從而提升數據質量并降低網絡資源消耗。
專利摘要指出,該系統采用獨立的信息回灌隊列設計,確保數據處理的穩定性,同時避免對目標網站造成流量沖擊。當前,大語言模型訓練依賴高質量、多樣化的數據集,但傳統采集技術常面臨鏈接遺漏、過量訪問及內容質量不足等問題。深度求索的解決方案有望為人工智能領域提供更高效的數據支持,推動自然語言處理技術發展。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。