人工智能(AI)和機器學習(ML)的能力使它們成功地滲透到幾乎每個可能的行業。隨著大語言模型(LLMs)和問答系統的引入,尤其是近年來,AI社區取得了巨大的進展。在自動問答(QA)系統的開發中,從包含問題-答案對的預先計算數據庫中高效檢索答案是一個常見的步驟。
研究指出了兩種主要的QA范式:開放式書本和閉合式書本。開放式書本采用檢索和閱讀的兩步過程,從龐大的文檔語料庫(通常是互聯網)中獲取相關材料,然后通過應用不同的模型和方法從獲取的內容中提取解決方案。閉合式方法則更為最新,依賴于訓練中學到的技能,這些模型通常基于Seq2Seq模型(如T5),在不使用外部語料庫的情況下生成結果。
盡管閉合式技術表現出色,但它們對許多工業應用來說過于資源密集,對系統性能構成重大風險。數據庫問答(DBQA)是另一種方法,它從預生成的問題-答案對數據庫中檢索答案,而不依賴于模型或大型語料庫參數中包含的信息。
然而,DBQA技術在檢索和排名模型開發方面面臨著重要的問題,主要是由于現有資源在范圍和內容上的不足。為了克服這些挑戰,一組研究人員提出了一個名為QUADRo的數據集和模型,用于問答數據庫檢索。這是一個新的、開放領域的標注資源,專門用于訓練和評估模型。
QUADRo包含15,211個輸入問題的每個問題都有30個相關的問答對,總計超過44萬個標注樣本。對每對的重要性進行了二進制指示,與輸入查詢的關系明確標記。
研究團隊進行了深入的實驗,評估了該資源在與QA系統組件的幾個重要方面的質量和特性。這些元素包括培訓方法、輸入模型配置和答案的相關性。實驗證明了該方法在檢索相關響應方面的出色表現,通過檢查在該數據集上訓練的模型的行為和性能。
總的來說,這項研究通過引入一個有用的資源并對其屬性進行仔細評估,解決了自動質量保證系統中訓練和測試數據不足的問題。對培訓策略和答案相關性等重要元素的強調有助于更全面地了解這一領域。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。