研究人員從清華大學和北京理工大學開發了 DRAGIN,這是一種針對大型語言模型設計的動態檢索增強生成框架。
該框架旨在通過在文本生成過程中實時確定何時以及如何檢索外部信息,從而提高語言模型的性能。為了解決當前方法在確定何時進行檢索和檢索內容方面過于靜態的問題,DRAGIN 引入了 RIND 和 QFS 兩個關鍵組件。其中,RIND 主要用于確定檢索時機,考慮語言模型的不確定性和令牌重要性;而 QFS 則用于構建查詢,利用上下文的自注意力機制優先選擇與當前上下文相關的令牌。通過這種動態檢索的方式,DRAGIN 在四個知識密集型數據集上表現出色,而且無需額外的訓練或提示工程。

傳統的單輪檢索增強方法通過將初始輸入作為查詢,將外部知識引入到語言模型中。以往的研究已經深入探討了這種方法,例如 REPLUG 使用語言模型生成檢索模型的訓練數據,UniWeb 則自我評估是否需要檢索。然而,對于需要大量外部知識的復雜任務,多輪檢索變得至關重要。DRAGIN 則采用了新穎的多輪檢索方法,通過 FLARE 在遇到不確定令牌時觸發檢索,從而提高檢索相關性,同時考慮了語言模型的實時信息需求。
DRAGIN 是一個旨在解決語言模型動態檢索增強方法的框架。通過 RIND 和 QFS 優化檢索激活時機和查詢精度,使得在知識密集型任務上取得更好的性能。盡管它依賴于基于 Transformer 的語言模型的自注意力機制,但 DRAGIN 展現出了顯著的有效性。未來的工作旨在克服與自注意力可訪問性相關的限制,并對查詢構建技術的影響進行評估。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。