国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

行業唯一平嵌自由組合!80萬用戶選擇的“好產品”實至名歸號稱重新定義Wi-Fi!追覓首款路由器靈逍Boundless明天發布:3600Mbps速率國產顯卡摩爾線程320.130版驅動發布:支持Win11 25H2、優化《永劫無間》等游戲中國電信宣布云智手機公測版正式上線!舊手機也能玩3A級大作節省近50%GPU計算!通義百聆開源新一代語音交互模型1200km終結續航焦慮!固態電池廠商Factorial Energy沖刺上市揭秘好萊塢頂級大片背后的基礎架構力量Coda推出智能鏈接解決方案Coda Links2026首臺真全面屏旗艦!紅魔11 Air明年1月發布:祖傳主動散熱風扇回歸SPARKLE 撼與宣布旗下英特爾銳炫 Arc Pro B60 顯卡正式上市AI科技賦能冬奧!TCL小藍翼C7 AI健康空調亮相TCL冬日冰雪樂園比亞迪11月歐洲銷量同比猛增235%,特斯拉下降超34%安謀科技發布新一代高性能計算芯片安全解決方案縱橫無拘,各有各的Young —— EVNIA弈威助力2025《永劫無間》世界冠軍賽圓滿收官!年輕人的科技潮寵:華為nova 15用紅楓影像+衛星通信把出片和安全感都拉滿具身智能終局是干活,但怎么才能干好活?周期性探底疊加成本高漲,11月家用空調內外銷雙雙下滑碳中和目標,家電巨頭都是如何定的?高通 CEO 安蒙:智能手機計算架構重大變革有望 2026 年公布零跑十周年朱江明發布內部信:從跟跑到領跑,以世界級車企要求自己
  • 首頁 > 云計算頻道 > 大模型

    「有效上下文」提升20倍!DeepMind發布ReadAgent框架

    2024年04月07日 11:13:37 來源:新智元公眾號

      基于Transformer的大語言模型(LLM)具有很強的語言理解能力,但LLM一次能夠讀取的文本量仍然受到極大限制。

      除了上下文窗口較小外,LLM的性能會隨著輸入內容長度的增加而下降,即便輸入內容未超過模型的上下文窗口長度限制也是如此。

      相比之下,人類卻可以閱讀、理解和推理很長的文本。

      LLM和人類在閱讀長度上存在差異的主要原因在于閱讀方法:LLM逐字地輸入精確的內容,并且該過程相對被動;但過于準確的信息往往會被遺忘,而閱讀過程更注重理解模糊的要點信息,即不考慮準確單詞的內容能記憶更長時間。

      人類閱讀也是一個互動的過程,比如回答問題時還需要從原文中進行檢索。

      為了解決這些限制,來自Google DeepMind和Google Research的研究人員提出了一個全新的LLM系統ReadAgent,受人類如何交互式閱讀長文檔的啟發,將有效上下文長度增加了20倍。

      論文鏈接:https://arxiv.org/abs/2402.09727

      受人類交互式閱讀長文檔的啟發,研究人員將ReadAgent實現為一個簡單的提示系統,使用LLMs的高級語言功能:

      1. 決定將哪些內容存儲在記憶片段(memory episode)中;

      2. 將記憶片段壓縮成稱為要點記憶的簡短片段記憶,

      3. 如果ReadAgent需要提醒自己完成任務的相關細節,則采取行動(action)來查找原始文本中的段落。

      在實驗評估中,相比檢索、原始長上下文、要點記憶(gist memories)方法,ReadAgent在三個長文檔閱讀理解任務(QuALITY,NarrativeQA和QMSum)上的性能表現都優于基線,同時將有效上下文窗口擴展了3-20倍。

      ReadAgent框架

      1. 要點記憶(gist memory)

      要點記憶是原始長上下文中文本塊的短要點的有序集合,構建gist記憶有兩個步驟:分頁(pagination)和記憶提要(memory gisting)。

      片段分頁(episode pagination)

      當ReadAgent閱讀長文本時,通過選擇暫停閱讀的位置來決定在記憶片段中存儲哪些內容。

      每一步都會為LLM提供部分文本,從上一個暫停點開始,并在達到最大單詞數限制時結束;提示LLM選擇段落之間的哪個點將是自然的暫停點,然后將前一個和當前暫停點之間的內容視為一個episode,也可以叫做頁(page)。

      記憶提要(memory gisting)

      對于每一頁,提示LLM將確切的內容縮短為要點或摘要。

      2. 并行和順序交互查找

      由于要點記憶與頁相關,所以只需提示LLM來找出哪一頁更像是答案,并在給定特定任務的情況下再次閱讀,主要有兩種查找策略:同時并行查找所有頁面(ReadAgent-P)和每次查找一個頁面(ReadAgent-S)。

      ReadAgent-P

      比如說,在問答任務中,通常會給LLM輸入一個可以查找的最大頁數,但也會指示其使用盡可能少的頁面,以避免不必要的計算開銷和干擾信息(distracting information)。

      ReadAgent-S

      順序查找策略中,模型一次請求一頁,在決定展開(expand)哪個頁面之前,先查看之前展開過的頁面,從而使模型能夠訪問比并行查找更多的信息,預期在某些特殊情況下表現得更好。

      但與模型的交互次數越多,其計算成本也越高。

      3. 計算開銷和可擴展性

      片段分頁、記憶提要和交互式查找需要迭代推理,也存在潛在的計算開銷,但具體開銷由一個小因子線性約束,使得該方法的計算開銷不會輸入長度的增加而劇烈提升。

      由于查找和響應大多是條件要點(conditioned gists)而非全文,所以在同一上下文中的任務越多,成本也就越低。

      4. ReadAgent變體

      當使用長文本時,用戶可能會提前知道要解決的任務:在這種情況下,提要步驟可以在提示中包括任務描述,使得LLM可以更好地壓縮與任務無關的信息,從而提高效率并減少干擾信息,即條件ReadAgent

      更通用的任務設置下,在準備提要時可能不知道具體任務,或者可能知道提出的要點需要用于多個不同的任務,例如回答關于文本的問題等。

      因此,通過排除注冊步驟中的任務,LLM可以產生更廣泛有用的提要,代價是減少壓縮和增加干擾注意力的信息,即非條件ReadAgent。

      這篇論文中只探討了無條件設置,但在某些情況下,條件設置可能更有優勢。

      迭代提要(iterative gisting)

      對于一段很長的事件歷史,例如對話等,可以考慮通過迭代提要來進一步壓縮舊記憶來實現更長的上下文,對應于人類的話,舊記憶更模糊。

      實驗結果

      研究人員評估了ReadAgent在三個長上下文問答挑戰中的長文檔閱讀理解能力:QuALITY、NarrativeQA和QMSum。

      雖然ReadAgent不需要訓練,但研究人員仍然選擇在訓練集上開發了一個模型并在驗證、測試和/或開發集上進行了測試,以避免過擬合系統超參數的風險。

      選用的模型為指令微調后的PaLM 2-L模型。

      評估指標為壓縮率(compression rate, CR),計算方法如下:

      LLM評分器

      NarrativeQA和QMSum都有一個或多個自由形式的參考回復,通常使用諸如ROUGE-F之類的語法匹配度量來評估。

      除此之外,研究人員使用自動LLM評分器來評估這些數據集,作為人工評估的替代方法。

      上面兩個提示中,「嚴格LLM評分器提示」用于判斷是否存在精確匹配,「許可LLM評分器提示」用于判斷是否存在精確匹配或部分匹配。

      基于此,研究人員提出了兩個評價指標:LLM-Rating-1(LR-1)是一個嚴格的評估分數,計算所有示例中精確匹配的百分比;LLM-Rating-2(LR-2)計算精確匹配和部分匹配的百分比。

      長上下文閱讀理解

      QuALITY

      QuALITY是一個多選問答任務,每個問題包含四個答案,使用來自多個不同來源的文本數據。

      實驗結果顯示,ReadAgent(查找1-5頁)實現了最好的結果,壓縮率為66.97%(即提要后上下文窗口中可以容納3倍的token)。

      當增加允許查找的最大頁數(最多5頁)時,性能會不斷提高;在6頁時,性能開始略有下降,即6頁上下文可能會增加干擾信息。

      NarrativeQA

      在三個閱讀理解數據集中,NarrativeQA的平均上下文長度最長,為了將gists放入上下文窗口,需要擴展頁面的尺寸大小。

      提要對Gutenburg文本(書籍)的壓縮率為96.80%,對電影劇本的壓縮率為91.98%

      QMSum

      QMSum由各種主題的會議記錄以及相關問題或說明組成,長度從1,000字到26,300字不等,平均長度約為10,000字,其答案是自由形式的文本,標準的評估指標是ROUGE-F

      可以看到性能隨著壓縮率的降低而提高,因此查找更多頁面的技術往往比查找更少頁面的技術做得更好。

      還可以看到ReadAgentS大大優于ReadAgent-P(以及所有基線),性能改進的代價是檢索階段的請求數量增加了六倍。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    日本欧美久久久久免费播放网| 久久精品一区二区三区不卡牛牛| www.成人在线.com| 91福利视频网站| 欧美日韩不卡一区| 一本色道久久综合精品竹菊| 中文字幕在线成人| 国产欧美精品一区二区色综合| 国产一区二区中文字幕免费看| 青青草原国产在线| 久久久久久艹| 欧美精品在欧美一区二区少妇| 国产精品久久久久久中文字| 国产91视觉| 奇米在线7777在线精品| 女人香蕉久久**毛片精品| 成人精品视频一区| 久久久人人爽| 精品久久久久中文字幕小说| 成人福利视频在线| 欧美一区二区女人| 成人爽a毛片免费啪啪动漫| 色呦呦呦在线观看| 97av在线影院| 欧美性受xxxx黑人xyx| 成人黄色激情网| 国产成人高清激情视频在线观看| jiujiure精品视频播放| 在线性视频日韩欧美| 国产精品18久久久久| 日韩欧美国产综合| 亚洲涩涩在线| 欧美在线三区| 91高清在线观看视频| 91av视频在线播放| 欧美va天堂va视频va在线| 欧美videos粗暴| 日韩欧美一区二区三区在线观看| 国产视频亚洲色图| 在线中文字幕亚洲| 亚洲一区二区三区免费视频| 欧美国产视频在线观看| 色乱码一区二区三区88| 三级在线观看视频| 欧美13一14另类| 精品电影一区二区三区| 成人黄色国产精品网站大全在线免费观看| 日韩av中文字幕一区二区| 狠狠色伊人亚洲综合成人| 国产一区二区三区久久悠悠色av| 久久精品中文字幕| 精品久久国产字幕高潮| 欧美妇女性影城| 国产乱子轮精品视频| 国产精品有限公司| 日韩经典一区二区三区| 国产精品高潮呻吟久久| 91亚洲自偷观看高清| 国产精品久久久久久av下载红粉| 久久神马影院| 一区二区三区毛片| 蜜桃成人365av| 日本va欧美va精品| 欧美一级二级三级九九九| 亚洲欧洲日韩| 91在线中文| 亚洲精品日韩激情在线电影| zzijzzij亚洲日本少妇熟睡| 精品国产sm最大网站免费看| 久热re这里精品视频在线6| 亚洲在线免费观看| 中文av字幕一区| 中文乱码免费一区二区| 日韩国产在线看| 69久久夜色| 一区二区三区四区精品在线视频| 亚洲人成电影网站| 成人免费高清在线| 国产精品福利在线观看网址| 欧美一级黄色片| 亚洲区第一页| caoporen国产精品| 日本韩国视频一区二区| 日韩一区二区中文| 亚洲色图制服丝袜| 日本精品在线中文字幕| 涩涩视频在线免费看| 久久精品成人| 国产日韩欧美a| 国产精品久久一卡二卡| 一区二区久久久久| 精品一区二区三区香蕉蜜桃| 欧美精品亚洲一区二区在线播放| 51国偷自产一区二区三区的来源| 日韩精品免费一区二区三区| 久久久伦理片| 欧美激情第10页| 影音成人av| 国产亚洲激情视频在线| 最新国产成人在线观看| 欧亚洲嫩模精品一区三区| 国产不卡123| 精品三级av在线| 一区在线中文字幕| 欧美丰满少妇xxxxx| 欧美色图第一页| 久久久久久久久一区二区| 8050国产精品久久久久久| 老鸭窝一区二区久久精品| 精品国产一区二区三区在线观看| 99久久综合狠狠综合久久aⅴ| 天天色天天操综合| 欧美体内she精视频| 精品欧美一区二区三区精品久久| 色偷偷噜噜噜亚洲男人| 亚洲国产精品久久人人爱| 国产大学生校花援交在线播放| 欧美视频一区在线| 视频在线观看免费影院欧美meiju| 亚洲欧美丝袜| 国产成人av电影在线观看| 日韩av中文在线| 欧美黄色一级视频| 亚洲另类一区二区| 激情视频一区二区| 亚洲综合丁香婷婷六月香| 色综合影院在线观看| 日韩免费av一区二区三区| 暖暖成人免费视频| 成人精品一区二区三区电影黑人| 精品视频在线播放一区二区三区| 一道本一区二区| 中文字幕视频精品一区二区三区| 日韩欧美在线电影| 欧美黄色精品| 99re这里都是精品| 欧美理论电影在线精品| 日韩av在线影院| 欧美国产日韩一区二区三区| 色综合久久久久久久久五月| 成人少妇影院yyyy| 91亚洲国产成人精品性色| 精品国产一区二区三区忘忧草| 亚洲伊人一本大道中文字幕| 亚洲欧美一区二区不卡| 亚洲激情欧美| 99精品老司机免费视频| 久久99深爱久久99精品| 国产精品sm| 日韩一区免费| 国产欧美日韩高清| 欧美成人精品一区二区| 久久久久中文字幕| av中文字幕在线观看第一页| 久久综合成人精品亚洲另类欧美| 国产精品1区2区在线观看| 国产精品成av人在线视午夜片| 亚洲人亚洲人成电影网站色| 久久国产精品99久久久久久丝袜| 日本在线播放一二三区| 久久众筹精品私拍模特| 韩国v欧美v亚洲v日本v| 美女999久久久精品视频| 本田岬高潮一区二区三区|