国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

解鎖2026世界杯觀賽“新姿勢”,聯想AI平板攜天禧AI 3.5打造掌上沉浸主場聯想motoX70Air云上舞白冰鉆限定版AI手機即將上市 自帶14顆手工精鑲冰鉆 超奢華只有紅魔還在做24+1TB 姜超:成本暴增 友商一臺都沒有英特爾®至強® D處理器:賦能智能網卡,破解算力-網絡協同瓶頸豐田全新超跑GR GT發布:配641馬力大V8商家仿冒心系天下W26 老機當新機賣!中國電信回應告別“人海戰術”!陳天橋:未來公司值多少錢,不看人數看“認知”“卷”不動了?讓AI銷售團隊替你卷!百度商家智能體升級片來了卡薩帝冰箱亮相廣州設計周亞馬遜云科技推出Amazon Graviton5----迄今性能最強、能效最高的自研CPU第八屆“綻放杯”圓滿落幕,華為助力千行百業5G應用“全面綻放”機構:2025年第三季度中國PC市場同比增長2%火山引擎發布豆包語音識別模型2.0提升多語種識別精度現代汽車推出 AI 驅動的 MobED 機器人,2026年上市Vidu發布 Q2“生圖全家桶”:4K 生圖 + 圖像編輯 + 圖轉視頻,全都免費用中國新勢力首家!理想汽車累計交付突破150萬輛瑞典Oceanbird Wing 560翼帆開放訂購,2026量產在即,加速布局中國市場賦能綠色航運億邦智庫第七次《產業互聯網發展報告》重磅發布一加Ace 6T首銷10分鐘賣爆!打破今年同檔機型全天銷售紀錄魯大師11月電動兩輪車榜:潮玩思路重塑市場,九號領跑智能化
  • 首頁 > 云計算頻道 > 大模型

    谷歌蘋果最新發現:LLM知道但不告訴你,掌握知識比表現出來的多

    2024年10月21日 09:30:20 來源:新智元導讀

      【新智元導讀】近日,來自谷歌和蘋果的研究表明:AI模型掌握的知識比表現出來的要多得多!這些真實性信息集中在特定的token中,利用這一屬性可以顯著提高檢測LLM錯誤輸出的能力。

      大模型的應用歷來受幻覺所擾。

      這個幻覺可以指代LLM產生的任何類型的錯誤:事實不準確、偏見、常識推理失敗等等。

      ——是因為大模型學半天白學了嗎?并不是。

      近日,來自谷歌和蘋果的研究表明:AI模型掌握的知識比表現出來的更多!

    論文地址:https://arxiv.org/pdf/2410.02707

      論文地址:https://arxiv.org/pdf/2410.02707

      研究人員在LLM內部表示上訓練分類器,以預測與生成輸出的真實性相關的各種特征。

      結果表明LLM的內部狀態編碼反映出的真實性信息,比以前認識到的要多得多。

      這些真實性信息集中在特定的token中,利用這一屬性可以顯著提高檢測LLM錯誤輸出的能力。

      雖說這種錯誤檢測無法在數據集中泛化,但好處是,模型的內部表示可用于預測模型可能犯的錯誤類型,從而幫助我們制定緩解錯誤的策略。

      研究揭示了LLM內部編碼和外部行為之間的差異:可能編碼了正確的答案,卻生成了不正確的答案。

      ——簡單來說就是,LLM它知道,但它不想告訴你!

      LLM在裝傻

      作者建議將重點從以人類為中心的幻覺解釋轉移到以模型為中心的視角,檢查模型的中間激活。

      不同于使用RAG或者依賴更強大的LLM judge,本文工作的重點是僅依賴于模型輸出的logits、softmax后的概率和隱藏狀態的計算。

      錯誤檢測器

      第一步是確定真實性信號在LLM中的編碼位置。

      假設我們可以訪問LLM的內部狀態(白盒),但不能訪問任何外部資源(搜索引擎或其他LLM)。

      建立一個數據集D,由N個問題標簽對組成,對于每個問題,提示模型生成響應,從而得到一組預測答案。

      接下來,比較LLM生成的回答與正確答案,從而構建錯誤檢測數據集(這一部可由AI代勞)。

      實驗選擇了四個LLM:Mistral-7b,Mistral-7b-instruct-v0.2,Llama3-8b和Llama3-8b-instruct。

      作者選取了10個跨越不同領域和任務的數據集:TriviaQA、HotpotQA(with/without context)、Natural Questions、Winobias、Winogrande、MNLI、Math、IMDB review sentiment analysis和另一個自制的電影角色數據集。

      實驗允許無限制地生成響應以模擬現實世界LLM的用法,并貪婪地解碼答案。

      性能指標

      測量ROC曲線下面積以評估錯誤檢測器,這能夠反映模型在多個閾值中區分陽性和陰性情況的能力,平衡靈敏度(真陽性率)和特異性(假陽性率)。

      錯誤檢測方法

      Majority:始終預測訓練數據中最頻繁的標簽。

      聚合概率/logits:從之前的研究中選取幾種方法,包括計算這些值的最小值、最大值或平均值。

      P(True):通過提示要求LLM評估其生成的正確性時。

      Probing:在模型的中間激活上訓練一個小分類器,以預測已處理文本的特征,這里使用線性探測分類器對靜態token進行錯誤檢測。

      作者認為,現有方法忽略了一個關鍵的細節:用于錯誤檢測token的選擇。

      研究者通常只關注最后生成的token或取平均值,然而,由于LLM一般會生成長格式響應,這種做法可能會錯過重要的部分。

      本文中,作者關注表示確切答案的token(EXACT ANSWER TOKENS),它代表了生成的響應中最有意義的部分。

      這里將EXACT ANSWER TOKENS定義為,如果修改則會改變答案正確性的token。

      實踐中,作者使用設置好的instruct模型代勞,來提取確切答案。之后,通過簡單的搜索過程確定對應的token。

      重點關注4個特定token:第一個確切答案的token及其前一個token、最后一個確切答案token及其后一個token。

      作者廣泛分析了層和token選擇對分類器的激活提取的影響,通過系統地探測模型的所有層,從最后一個問題token開始,一直到最終生成的token。

      上圖顯示了Mistral-7b-Struct中各個層和token關于探測的AUC指標。雖然一些數據集似乎更容易進行錯誤預測,但所有數據集都表現出一致的真實性編碼模式,中后期層通常會產生最有效的探測結果。

      通過比較使用和不使用EXACT ANSWER TOKENS的性能,來評估各種錯誤檢測方法,上表展示了三個代表性數據集上的AUC。

      不同任務中的泛化

      了解錯誤檢測器在不同任務中的泛化能力,對于實際應用程序至關重要。

      上圖(a)顯示了Mistral-7b-instruct的泛化結果,大于0.5的值表示泛化成功。乍一看,大多數熱圖值超過了0.5,似乎任務之間存在一定程度的泛化。

      然而事實上,大部分性能可以通過基于logit的真度檢測來實現。圖(b)顯示了從最強的基于Logit的基線(Logit-min-exact)中減去結果后的相同熱圖。

      這表示檢測器的泛化程度很少超過僅依賴Logit所能達到的效果。所以,泛化并不源于真實性的內部編碼,而是反映了已經通過logits等外部特征訪問的信息。

      經過訓練的探測分類器可以預測錯誤,但其泛化能力只發生在需要相似技能的任務(如事實檢索)中。

      對于涉及不同技能的任務,例如情感分析,探測分類器與基于logit的不確定性預測器效果差不多。

      錯誤類型研究

      在確定了錯誤檢測的局限性,并研究了不同任務的錯誤編碼有何不同之后,作者深入研究了單個任務中的錯誤,根據模型對重復樣本的響應對其錯誤進行分類。

      比如,持續生成的相同錯誤與偶爾生成的錯誤屬于不同類別。

      研究人員在T = 30的溫度設置下,對數據集中的每個樣本進行采樣,然后分析答案的結果分布。

      上圖展示了三種代表性的錯誤類型:

      圖(4a)中,模型通常會給出正確的答案,但偶爾會出錯,這意味著存在正確的信息,但采樣可能會導致錯誤。

      圖(4b)中,模型經常犯同樣的錯誤,但仍保留了一些知識。

      圖(4c)中,模型生成了大量錯誤的答案,整體置信度較低。

      分類的標準有三個:生成的不同答案的數量,正確答案的頻率,以及最常見的錯誤答案的頻率。

      上表顯示了所有模型的測試集結果。結果表明,可以從貪婪解碼的中間表示中預測錯誤類型。

      檢測正確答案

      模型的這種內部真實性如何在響應生成過程中與其外部行為保持一致?

      作者使用經過錯誤檢測訓練的探測器,從同一問題的30個響應中選擇一個答案,根據所選答案衡量模型的準確性。

      如果這種準確性與傳統解碼方法(如貪婪解碼)沒有顯著差異,則表明LLM的真實性內部表示與其外部行為一致。

      實驗在TriviaQA、Winobias和Math上進行,選擇probe評估的正確性概率最高的答案。這里比較了三個基線:貪婪解碼;從30個候選答案中隨機選擇;選擇生成的最頻繁的答案。

      結果如上圖所示,總體而言,使用探針選擇答案可以提高LLM所有檢查任務的準確性。但是,改進的程度因錯誤類型而異。

      探針可以有效地識別正確答案的事實表明,LLM的內部編碼與其外部行為之間存在重大脫節:即使模型編碼了哪個答案是正確的信息,它在實踐中仍然可能生成錯誤的答案。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    欧美日韩电影在线播放| 美女视频黄频大全不卡视频在线播放| 欧美精品久久久久| 欧美日韩日本网| 国产成人综合网站| 91精品导航| 林ゆな中文字幕一区二区| 伊人福利在线| 亚洲精品久久久久中文字幕欢迎你| 日韩欧美午夜| 超碰一区二区| 成人免费va视频| 91女厕偷拍女厕偷拍高清| 亚洲伊人网站| 日本乱码一区二区三区不卡| 一区二区三区久久久| 欧美精品一区二区三区久久| 国产无人区一区二区三区| 日韩综合中文字幕| 日韩激情中文字幕| 好吊视频一区二区三区四区| 91国内外精品自在线播放| 日韩av在线免费播放| 亚洲一区二区av电影| 97在线视频精品| 国产日韩欧美在线观看| 欧美俄罗斯性视频| 国产精品免费一区二区三区都可以| 日本一区二区三区四区| 久久人人超碰精品| 日韩成人精品一区二区| 无遮挡亚洲一区| 国产视频亚洲| 国产成人综合自拍| 亚洲电影免费观看高清完整版在线| 欧美18视频| 国产清纯美女被跳蛋高潮一区二区久久w| 欧美一区二区三区在线观看免费| 国产又爽又黄的激情精品视频| 午夜亚洲影视| 国产精品v欧美精品v日韩| 亚洲国产天堂久久国产91| 精品大片一区二区| 国产精品久久二区二区| 成人午夜电影小说| 成人av网站免费观看| 成人国产综合| 一色桃子久久精品亚洲| 天堂网在线最新版www中文网| 综合日韩在线| 久久男人av| 中文av一区特黄| 91美女片黄在线| 国产视频在线观看一区二区| 欧美日韩国产一级| 欧美成人伊人久久综合网| 国产91精品黑色丝袜高跟鞋| 欧美亚洲尤物久久| 久久综合九九| 亚洲视频欧美视频| 97av在线视频免费播放| 久久久久久久一区二区三区| 久久av一区| 日韩av在线免费播放| 欧美第一黄网| 日韩av一区二区在线影视| 99久热re在线精品996热视频| youjizz国产精品| 欧美成人dvd在线视频| 91沈先生在线观看| 日韩精品电影在线| 亚洲高清资源| 黄色aa久久| 综合久久成人| 自拍一区在线观看| 欧美日韩久久久久| 国模精品娜娜一二三区| 成人a免费视频| 四虎地址8848精品| 裸体一区二区三区| 尤物网精品视频| 狠狠色2019综合网| 麻豆视频网站在线观看| 91成人免费在线视频| 国产伦子伦对白在线播放观看| 欧美mv日韩mv国产网站| 成人激情久久| 日本欧洲国产一区二区| 91禁外国网站| 亚洲最新视频在线| 欧美高清自拍一区| 99精品视频免费观看| 欧美成人一区二区| 国产精品视频自拍| 国产精品入口福利| 精品精品国产三级a∨在线| 久久国际精品| 精品日韩一区二区三区免费视频| jizzjizz亚洲| 男人和女人做事情在线视频网站免费观看| 在线观看日产精品| 色老头在线一区二区三区| av毛片精品| 欧美一级在线| 欧美三级精品| 欧美丝袜丝交足nylons| 亚洲成人一区二区三区| 亚洲视频一区二区| 欧美成人第一区| 秋霞成人午夜伦在线观看| 亚洲一区二区三区免费在线观看| 日韩久久精品成人| 在线一区二区三区四区五区| 欧美久久久久免费| 日韩av免费电影| 欧美丝袜丝交足nylons172| 91精品国产色综合| 欧美性猛交xxxx黑人交| 欧洲视频一区| 色吧亚洲日本| www视频在线看| 国产精品99久久久久久www| 亚洲激情图片小说视频| 欧美va在线观看| 668精品在线视频| 欧美日韩亚洲一区二区三区在线观看| 成人国产亚洲欧美成人综合网| 日本一区二区三区电影免费观看| 免费av网站在线看| 亚洲人成毛片在线播放| 亚洲一区二区三区视频播放| 欧美一区二区三区精美影视| 毛片精品免费在线观看| 亚洲国产精品福利| 国产麻豆一区二区三区| 亚洲大奶少妇| 美女国产精品久久久| 一二三区精品视频| 日韩手机在线导航| 伊人久久大香线蕉av一区二区| 国产成+人+综合+亚洲欧美| 黑人巨大精品欧美一区二区桃花岛| 成人三级网址| 好吊色欧美一区二区三区视频| 色婷婷综合久久久久久| 亚洲国产欧美国产综合一区| 在线xxxx| 欧美精品久久久久| 成人国产精品免费观看动漫| 国产探花一区二区| 欧美视频在线观看一区| 老牛国内精品亚洲成av人片| 亚洲黄色www| 成人免费黄色在线| 日本成人看片网址| 人人精品亚洲| 欧美欧美黄在线二区| 蜜臀av亚洲一区中文字幕| 一本一道久久a久久精品综合蜜臀| 91精品国产91久久综合| 99久久综合狠狠综合久久止| 精品国产免费人成电影在线观看四季| 香蕉久久久久久| 精品视频国产|