国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

解鎖2026世界杯觀賽“新姿勢”,聯想AI平板攜天禧AI 3.5打造掌上沉浸主場聯想motoX70Air云上舞白冰鉆限定版AI手機即將上市 自帶14顆手工精鑲冰鉆 超奢華只有紅魔還在做24+1TB 姜超:成本暴增 友商一臺都沒有英特爾®至強® D處理器:賦能智能網卡,破解算力-網絡協同瓶頸豐田全新超跑GR GT發布:配641馬力大V8商家仿冒心系天下W26 老機當新機賣!中國電信回應告別“人海戰術”!陳天橋:未來公司值多少錢,不看人數看“認知”“卷”不動了?讓AI銷售團隊替你卷!百度商家智能體升級片來了卡薩帝冰箱亮相廣州設計周亞馬遜云科技推出Amazon Graviton5----迄今性能最強、能效最高的自研CPU第八屆“綻放杯”圓滿落幕,華為助力千行百業5G應用“全面綻放”機構:2025年第三季度中國PC市場同比增長2%火山引擎發布豆包語音識別模型2.0提升多語種識別精度現代汽車推出 AI 驅動的 MobED 機器人,2026年上市Vidu發布 Q2“生圖全家桶”:4K 生圖 + 圖像編輯 + 圖轉視頻,全都免費用中國新勢力首家!理想汽車累計交付突破150萬輛瑞典Oceanbird Wing 560翼帆開放訂購,2026量產在即,加速布局中國市場賦能綠色航運億邦智庫第七次《產業互聯網發展報告》重磅發布一加Ace 6T首銷10分鐘賣爆!打破今年同檔機型全天銷售紀錄魯大師11月電動兩輪車榜:潮玩思路重塑市場,九號領跑智能化
  • 首頁 > 云計算頻道 > 大模型

    研究發現,GPT 和其他AI模型無法分析SEC備案文件

    2023年12月20日 20:17:09 來源:站長之家

      一家名為 Patronus AI 的初創公司的研究人員發現,大型語言模型在分析美國證券交易委員會(SEC)備案文件時經常無法正確回答問題。即使是表現最佳的人工智能模型配置 OpenAI 的GPT-4-Turbo,當給予幾乎整個備案文件的閱讀能力和相關問題時,僅有79% 的問題回答正確。Patronus AI 的創始人告訴 CNBC,這些所謂的大型語言模型有時會拒絕回答問題,或者會 “產生幻覺”,出現備案文件中不存在的數字和事實。

      Patronus AI 的聯合創始人 Anand Kannappan 表示:“這種性能水平完全不能接受。要想實現自動化和投入生產使用,性能必須更高。” 這些發現凸顯了 AI 模型在大公司中應用的一些挑戰,尤其是在金融等受監管行業。這些公司希望將先進技術應用于客戶服務或研究,但 AI 模型面臨一些困難。

      快速提取重要數字并對財務陳述進行分析被認為是聊天機器人最有前景的應用之一,自去年底發布 ChatGPT 以來一直備受關注。SEC 備案文件中充滿著重要的數據,如果一個機器人能夠準確地概括這些文件或快速回答相關問題,它可以使用戶在競爭激烈的金融行業中占據優勢。

      在過去的一年里,彭博社開發了自己的金融數據 AI 模型,商學院教授研究了 ChatGPT 是否可以解析財經頭條新聞,摩根大通正在開發一個基于 AI 的自動投資工具。根據 CNBC 之前的報道,生成式 AI 預計每年可以為銀行業帶來數萬億美元的收益。

      然而,GPT 進入該行業并不順利。微軟首次推出使用 OpenAI 的 GPT 的必應聊天時,其主要示例之一是使用聊天機器人快速概述盈利新聞稿。觀察人員很快就意識到微軟示例中的數字是錯誤的,一些數字完全是虛構的。

      Patronus AI 的聯合創始人表示,將大型語言模型應用于實際產品的挑戰之一是,它們是非確定性的,不能保證每次給出相同的輸出。這意味著公司需要進行更嚴格的測試,以確保它們的模型運行正確,不會偏離主題,并提供可靠的結果。

      該公司的創始人在 Facebook 的母公司 Meta 公司相識,他們在該公司從事與理解模型生成答案的問題以及使其更加 “負責任” 方面的 AI 問題。他們成立了 Patronus AI,該公司已從 Lightspeed Venture Partners 獲得種子資金,旨在通過軟件實現對大型語言模型的自動化測試,以便公司可以確保其 AI 機器人不會以離題或錯誤的答案令客戶或員工感到驚訝。

      Patronus AI 致力于編寫一套由主要上市公司的 SEC 備案文件中提取的10,000多個問題和答案,該數據集被稱為 FinanceBench。數據集包括正確答案,以及在任何給定備案文件中準確查找答案的位置。并非所有答案都可以直接從文本中提取,有些問題需要輕微的數學或推理。

      Patronus AI 測試了四個語言模型:OpenAI 的 GPT-4和 GPT-4-Turbo,Anthropic 的 Claude2和 Meta 的 Llama2,使用該公司生成的150個問題的子集進行測試。他們還測試了不同的配置和提示方式,例如將 OpenAI 模型在問題中給出與答案相關的確切源文本的 “Oracle” 模式。在其他測試中,模型被告知底層 SEC 文件存儲的位置,或者在提示中包含 “長上下文”,即幾乎完整的 SEC 備案文件與問題一起提供。

      GPT-4-Turbo 在該公司的 “閉卷” 測試中失敗,該測試不允許其訪問任何 SEC 源文件。它在被問到的150個問題中,未能回答88% 的問題,只有14次給出了正確答案。當獲得對底層備案文件的訪問權限時,其性能有了顯著改善。在 “Oracle” 模式下,GPT-4-Turbo 在85% 的情況下正確回答問題,但仍然在15% 的情況下給出了錯誤答案。然而,這種測試方式并不現實,因為它需要人工輸入以找到備案文件中確切的相關位置,而這正是許多人希望語言模型能夠解決的問題。

      Meta 開發的開源 AI 模型 Llama2在獲得各種底層文件的訪問權限時,產生了一些最糟糕的 “幻覺”,錯誤回答的比例高達70%,僅有19% 的回答正確。Anthropic 的 Claude2在提供 “長上下文” 的情況下表現良好,可以回答75% 的問題,21% 的回答錯誤,僅有3% 的問題未能回答。GPT-4-Turbo 在長上下文測試中表現也不錯,79% 的問題回答正確,17% 的回答錯誤。

      在進行測試后,Patronus AI 的創始人對模型的表現感到驚訝,即使在指導答案所在位置的情況下,它們的表現仍然很差。“即使答案在上下文中,模型拒絕回答的頻率也非常高,而人類是可以回答的。”Qian 說道。然而,即使模型表現良好,仍然不夠好,Patronus AI 發現。“即使模型在20次中回答錯誤1次,這個錯誤率對于受監管的行業來說仍然不可接受。”Qian 說道。

      然而,Patronus AI 的創始人認為,像 GPT 這樣的語言模型在金融行業中有巨大的潛力,無論是分析師還是投資者,如果 AI 技術繼續改進。“我們確實認為結果可能非常有希望。”Kannappan 表示,“隨著時間的推移,模型將會變得更好。我們非常有希望在長期內,很多工作可以實現自動化。但是現在,你肯定需要至少一個人參與來支持和引導你的工作流程。”

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    欧美日韩在线视频免费观看| 日本欧美韩国国产| 青青国产91久久久久久| 亚洲黄网站黄| 午夜天堂影视香蕉久久| 天海翼精品一区二区三区| 精品一区日韩成人| 日韩欧美在线视频免费观看| 国产在线观看精品一区二区三区| 国产精品成人免费电影| 91福利视频在线| 仙踪林久久久久久久999| 欧美gvvideo网站| 伊人伊成久久人综合网小说| 久久亚洲不卡| 先锋影音欧美| 91麻豆精品91久久久久久清纯| 亚洲欧美另类中文字幕| 国产一区二区三区直播精品电影| 国产婷婷色一区二区三区| 2001个疯子在线观看| 欧美日韩岛国| 性感美女久久精品| 欧美性videosxxxxx| 色橹橹欧美在线观看视频高清| 欧美日韩免费观看中文| 亚洲精品影片| 一区二区电影在线观看| 欧美男人天堂| 99视频在线免费观看| 成人中文在线| 亚洲精品天堂| 成人影视在线播放| 日韩欧美电影| 欧美1级日本1级| 久久亚洲精品爱爱| 免费短视频成人日韩| 日韩一区二区三区免费视频| caoporn国产一区二区| 国产视频精品xxxx| 欧美日韩国产经典色站一区二区三区| 亚洲专区中文字幕| 亚洲午夜精品一区二区国产| 日韩在线不卡视频| 亚洲国产精品久久精品怡红院| 欧美日韩免费不卡视频一区二区三区| 国产精品久久久久无码av| 久久婷婷久久一区二区三区| 污视频网站免费在线观看| 成人深夜直播免费观看| 91婷婷韩国欧美一区二区| 亚洲最新视频在线观看| 都市激情久久| 国产精品第一| 欧美韩国理论所午夜片917电影| 视频二区不卡| 在线综合亚洲| fc2在线中文字幕| 日韩视频永久免费观看| 国产不卡一二三区| 国产国语videosex另类| 久久gogo国模啪啪裸体| www.日韩精品| 亚洲精品91美女久久久久久久| 成人一区而且| 国产日本欧美视频| 国产视频精品在线| 丝袜a∨在线一区二区三区不卡| 精品少妇一区二区三区日产乱码| 国产精品美女久久久久aⅴ| 久久亚洲一区| 超碰超碰在线| 91精品动漫在线观看| 欧美黄色直播| 亚洲另类图片色| 欧美专区一区二区三区| 精品中文字幕一区二区三区| 2020日本在线视频中文字幕| 欧美特级www| 日韩欧美在线看| 91免费版网站在线观看| 国产精品theporn| 一区二区三区自拍视频| 成年人在线免费观看| 欧美一区二区三区的| 国产免费高清一区| 精品久久久久久最新网址| 欧美老女人性生活| 五月激情久久| caoporen国产精品视频| 相泽南亚洲一区二区在线播放| 影音先锋久久精品| 欧美xxxbbb| 亚洲欧洲美洲一区二区三区| 亚洲福利电影网| 国产精品久久777777毛茸茸| 欧美午夜精品一区| 国产精品88888| 日本高清视频精品| 97色在线观看| 中文字幕欧美在线| 亚洲色图日韩av| 亚洲插插视频| 欧美日韩亚洲高清| 国产精品女主播一区二区三区| 国产成人精品一区二区三区视频| 亚洲欧洲无码一区二区三区| 电影一区二区三区久久免费观看| 久久久久久久久网站| 久久综合导航| 亚洲色图插插| 成人午夜电影在线播放| 欧美巨大另类极品videosbest| 国产一区二区视频在线看| 日韩国产一区二| 欧美1级2级| 久久一二三区| 国产伦精品一区二区三区视频| 一本久久a久久免费精品不卡| 成人免费一区二区三区在线观看| 51国偷自产一区二区三区的来源| 亚洲一区二区综合| 精品国产乱码久久久久软件| 91超碰在线免费| 亚洲久久久久久久久久久| 亚洲色欲色欲www| 久久久久久久久免费| 久久动漫网址| 欧美一区免费视频| 51精品视频一区二区三区| 少妇视频一区| 午夜免费久久久久| 欧美资源在线| 国产视频一区不卡| 一本色道久久综合亚洲精品按摩| a级毛片免费观看在线| 日韩综合一区| 国产精品美女一区二区在线观看| 欧美亚洲日本网站| re久久精品视频| 欧美一级电影网站| 欧美精品在线播放| 欧美高清在线视频观看不卡| 国产精品a级| 一区二区黄色| 99精品视频免费在线观看| 欧美视频导航| 午夜视频久久久| 日韩小视频在线观看| 国产精品99蜜臀久久不卡二区| 中文av字幕一区| 先锋成人av| 怡红院在线播放| 亚洲一二三区视频在线观看| 国产在线成人| 里番在线观看网站| 国产精品一区二区在线观看网站| 国产一区再线| 国产盗摄视频一区二区三区| 一区二区三区高清| 狠狠色伊人亚洲综合网站色| 欧美精品日日鲁夜夜添| 欧美aⅴ99久久黑人专区| 亚洲精品乱码久久久久久蜜桃91|