国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

最新新聞：

解鎖2026世界杯觀賽“新姿勢”，聯想AI平板攜天禧AI 3.5打造掌上沉浸主場聯想motoX70Air云上舞白冰鉆限定版AI手機即將上市自帶14顆手工精鑲冰鉆超奢華只有紅魔還在做24+1TB 姜超：成本暴增友商一臺都沒有英特爾®至強® D處理器：賦能智能網卡，破解算力-網絡協同瓶頸豐田全新超跑GR GT發布：配641馬力大V8 商家仿冒心系天下W26 老機當新機賣！中國電信回應告別“人海戰術”！陳天橋：未來公司值多少錢，不看人數看“認知”“卷”不動了？讓AI銷售團隊替你卷！百度商家智能體升級片來了卡薩帝冰箱亮相廣州設計周亞馬遜云科技推出Amazon Graviton5----迄今性能最強、能效最高的自研CPU 第八屆“綻放杯”圓滿落幕，華為助力千行百業5G應用“全面綻放”機構：2025年第三季度中國PC市場同比增長2%火山引擎發布豆包語音識別模型2.0提升多語種識別精度現代汽車推出 AI 驅動的 MobED 機器人，2026年上市 Vidu發布 Q2“生圖全家桶”:4K 生圖 + 圖像編輯 + 圖轉視頻，全都免費用中國新勢力首家！理想汽車累計交付突破150萬輛瑞典Oceanbird Wing 560翼帆開放訂購，2026量產在即，加速布局中國市場賦能綠色航運億邦智庫第七次《產業互聯網發展報告》重磅發布一加Ace 6T首銷10分鐘賣爆！打破今年同檔機型全天銷售紀錄魯大師11月電動兩輪車榜：潮玩思路重塑市場，九號領跑智能化

首頁 > 云計算頻道 > 大模型

谷歌發布可讀屏AI模型ScreenAI：可理解用戶界面和信息圖表

2024年03月05日 09:35:26 來源：新智元公眾號

　　每個人想要的大模型，是真·智能的那種......

　　這不，谷歌團隊就做出來了一個強大的「讀屏」AI。

　　研究人員將其稱為ScreenAI，是一種理解用戶界面和信息圖表的全新視覺語言模型。

　　論文地址：https://arxiv.org/pdf/2402.04615.pdf

　　ScreenAI的核心是一種新的屏幕截圖文本表示方法，可以識別UI元素的類型和位置。

　　值得一提的是，研究人員使用谷歌語言模型PaLM 2-S生成了合成訓練數據，以訓練模型回答關屏幕信息、屏幕導航和屏幕內容摘要的問題。

　　舉個栗子，比如打開一音樂APP頁面，可以詢問「有幾首歌時長少于30秒」?

　　ScreenAI便給出了簡單的答案：1。

　　再比如命令ScreenAI打開菜單，就可以選中。

　　架構靈感來源——PaLI

　　圖1中展示了ScreenAI模型架構。研究人員受到了PaLI系列模型架構(由一個多模態編碼器塊組成)的啟發。

　　該編碼器塊包含一個類似ViT的視覺編碼器和一個消費圖像(consuming image)和文本輸入的mT5語言編碼器，后接一個自回歸解碼器。

　　輸入圖像通過視覺編碼器轉化為一系列嵌入，這些嵌入與輸入文本嵌入結合，一起輸入mT5語言編碼器。

　　編碼器的輸出傳遞給解碼器，生成文本輸出。

　　這種泛化公式能夠使用相同的模型架構，解決各種視覺和多模態任務。這些任務可以重新表述為文本+圖像(輸入)到文本(輸出)的問題。

　　與文本輸入相比，圖像嵌入構成了多模態編碼器輸入長度的重要部分。

　　簡而言之，該模型采用圖像編碼器和語言編碼器提取圖像與文本特征，將二者融合后輸入解碼器生成文本。

　　這種構建方式可以廣泛適用于圖像理解等多模態任務。

　　另外，研究人員還進一步擴展了PaLI的編碼器-解碼器架構，以接受各種圖像分塊模式。

　　原始的PaLI架構只接受固定網格模式的圖像塊來處理輸入圖像。然而，研究人員在屏幕相關領域遇到的數據，跨越了各種各樣的分辨率和寬高比。

　　為了使單個模型能夠適應所有屏幕形狀，有必要使用一種適用于各種形狀圖像的分塊策略。

　　為此，谷歌團隊借鑒了Pix2Struct中引入的一種技術，允許根據輸入圖像形狀和預定義的最大塊數，生成任意網格形狀的圖像塊，如圖1所示。

　　這樣能夠適應各種格式和寬高比的輸入圖像，而無需對圖像進行填充或拉伸以固定其形狀，從而使模型更通用，能夠同時處理移動設備(即縱向)和臺式機(即橫向)的圖像格式。

　　模型配置

　　研究人員訓練了3種不同大小的模型，包含670M、2B和5B參數。

　　對于670M和2B參數模型，研究人員從視覺編碼器和編碼器-解碼器語言模型的預訓練單峰檢查點開始。

　　對于5B參數模型，從 PaLI-3的多模態預訓練檢查點開始，其中ViT與基于UL2的編碼器-解碼器語言模型一起訓練。

　　表1中可以看到視覺和語言模型之間的參數分布情況。

　　自動數據生成

　　研究人員稱，模型開發的預訓練階段很大程度上，取決于對龐大且多樣化的數據集的訪問。

　　然而手動標注廣泛的數據集是不切實際的，因此谷歌團隊的策略是——自動數據生成。

　　這種方法利用專門的小模型，每個模型都擅長高效且高精度地生成和標記數據。

　　與手動標注相比，這種自動化方法不僅高效且可擴展，而且還確保了一定程度的數據多樣性和復雜性。

　　第一步是讓模型全面了解文本元素、各種屏幕組件及其整體結構和層次結構。這種基礎理解對于模型準確解釋各種用戶界面并與之交互的能力至關重要。

　　這里，研究人員通過爬蟲應用程序和網頁，從各種設備(包括臺式機、移動設備和平板電腦)收集了大量屏幕截圖。

　　然后，這些屏幕截圖會使用詳細的標簽進行標注，這些標簽描述了UI 元素、它們的空間關系以及其他描述性信息。

　　此外，為了給預訓練數據注入更大的多樣性，研究人員還利用語言模型的能力，特別是PaLM 2-S分兩個階段生成QA對。

　　首先生成之前描述的屏幕模式。隨后，作者設計一個包含屏幕模式的提示，指導語言模型生成合成數據。

　　經過幾次迭代后，可以確定一個有效生成所需任務的提示，如附錄C所示。

　　為了評估這些生成響應的質量，研究人員對數據的一個子集進行了人工驗證，以確保達到預定的質量要求。

　　該方法在圖2中進行了描述，大大提升預訓練數據集的深度與廣度。

　　通過利用這些模型的自然語言處理能力，結合結構化的屏幕模式，便可以模擬各種用戶交互和情景。

　　兩組不同任務

　　接下來，研究人員為模型定義了兩組不同的任務：一組初始的預訓練任務和一組后續的微調任務。

　　這兩組的區別主要在于兩個方面：

　　- 真實數據的來源：對于微調任務，標記由人類評估者提供或驗證。對于預訓練任務，標記是使用自監督學習方法推斷的或使用其他模型生成的。

　　- 數據集的大�。和ǔｎA訓練任務包含大量的樣本，因此，這些任務用于通過更擴展的一系列步驟來訓練模型。

　　表2顯示所有預訓練任務的摘要。

　　在混合數據中，數據集按其大小按比例加權，每個任務允許的最大權重。

　　將多模態源納入多任務訓練中，從語言處理到視覺理解和網頁內容分析，使模型能夠有效處理不同的場景，并增強其整體多功能性和性能。

　　研究人員在微調期間使用各種任務和基準來估計模型的質量。表3總結了這些基準，包括現有的主要屏幕、信息圖表和文檔理解基準。

　　實驗結果

　　圖4顯示了ScreenAI模型的性能，并將其與各種與屏幕和信息圖形相關的任務上的最新SOT結果進行了比較。

　　可以看到，ScreenAI在不同任務上取得的領先性能。

　　在表4中，研究人員呈現了使用OCR數據的單任務微調結果。

　　對于QA任務，添加OCR可以提高性能(例如Complex ScreenQA、MPDocVQA和InfoVQA上高達4.5%)。

　　然而，使用OCR會稍微增加輸入長度，從而導致整體訓練速度更慢。它還需要在推理時獲取OCR結果。

　　另外，研究人員使用以下模型規模進行了單任務實驗：6.7億參數、20億參數和50億參數。

　　在圖4中可以觀察到，對于所有任務，增加模型規模都可以改進性能，在最大規模下的改進還沒有飽和。

　　對于需要更復雜的視覺文本和算術推理的任務(例如InfoVQA、ChartQA和Complex ScreenQA)，20億參數模型和50億參數模型之間的改進明顯大于6.7億參數模型和20億參數模型。

　　最后，圖5顯示了，對于長寬比>1.0的圖像(橫向模式圖像)，pix2struct分割策略明顯優于固定網格分割。

　　對于縱向模式圖像，趨勢相反，但固定網格分割僅稍微好一些。

　　鑒于研究人員希望ScreenAI模型能夠在不同長寬比的圖像上使用，因此選擇使用pix2struct分割策略。

　　谷歌研究人員表示，ScreenAI模型還需要在一些任務上進行更多研究，以縮小與GPT-4和Gemini等更大模型的差距。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評，目前站內累計模型數超過80萬個，涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景，基本覆蓋所有主流創作風格。

realme新機首曝，預計為真我15 Pro《權力的游戲》限定版

榮耀500系列正式發布 2699元起

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

9月9日，國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場，1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

9月24日，華為坤靈召開“智能體驗，一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機，分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告，2025年第二季度》顯示，上半年全球智能家居清潔機器人市場出貨1,2萬臺，同比增長33%，顯示出品類強勁的市場需求。

專題

禮儀主持_商業活動模特演藝服務公司
九章智算云Alaya NeW Cloud 2.0發布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關于我單位網站被仿冒一

返回主頁 ┊ 關于我們 ┊ 內容聯系 ┊ 聯系我們 ┊ 免責聲明 ┊ 原創新聞 ┊ 門戶版

Copyright www.zxwl-tech.com 中文科技資訊 2009-2025 all rights reserved 網站聯系微信 xishuinet

關鍵詞：CITNews|Citnews中文科技資訊|中文科技資訊網|科技資訊網|中國科技資訊|中國科技新聞網|中國科技資訊網|快科技|新科技|中文科技數碼頭條號|中文移動新媒體

京ICP備18037198號-1 京公網安備 11010502041587號

国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
亚洲精品第一国产综合精品| 日韩av中文在线观看| 国产一区二区三区日韩欧美| 亚洲成人18| 懂色av一区二区三区免费看| 欧洲精品亚洲精品| 亚洲网站在线播放| 精品视频免费| av色综合久久天堂av综合| 欧美精品videos性欧美| 性欧美暴力猛交69hd| 制服丝袜在线91| 成人午夜大片免费观看| 午夜精品美女自拍福到在线| 亚洲大胆av| 国产三级精品三级| 亚洲第一在线| 精品美女久久久久久免费| 欧美国产97人人爽人人喊| 欧美高清自拍一区| 激情不卡一区二区三区视频在线| 色综合久久综合网欧美综合网| 亚洲男人天堂2024| 性欧美亚洲xxxx乳在线观看| 都市激情久久久久久久久久久| 竹内纱里奈兽皇系列在线观看| 欧美成人精品二区三区99精品| 国产精品美女主播| 日韩精品一区在线| 亚洲欧美一区二区在线观看| 91精品国产色综合久久不卡98口| 国产精品久久久久久久免费观看| 欧洲中文字幕国产精品| 91高清在线观看视频| 亚洲日本在线天堂| 九色porny自拍视频在线观看| 精品久久久久久久久久久久久久久| 在线免费观看的av网站| 亚洲h在线观看| 国产欧美一区二区三区不卡高清| 狠狠色香婷婷久久亚洲精品| 国产精品15p| 久久青草免费| 国产精品一区二区久久久| 中文字幕人成人乱码| 国产真实乱子伦精品视频| 国产精品手机在线| 国产精品久久久一区麻豆最新章节| 妖精一区二区三区精品视频| 亚洲免费av网址| 中文成人综合网| 国产高清一区日本| 围产精品久久久久久久| 看片一区二区| 一区二区成人av| 大陆成人av片| 日本在线免费网| 揄拍成人国产精品视频| 欧美艳星kaydenkross| 9999精品| 国产一区玩具在线观看| 亚洲国产成人爱av在线播放| 狠狠干一区二区| 日本精品一区二区三区在线| 欧美精品欧美精品系列c| 喷水一区二区三区| 久久久久久久久久久av| 国模大胆一区二区三区| 一二三四区精品视频| 日韩有吗在线观看| 免费成人av在线播放| 国产成人在线视频免费观看| 亚洲免费观看高清| 26uuu亚洲国产精品| 日本免费在线视频| 国产精品青青在线观看爽香蕉| 国产v综合v亚洲欧| 伊人免费在线| 欧美日韩亚洲高清一区二区| 播放一区二区| 国产精品稀缺呦系列在线| 亚洲精品在线视频| 一本色道精品久久一区二区三区| 精品欠久久久中文字幕加勒比| 日本精品一区二区三区在线| 99久久精品免费观看| 日韩精品不卡一区二区| 欧美成a人免费观看久久| 亚洲精品中文在线影院| 动漫3d精品一区二区三区乱码| 国产伦精品一区二区三区免费| 亚洲国产精品一区二区www在线| 奇米精品一区二区三区在线观看| 国产精品日日做人人爱| 91蝌蚪porny成人天涯| 成人精品小蝌蚪| 日韩中字在线| 国产精品成人一区二区| 欧美视频在线视频| 亚洲欧美制服丝袜| 视频在线一区二区三区| 久久综合五月天| 亚洲一区资源| 污污的视频在线观看| 国产亚洲欧美在线| 久久99久久人婷婷精品综合| 久久五月天色综合| 精品国产午夜肉伦伦影院| 国产自摸综合网| 久久aⅴ乱码一区二区三区| 999久久久亚洲| 唐人社导航福利精品| 欧美a级在线| 国产精品原创巨作av| 亚洲色诱最新| 久久aⅴ乱码一区二区三区| 日本在线观看www| 久久久中文字幕| 国产成人av毛片| 亚洲国产精品视频在线观看| 亚洲女人被黑人巨大进入| 91超碰国产精品| 国产精品一区二区中文字幕| 伊人春色在线观看| 成年人在线网站| 久久免费成人精品视频| 中文字幕中文字幕在线一区| 91麻豆精品国产91久久久久久| avtt亚洲| 日韩久久精品电影| 中日韩美女免费视频网站在线观看| 欧美一二三区精品| 亚洲高清在线观看| 日本成人不卡| 在线免费观看羞羞视频一区二区| 亚洲综合激情网| 中文字幕少妇一区二区三区| 亚洲老司机av| 日韩激情第一页| 亚洲精品免费看| caoporn成人| 亚洲天堂av在线免费观看| 黑色丝袜福利片av久久| 欧美精品1区2区| 色婷婷精品久久二区二区蜜臂av| 久久久久久九九| 亚洲婷婷噜噜| 国产精品1024久久| 欧美电影h版| 国产成人福利网站| 日韩一区二区三区色| 久久精品最新地址| 国产精品你懂的| 亚洲成av人影院| 成人看的羞羞网站| 精品国产一区二区在线| 日本中文一区二区三区| 91久久精品国产91性色tv| 亚洲柠檬福利资源导航| 中文字幕亚洲二区| 亚洲一区二区久久久久久久| 成人黄色小视频在线观看| 亚洲成在线观看| 欧美色一级片|