国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 云計算頻道 > 大模型

    天工大模型登頂多模態榜單!解決幻覺、跨語言兩大難題

    2023年09月06日 14:20:56 來源:微信公眾號量子位

      本文來自于微信公眾號 量子位 (ID:QbitAI),作者:豐色。

      國產大模型,登頂多模態榜單!

      昆侖萬維最近在大模型圈可謂“風生水起”。

      幾天前剛被曝挖來了AI大牛顏水成,出任天工智能聯席CEO。

      現在,其「天工」大模型Skywork-MM又登頂多模態榜單,在騰訊優圖實驗室聯合廈門大學開展的多模態大語言模型(Multimodal Large Language Model,簡稱“MLLM”)測評中,綜合得分排名第一。

      騰訊優圖實驗室聯合廈門大學在新建的評測基準MME上首次對全球范圍內MLLM模型進行了全面定量評測并公布了16個排行榜,包含感知、認知兩個總榜單以及14個子榜單。

      MME數據集是一個最近發布的多模態語言模型測評基準。

      它通過大型多模態語言模型在涵蓋感知和認知任務的14個子任務上的表現來全面評估模型。

      而Skywork-MM只用了不到50M的圖文數據——遠小于其他大模型(>100M),拿下了第一(榜單地址見文末)。

      如何做到?

      主要是解決了現有多模態大模型中頗為困擾的兩大問題:

      幻覺和較弱的跨語言能力。 多模態兩大難

      所謂幻覺,是指多模態大模型在回答問題時,傾向于肯定的答案,即使我們所給的問題中根本沒有相關特征。

      例如面對下面這張圖像。

      如果問它“這個男人的頭發是什么顏色?”,即使優秀如LLaVA、MiniGPT-4等多模態大模型,也會“睜著眼說瞎話”:黑色。

      再如這張圖片:一個玻璃杯、一個茶杯、一個浴缸里面有條小金魚。

      如果問它“圖片中的所有物品都是黃色的嗎?”,沒有誰能答對。

      至于跨語言能力問題,主要表現在應對中文場景中的問題回答不盡如人意。

      比如辨認下面這張圖片是“科羅拉多大峽谷還是蘇州園林”時,3個雙語多模態語言模型:LLaVA、 LLaVA-Chinese、ImageBind-LLm全部回答成前者。

      問它們從哪里能觀賞到該景色,就更是一言難盡了。

      甚至有時,模型還會直接回復純英文。

      這兩大問題嚴重影響著現有多模態大模型的性能。

      怎么解決? 三方面入手

      昆侖萬維天工大模型Skywork-MM從分別從數據、模型和訓練流程三方面入手。

      其中重點是數據和模型。

      先看數據。

      首先對于幻覺問題。

      從本質出發,該問題主要是整個模型訓練過程中使用的數據太偏重正樣本。

      也就是說,模型描述的都是圖片中有什么,而沒有學習圖片中沒有什么。

      如果訓練過程中再碰上弱相關的圖文數據,模型就更加放飛聯想、形成較嚴重的幻覺。

      為此,天工大模型多模態團隊提出以圖像為中心,喂給模型既包含正樣本也包含負樣本的多模態指令微調數據:

      這使得模型既能夠學習一張圖像中存在的視覺特征,也能學習到不存在的特征。

      這樣,模型的指令跟隨能力便得到增強:問什么答什么,沒有的也不胡編。

      其次,對于跨語言中的中文問題,一共有兩個解決思路:

      (1)增強中文的指令追隨能力。

      由于“微調指令的文化gap很小”,只需將上面解決幻覺問題中構造的英文指令微調數據翻譯成中文使用。

      (2)增強中文相關場景的識別能力。

      需要注意的是,在解決跨語言問題時,我們重點關注的點是文化偏差——

      即通用的視覺特征和語言特征可以通過共有的語料進行關聯,但是各個語言文化中專有的視覺特征和語言特征的關聯需要大量特殊學習。

      因此我們需要加入大規模的中文圖像-文本對數據。

      不過,這樣的中文語料并不好收集,一是囿于數據質量,而是困于數量。

      怎么辦?

      引出Skywork-MM在模型架構上的改進。

      為了不讓低質量的圖文數據影響模型效果,天工大模型多模態團隊在設計上選擇將視覺模型和大語言模型完全凍結。

      這樣做的目的是保持視覺模型在前置CLIP訓練中學習到的視覺特征不損失,以及大語言模型的語言能力不損失。

      同時,為了更好的關聯不同文化環境中的視覺特征和語言特征,模型整體包含了一個可學習的視覺特征采樣器和語言模型的LoRA適配器。

      如下圖所示,Skywork-MM一共包含四大模塊:

      給定一張圖像,LVM先提取圖像特征,然后將圖像特征輸入到重采樣器中,計算出可為LLM輸入的token。

      LLM接收token和指令提示(如果有),然后輸出圖像描述或對問題的回答。

      至于訓練流程,主要分為兩階段:

      第一階段使用雙語的大規模圖文對數據進行圖像概念和語言概念的關聯學習。

      第二階段使用多模態微調數據進行指令微調。

      此時,各種類型的指令微調數據(包括正樣本和負樣本)就組成統一的Chat Prompt形式。

      Ps. 上圖中的重采樣器和LoRA適配器標記了火焰,它們是可訓練的。 登頂MME綜合榜單

      如下表所示,Skywork-MM一共用了大約50M圖文數據,這比當前的同類大模型都要少得多。

      但經過以上數據、模型和訓練流程三方面的改進,Skywork-MM效果拔群。

      如下圖所示:

      它能夠準確理解圖片中的反常行為;

      也能聽明白一些特殊的指令(根據選項回答問題,根據風景寫詩,寫廣告詞,寫獲獎感言等等);

      對于中文場景問題,表現得也不再像個“歪果仁”了。

      可謂擁有了良好的指令跟隨和中文場景問答能力。

      因此像第一段展示的那些幻覺和跨語言問題,它完全可以信手拈來:

      孟非沒有頭發就沒有,不會說成黑色;蘇州園林、非誠勿擾節目一眼認出;三個物體沒有一個是黃色。

      而如開頭所示,在與其他模型的橫向測試中,Skywork-MM直接榮登MME榜單綜合第一,包括感知榜單第一(且與第二名有著43分的差距)、認知榜單第二。

      這個榜單大約今年6月上線、目前GitHub4k標星,是當前多模態大模型最新的測評基準之一。

      它一共包含14個子任務,其中感知任務除OCR,還包括粗粒度和細粒度對象識別,前者識別對象的存在與否、數量、位置和顏色;后者識別電影海報、名人、場景、地標和藝術品。

      認知任務則包括常識推理、數值計算、文本翻譯和代碼推理。

      下表顯示Skywork-MM在該榜單感知任務中的OCR+粗粒度識別上的具體得分:

      細粒度識別得分:

      以及認知任務得分:

      可以看到,能與Skywork-MM偶爾“平分秋色”的只有MiniGPT-4和BLIP系列。

      而除了MME榜單,Skywork-MM還在另一多模態基準MMBench的開發集上表現出色:

      進步空間

      需要注意的是,盡管昆侖萬維天工大模型這一最新成果,代表了當前多模態大模型的最高水平,但它還是存在很多進步空間。

      例如:

      文化和語言障礙仍然存在,還需要我們開發一種多語言的LVM,更有效地提取不同文化特有的視覺特征,或者再收集更多各語言的大規模、高質量圖像文本對,確保模型準確掌握視覺概念和文本概念的關聯。

      除此之外,目前的成果只建立在較小規模的基礎之上(13B),如果研究更大的多模態模型,我們在使用數據、參數設置、訓練策略等方面可能都需要進一步探索。

      評估基準也還可以更全面,目前MME和MMBench的測試范圍都有限。

      以及從上面的粗粒度感知識別任務榜單來看,現有所有多模態大模型對于根據圖片準確識別物體位置的能力(對實現機器人感知意義重大)都比較欠缺:

      最高的模型得分才33.33,離滿分100還有很大的差距。

      這個缺陷從下圖也可以看出:

      毫無疑問的是,人工智能的未來一定是多模態的。

      以上這些問題說明,我們才剛剛開始探索它真正的潛力。

      然而,我們相信,在一次又一次的榜單排名更迭之中,屬于多模態大模型的“ChatGPT時刻”終將會到來。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    18国产精品| 久久午夜老司机| www.久久精品| 欧美视频第一| 亚洲免费一在线| 国产精品初高中害羞小美女文| 四虎884aa成人精品最新| 91av免费观看91av精品在线| 另类av一区二区| 91影院在线观看| 日韩视频在线一区二区三区| 成人欧美一区二区三区黑人免费| 91免费版网站入口| 日本综合在线| 成人亚洲一区| 欧美一区二区视频在线观看| 欧美激情视频免费观看| 亚洲精品高清国产一线久久| 精品免费在线视频| 一区二区成人在线视频| 欧美风情在线观看| 凹凸成人精品亚洲精品密奴| 欧美极品少妇xxxxⅹ高跟鞋| 亚洲国产精品黑人久久久| 综合久久给合久久狠狠狠97色| 国产视频精品一区二区三区| 精品毛片久久久久久| 国产一区二区三区亚洲综合| 亚洲18私人小影院| 欧美丝袜美腿| 三级亚洲高清视频| 日本特黄久久久高潮| 日韩精品网站| 欧美三级xxx| 国产精品色婷婷视频| 国产香蕉一区二区三区在线视频| 亚洲福利av| 小黄鸭精品aⅴ导航网站入口| 福利成人导航| 国产欧美中文在线| 日韩av电影中文字幕| 欧美性xxxx69| 亚洲第一区第一页| 亚洲欧美日韩国产综合| 午夜伦理福利在线| 男女男精品视频| 91中文字幕一区| 亚洲va韩国va欧美va精品| 亚洲国产成人精品一区二区| 亚洲第一在线综合网站| 久久免费视频网| 色婷婷综合久久| 日韩黄色片在线观看| 精品一区二区电影| 精品国偷自产在线| 偷拍中文亚洲欧美动漫| 三级精品在线观看| 青青影院在线观看| 欧美激情一级片一区二区| 农村少妇一区二区三区四区五区| av文字幕在线观看| 亚洲国产精品第一区二区| 久久成人免费| 国产亚洲高清视频| 一本久久青青| 欧美aa在线视频| 26uuu亚洲国产精品| 中文字幕无线精品亚洲乱码一区| 黄色网址视频在线观看| 欧美一区二区三区免费在线看| 久久精品国产99国产| 欧美色视频在线观看| 久久99性xxx老妇胖精品| 欧美猛男性生活免费| 亚洲欧洲无码一区二区三区| 91精品啪在线观看国产60岁| 久久久久久久久久久亚洲| 一区二区视频在线看| 91性高湖久久久久久久久_久久99| 成人av免费电影| 久久伊人蜜桃av一区二区| 色吧影院999| 精品一卡二卡三卡四卡日本乱码| 欧美r级在线观看| 久久aimee| 国产成人亚洲综合a∨婷婷| 成人午夜激情片| 欧美日韩国产一级片| 999视频精品| 欧美巨大黑人极品精男| 日韩欧美在线观看视频| 中文字幕一区在线观看| 日韩免费电影一区| 国内精品久久久| 麻豆极品一区二区三区| 亚洲制服av| 天天色天天射天天综合网| 欧美午夜网站| 国产精品久久久久久久久久久新郎| 国产99久久精品一区二区| 懂色av一区二区三区| 国产一区久久久| 欧美一级精品| 国产精品第8页| 人成在线免费网站| 国产成人av毛片| 免费国产一区二区| 精品乱人伦一区二区三区| 国产欧美日韩综合一区在线播放| 女同视频在线观看| 久久国产精品久久精品| 女同视频在线观看| 一夜七次郎国产精品亚洲| 欧洲亚洲两性| 91精品国产调教在线观看| 久久亚洲一区二区三区四区五区高| 蜜桃视频在线一区| 久久久水蜜桃av免费网站| 视频91a欧美| 91在线无精精品一区二区| 国产精品视频一区二区三区经| 中文亚洲字幕| 极品尤物一区二区三区| 欧美精品一区二区高清在线观看| 亚洲伦在线观看| 欧美日韩精品是欧美日韩精品| 国产亚洲激情| 精品久久久久久久大神国产| 日韩aⅴ视频一区二区三区| 色一情一区二区三区四区| 亚洲视频在线一区观看| 亚洲国产精品成人va在线观看| 日本亚洲三级在线| 韩国毛片一区二区三区| 91sa在线看| 精品一区二区三区免费毛片爱| 精品亚洲va在线va天堂资源站| 超碰日本道色综合久久综合| 奇米精品一区二区三区四区| 九九精品在线视频| 欧美一区二区色| 最近中文字幕日韩精品| 免费成人在线观看视频| 久久福利视频导航| 日韩成人av网址| 先锋影音久久久| 成人黄色av| www.91精品| 永久免费网站在线| 亚洲国内高清视频| 国产在线不卡一区| 婷婷综合一区| 中文字幕第一区第二区| 久久精品久久久久久| 草莓视频丝瓜在线观看丝瓜18| 成人动漫视频在线观看| 韩国一区二区视频| 日本综合精品一区| 成人黄色免费网站在线观看| 亚洲在线视频| 亚洲一卡久久| 7777女厕盗摄久久久| 男人的天堂成人在线| 91精品国产一区|