国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

解鎖2026世界杯觀賽“新姿勢”,聯想AI平板攜天禧AI 3.5打造掌上沉浸主場聯想motoX70Air云上舞白冰鉆限定版AI手機即將上市 自帶14顆手工精鑲冰鉆 超奢華只有紅魔還在做24+1TB 姜超:成本暴增 友商一臺都沒有英特爾®至強® D處理器:賦能智能網卡,破解算力-網絡協同瓶頸豐田全新超跑GR GT發布:配641馬力大V8商家仿冒心系天下W26 老機當新機賣!中國電信回應告別“人海戰術”!陳天橋:未來公司值多少錢,不看人數看“認知”“卷”不動了?讓AI銷售團隊替你卷!百度商家智能體升級片來了卡薩帝冰箱亮相廣州設計周亞馬遜云科技推出Amazon Graviton5----迄今性能最強、能效最高的自研CPU第八屆“綻放杯”圓滿落幕,華為助力千行百業5G應用“全面綻放”機構:2025年第三季度中國PC市場同比增長2%火山引擎發布豆包語音識別模型2.0提升多語種識別精度現代汽車推出 AI 驅動的 MobED 機器人,2026年上市Vidu發布 Q2“生圖全家桶”:4K 生圖 + 圖像編輯 + 圖轉視頻,全都免費用中國新勢力首家!理想汽車累計交付突破150萬輛瑞典Oceanbird Wing 560翼帆開放訂購,2026量產在即,加速布局中國市場賦能綠色航運億邦智庫第七次《產業互聯網發展報告》重磅發布一加Ace 6T首銷10分鐘賣爆!打破今年同檔機型全天銷售紀錄魯大師11月電動兩輪車榜:潮玩思路重塑市場,九號領跑智能化
  • 首頁 > 云計算頻道 > 大模型

    中文性能反超VLM頂流GPT-4V,阿里Qwen-VL超大杯限免!看圖秒寫編程視覺難題一眼辨出

    2024年01月26日 15:49:48 來源:新智元導讀

      【新智元導讀】多模態大模型將是AI下一個爆點。最近,通義千問VLM模型換新升級,超大杯性能堪比GPT-4V。最最重要的是,還能限時免費用。

      最近,通義千問實火。

      前段時間被網友玩瘋的全民舞王,讓「AI科目三」頻頻登上熱搜。

      讓甄嬛、慈禧、馬斯克、貓主子和兵馬俑能跳舞那款AI,就藏在通義千問APP背后。

      最強國產視覺語言模型了解一下

      就在這幾天,通義千問團隊又對多模態大模型下手了——

      再一次升級通義千問視覺語言模型Qwen-VL,繼Plus版本之后,又推出Max版本。

      Qwen-VL是阿里在2023年8月推出的具備圖文理解能力的大模型,基于通義千問語言模型開發。升級后的Qwen-VL視覺水平大幅提升,對很多圖片的理解水平接近人類。

      并且,還能夠支持百萬像素以上的高清分辨率圖,以及各種極端長寬比的圖片。

      升級版模型限時免費,在通義千問官網和APP都可體驗,API也可免費調用。

      評測結果顯示,Qwen-VL的升級版本在MMMU、MathVista等任務上遠超業界所有開源模型,在文檔分析(DocVQA)、中文圖像相關(MM-Bench-CN)等任務上超越GPT-4V,達到世界最佳水平。

      在第三方權威評測上,Qwen-VL常常與GPT-4V、Gemini攜手占據業界三強,與其他競爭者拉開相當大的差距。

      來源:OpenCompass

      話不多說,小編立馬展開實測。

      多模態基礎能力

      首先,我們直接來了一道難度拉滿的題——一張小編十年前在雪鄉拍的照片。

      Qwen-VL-Max不僅一眼認了出來,而且還配上了一段非常優美的描寫:

      房屋上覆蓋著厚厚的積雪,像是童話里的小木屋。太陽剛剛升起,給雪地和房屋染上了一層溫暖的色彩。遠處的山巒和森林也籠罩在淡黃色的晨光中,整個場景顯得寧靜而祥和。

      而GPT-4V則表示,由于沒有具體的地標,因此無法給出確切的位置。

      接下來,Qwen-VL-Max不僅數對了難倒GPT-4V的「數數幾個葫蘆娃」問題。

      而且還通關了經典的計算機視覺難題——「吉娃娃與松餅」。

      類似的「毛巾卷和沙皮狗」、「柯基屁股與土司」等等,也能順利答出。

      甚至它還可以理解「給吉娃娃套上吐司」這樣惡搞的圖片。

      對于在一張圖里分別辨認多個名人這類問題,Qwen-VL-Max同樣能夠立刻給出正確的回答。

      比如剛剛當選ACM Fellow的圖靈三巨頭。

      以及科技圈的一眾大佬。

      同樣,它也可以精準識別出圖像中的文字,即便是手寫體也不在話下。

      相比之下,GPT-4V卻未能識別對圖中毛筆寫的字,而是給出了「恭賀新禧大吉大利」。

      有趣的是,Qwen-VL-Max還能根據自己對圖像的理解寫詩。

      比如這首根據「權力的游戲」中的名場面作的中文詩,就頗有意境。

      而根據同一個場景作出的英文詩,也很有韻致。

      視覺Agent能力

      除了基礎的描述和識別能力外,Qwen-VL-Max還具備視覺定位能力,可以針對畫面指定區域進行問答。

      比如它能在一群貓貓中準確框出黑貓。

      還能在吉娃娃和松餅中框出吉娃娃。

      我們標出OpenAI聯創Karpathy帖子中的一個圖,問Qwen-VL-Max標出的部分是什么意思。

      它立馬給出的正確回答:標出的部分是流程圖,展現了AlphaCodium的代碼生成過程。同時還給出了正確的描述。

      關鍵信息提取處理

      在實測中我們發現,Qwen-VL-Max最顯著的進步之一,就是基于視覺完成復雜的推理。

      這不僅限于描述內容,而是能理解復雜的表達形式。

      比如,下面這道看似簡單初中幾何題,由于條件信息都被嵌入進了圖像里的,其實難倒了不少視覺模型:

      相比之下,Qwen-VL-Max直接給出了正確解答。

      上下滑動查看

      再比如解釋下圖中的算法流程圖。

      Qwen-VL-Max會清晰地給出整套流程的解釋,包括每一步之后需要進行的步驟。

      小朋友的編程題,它也能正確地理解圖中的流程,轉換成Python程序。

      importrandom

      # 初始化變量my_number = random.randint(1, 10)guess = None

      # 猜數字循環whileguess != my_number:guess = int(input("Guess a number between 1 and 10: "))ifguess > my_number:print("Too high!")elifguess < my_number:print("Too low!")

      print("You got it!")

      直接給圖表,Qwen-VL-Max就能對之做出深入分析和解讀。

      論文中多復雜的圖表,它都能瞬間幫我們整理成表格的形式,簡潔直觀。

      下方的圖形推理題,它能準確推測出圖四應該是星星中有一個點的圖形。

      文本信息識別處理

      這次,迭代后的Qwen-VL-Plus/Max處理圖像中的文本的能力也顯著提升,尤其是中文和英文文本。

      模型可以有效地從表格和文檔中提取信息,并將這些信息重新格式化。

      比如,隨手拍一張鋪滿字的藥品說明書圖片上傳,要求它按規范格式輸出文字。

      Qwen-VL-Max不僅可以準確識別出圖片中文字,還可以將圖中【】同步出來。

      甚至下面這種寫滿筆記而且還存在遮蓋的掃描版文檔,也能識別出來。

      上下滑動查看

      Qwen-VL碾壓同級大模型,AI社區盛贊

      通義千問在多種復雜視覺任務上的表現著實讓人驚艷,背后的技術架構是怎樣的?

      早在去年8月,團隊就開源了基于Qwen-7B和ViT-G的Qwen-VL。

      論文地址:https://arxiv.org/abs/2308.12966

      不同于直接使用視覺語言下游任務數據集進行對齊,團隊在訓練初代Qwen-VL時設計了一種三階段的訓練方法。

      階段一:預訓練——將視覺編碼器與凍結LLM對齊

      因為訓練數據規模不足,可能導致任務泛化性能較差,所以使用大量的弱監督圖像文本對數據(如LAION-5B)進行對齊。

      與此同時,為了保留LLM的理解和生成能力,還需凍結LLM。

      階段二:多任務預訓練——賦予Qwen-VL完成多樣下游任務的能力

      讓LLM在視覺問答、圖像描述生成(Image Caption)、OCR、視覺定位(Visual Grounding)等各種任務上完成預訓練。

      這里,直接用文字坐標表示位置,因此LLM能夠自然地輸出關注元素的位置信息。

      階段三:監督微調——將視覺語言模型與人類偏好對齊

      收集并構造了一組多樣化的SFT樣本,對視覺語言模型進行了初步的對齊處理。

      可以看到,在主流多模態任務評測和多模態聊天能力評測中,Qwen-VL都取得同期遠超同等規模通用模型的表現。

      Qwen-VL模型開源后,在AI社區受到了廣泛的好評和推薦。

      有網友感慨道,人工智能的下一次進化來了!Qwen-VL模型巧妙地融合了視覺+文本推理,推進了多模態人工智能發展。

      還有網友表示,通義千問團隊的工作非常出色和認真,尤其是新發布的版本,絕對優秀。

      當然,全新迭代后的Qwen-VL-Plus性能更是大幅提升,網友紛紛開啟測試。

      比如有人發現Qwen-VL-Plus竟通過了自己的「蘑菇測試」(識別圖片中某個特定種類的蘑菇),他表示「這是第二個開源VLM模型通過這項測試」。

      還有人將Qwen-VL-Plus與ChatGPT進行了對比,通義千問模型的回答更加讓人印象深刻。

      AI下一個爆點:多模態視覺語言模型

      2023,是大語言模型的爆發年。

      在LLM之后,下一個爆發的賽道會在哪里?

      很多人認為,是多模態。能否實現AGI,或許關鍵就在這里。

      「多模態模型將成為AI時代下一爆點」這個論斷,也得到了業界眾多AI大佬的背書。

      OpenAI開發者關系主管Logan Kilpatrick曾在AI Engineer峰會上表示,「2024年將是多模態模型年」。

      最近HuggingFace的研究工程師在Latent Space播客采訪中更進一步預測,2年內所有的LLM都將變成LMM。

      Meta公共政策專家對2024年AI預測,稱「LMM將不斷涌現,并在多模態評估、多模態安全、多模態這個、多模態那個的爭論中取代LLM。此外,LMM是邁向真正通用人工智能助手的墊腳石」。

      對此,圖靈獎巨頭LeCun也表示贊同。

      過去一年中,許多人見證了多模態大模型發展的重要里程碑。

      從LLaVa、Imagebind、Flamingo,到GPT-4V、Gemini等大模型誕生,徹底改變了AI系統理解多種形式的數據,并與之交互的方式。

      在多模態大模型賽道上,國內頭部科技公司阿里也在一直布局探索。

      2021年推出M6系列預訓練-微調模式,到2022年發布圖文模態任務統一的通用模型OFA系列,再到OFA-Sys的系統化AI學習的嘗試。

      2023年通義千問大模型問世后,8月底阿里團隊基于Qwen-7B打造的視覺理解大模型Qwen-VL正式開源。

      11月,阿里又開源了音頻理解大模型Qwen-Audio,同時還升級了Qwen-VL,使之具備通用OCR、視覺推理、中文文本理解基礎能力,還能處理各種分辨率和規格的圖像。緊接著,就是Qwen-VL-Max的推出。

      通義千問團隊表示,他們一直以來都把開發與人類一樣能聽、能看、能理解、能溝通的「通用AI模型」作為目標。

      所有多模態大模型的迭代更新,最重要的價值就在于與落地應用相融合,重塑各個行業。

      LMM已成為AI企業關注的重點發展趨勢,其泛化能力是形成完備的商業模式的關鍵能力之一。

      而最先迎來革新的行業,便是機器人領域。LMM將推動未來家用服務機器人更進一步走進人類生活。

      經過過去一年大模型的持續發酵,讓許多人看到AI+機器人的廣闊應用前景,這也是為什么許多AI大佬將2024年稱之為「機器人元年」的原因。

      比如,谷歌DeepMind團隊升級的RT-2機器人由全新的「視覺語言動作」模型的加持,多了一個動作模態,表現出驚人的學習能力和理解力。

      多模態大模型Gemini發布后,谷歌DeepMind的首席執行官Hassabis同樣表示,「團隊正在研究如何將Gemini與機器人技術相結合,與世界進行物理互動」。

      LMM還可以通過醫學影像分析幫助醫生診斷疾病,并幫助醫生解讀醫學圖像和報告以更快地進行診斷。

      前幾天,世界衛生組織(WHO)還發布了全新指南,概述了多模態大模型在醫療衛生領域的五大應用場景:診斷和臨床護理、患者自主使用、文書和行政工作、醫療和護理教育、科學研究和藥物研發。

      另外,在教育領域,LMM的應用也是比比皆是。

      比如GPT-4加持的可汗學院AI機器人Khanmio能夠為學生提供個性化輔導,還有專注數學的WolframAlpha能夠生成可視化的解題步驟。

      未來,多模態大模型通過結合文本、圖像和音頻,能夠創造更加身臨其境的學習體驗。

      多模態大模型無縫集成了文本、圖像、音頻不同的模態,將會為醫療保健、教育、藝術和個性化推薦領域的變革性應用打開了大門。

      綜上,我們可以得到這樣一個結論——LMM是人工智能的未來,更是邁向人工通用智能的墊腳石。

      顯然,阿里正在走一條非常正確的路。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    夜鲁夜鲁夜鲁视频在线播放| 久久不射电影网| 国产一区二区三区免费看| 粉嫩aⅴ一区二区三区四区| 国产精品久久久久影视| 91高清视频免费看| 国产成人亚洲精品青草天美| 91牛牛免费视频| 91pron在线| 色老太综合网| 丁香婷婷综合色啪| 久久久亚洲欧洲日产国码aⅴ| 亚洲精品乱码久久久久久蜜桃91| 欧美日韩一区二区三区四区在线观看| 美女久久久久久久久久久| 九义人在线观看完整免费版电视剧| 久久99国产精品麻豆| 欧美日韩亚洲综合一区二区三区激情在线| 欧美丝袜美腿| 久久在线视频| 欧美激情视频网站| 亚洲一区精品电影| 亚洲国产日韩一级| 欧美v国产在线一区二区三区| 亚洲色诱最新| 国产传媒一区二区三区| 色婷婷久久久亚洲一区二区三区| 国产999精品久久| 亚洲精选在线观看| 精品久久香蕉国产线看观看亚洲| 日本精品网站| av片在线观看永久免费| 国产精品网站视频| 免费的黄网站在线观看| 最近2019中文字幕大全第二页| 在线观看视频一区| 日本婷婷久久久久久久久一区二区| 日韩欧美高清| 亚洲美女视频在线| 日韩av电影免费在线观看| 91精品国产一区二区| 亚洲麻豆一区| 亚洲国产日韩精品| 伊人伊成久久人综合网小说| 黄色精品一二区| 欧美日韩精品一区二区三区蜜桃| 亚洲免费精品| 日韩精品乱码av一区二区| 精品久久久久久国产91| 国产伦视频一区二区三区| 好吊色欧美一区二区三区四区| 一区二区三区四区日本视频| 91官网在线| 99国产在线视频| 亚洲日本中文| 亚洲柠檬福利资源导航| 欧美激情一区二区三区| 视频一区二区在线观看| 国产日韩欧美另类| 欧美日韩精品综合| 国产亚洲精品久久久优势| 午夜激情一区二区| 久久五月情影视| 亚洲欧美在线第一页| 五月综合久久| 中文一区二区完整视频在线观看| 亚洲va久久久噜噜噜久久狠狠| 九九精品在线视频| 欧美一级全黄| 久久久久日韩精品久久久男男| 欧美日韩中文字幕在线| 亚洲欧美福利一区二区| 欧美片一区二区三区| 成人短视频下载| 国产精品久久久久久久免费大片| 中文字幕视频精品一区二区三区| 亚洲一级黄色片| 日韩视频中午一区| 亚洲三级影院| 亚洲日本中文| 黄视频免费在线看| 国产精品视频一区国模私拍| 色综合久久六月婷婷中文字幕| 日韩一级欧美一级| 欧美电影《轻佻寡妇》| 国产在线拍揄自揄拍视频| 欧美麻豆精品久久久久久| 精品一卡二卡三卡四卡日本乱码| 992tv成人免费影院| 国产欧美日韩卡一| 久久伊人亚洲| 亚洲欧美日韩国产| 国产免费观看久久| zzijzzij亚洲日本少妇熟睡| 欧美成人一区二区三区片免费| 97久久精品人人爽人人爽蜜臀| 国产精品久久久久久一区二区三区| 久久av影视| 国产欧美韩国高清| 亚洲综合免费观看高清完整版在线| 亚洲自拍欧美另类| 亚洲国产中文在线二区三区免| 日韩一级在线| 日韩成人在线资源| 久久精品亚洲精品| 久久久精品免费网站| 在线日韩日本国产亚洲| 日本在线一区二区| 亚洲精品一二三区区别| 国产成人一区二| 97人人做人人人难人人做| 日韩欧美亚洲范冰冰与中字| 国产精品亚洲第一区在线暖暖韩国| 欧美黑人国产人伦爽爽爽| 欧美不卡视频| 欧美主播一区二区三区美女 久久精品人| 欧美在线一区二区| 色呦呦网站一区| 亚洲电影天堂av| 中文在线一区二区| 欧美日本成人| 91传媒免费看| 日韩精品在线一区二区| 视频一区二区不卡| 日本在线播放不卡| xxxx性欧美| 国产66精品久久久久999小说| 欧美中文在线观看| 97精品免费视频| 麻豆一二三区精品蜜桃| 国产性色av一区二区| 日韩欧美一区二区三区四区| 宅男网站在线免费观看| 亚洲色图狂野欧美| 黄色成人免费网| 国产精品视频一| 97蜜桃久久| 欧美日韩亚洲综合一区| ady日本映画久久精品一区二区| 在线亚洲精品福利网址导航| 亚洲第一区中文字幕| 外国成人毛片| 欧美综合国产精品久久丁香| a√资源在线| 国产精品福利在线观看播放| 亚洲国产精品福利| 女同视频在线观看| 亚洲国产三级在线| 精品国产一区二区三区麻豆免费观看完整版| 成人精品gif动图一区| 午夜一级在线看亚洲| 亚洲国产一区二区三区网站| 五月天一区二区| 91综合免费在线| 天堂av在线电影| 国产第一页在线视频| 另类天堂视频在线观看| 欧美亚洲图片小说| 欧美最新精品| 91亚洲国产成人精品一区二区三| 亚洲高清不卡在线观看| 久久国产精品久久精品| 国产精品午夜久久| 亚洲精品日韩欧美|