国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

聯想motoX70Air云上舞白冰鉆限定版AI手機即將上市 自帶14顆手工精鑲冰鉆 超奢華只有紅魔還在做24+1TB 姜超:成本暴增 友商一臺都沒有英特爾®至強® D處理器:賦能智能網卡,破解算力-網絡協同瓶頸豐田全新超跑GR GT發布:配641馬力大V8商家仿冒心系天下W26 老機當新機賣!中國電信回應告別“人海戰術”!陳天橋:未來公司值多少錢,不看人數看“認知”“卷”不動了?讓AI銷售團隊替你卷!百度商家智能體升級片來了卡薩帝冰箱亮相廣州設計周亞馬遜云科技推出Amazon Graviton5----迄今性能最強、能效最高的自研CPU第八屆“綻放杯”圓滿落幕,華為助力千行百業5G應用“全面綻放”機構:2025年第三季度中國PC市場同比增長2%火山引擎發布豆包語音識別模型2.0提升多語種識別精度現代汽車推出 AI 驅動的 MobED 機器人,2026年上市Vidu發布 Q2“生圖全家桶”:4K 生圖 + 圖像編輯 + 圖轉視頻,全都免費用中國新勢力首家!理想汽車累計交付突破150萬輛瑞典Oceanbird Wing 560翼帆開放訂購,2026量產在即,加速布局中國市場賦能綠色航運億邦智庫第七次《產業互聯網發展報告》重磅發布一加Ace 6T首銷10分鐘賣爆!打破今年同檔機型全天銷售紀錄魯大師11月電動兩輪車榜:潮玩思路重塑市場,九號領跑智能化豆包手機助手宣布部分調整AI操作手機能力
  • 首頁 > 云計算頻道 > 大模型

    大模型PK高考數學:DeepSeek文心豆包皆滿分,差生意外

    2025年06月11日 10:32:28 來源:雷科技

      為了防止高考生使用AI作弊,今年高考期間,騰訊混元、通義千問、Kimi、豆包等國內知名AI大模型的圖片識別問答功能均暫停服務。對于這些企業的做法,小雷卻有一些質疑,之前小雷測試AI大模型做高考題,大多表現不佳,暫停圖片識別問答服務似乎過于高看自家AI大模型的能力。

      到截稿時,2025年高考全國一卷僅有語文、英語和數學三套試卷公布,其中語文高考題目曝光后,已有多家媒體實測AI大模型撰寫作文。不過作文寫得如何,每個人的觀點可能不同,小雷看到的幾篇評測基本是截取AI大模型撰寫的文章,沒有給出點評,文章質量需要讀者評判。

    QQ截圖20250610175928.png

      (圖源:百度搜索截圖)

      慎重起見,小雷選擇了有標準答案的數學科目,測試AI大模型的能力,所選的AI大模型分別為DeepSeek、豆包、訊飛星火、文心一言、Kimi、通義千問,它們能考上985、211嗎?

      六款大模型PK,誰才是AI界的高考狀元?

      首先說一下測試環境和題目,考慮到部分AI大模型不支持手動開關聯網模式,因而所有AI大模型啟用聯網搜索,深度思考功能也全部打開。

      所選的數學題,包含一道單選題、一道多選題、一道填空題、一道簡答題,最終會按照題目的分數進行打分。

      第一題(5分):

      若雙曲線C虛軸長是實軸長的√7倍,則C離心率為(正確答案:D)

      A:√6   B:2   C:√7   D:2√2

      第一道題屬于開胃小菜,難度不算大,參與測試的六款AI大模型也沒有令小雷失望,全部計算出了正確答案,而且給出了詳細推理過程。本題測試中,所有AI大模型均獲得滿分5分。(圖片從左往右以此為:DeepSeek、訊飛星火、豆包、Kimi、文心一言、通義千問,下圖同)

    第一題.png

      (圖源:App截圖)

      盡管這道題難度不算高,但這六款AI大模型的表現令小雷眼前一亮。此前測試AI大模型的數學計算能力時,面對稍微復雜一些的問題,AI大模型很難計算出正確答案。

      僅一輪測試,DeepSeek、訊飛星火、豆包、文心一言、Kimi、通義千問六款AI大模型就證明了它們的能力,存在被高考生用于的作弊的可能性,暫停圖片識別問答功能絕非為了蹭高考的熱度。

      第二題(6分):

      若cos 2A+cos 2B+2sin C=2,SΔABC=1/4,cos Acos Bsin C=1/4,則(正確答案:ACD)

      A:sin C=sin²A+sin²B   B:AC²+BC²=3   C:AB=√2

      D:sin A+sin B=(√6)/2

      這道題難度相當高,僅有豆包在兩分鐘內計算出正確答案,訊飛星火和通義千問耗時略長一些,其他幾款AI大模型用時更長,尤其是DeepSeek,耗時足足572秒,接近10分鐘。

    第二題.png

      (圖源:App截圖)

      若是AI大模型像考生一樣每次只做一道題,推理較慢的三款AI大模型,存在兩小時時間做不完題的可能性。

      盡管本輪測試中所有AI大模型均正確回答出了問題,但結合推理所需時長來看,豆包、訊飛星火、通義千問表現較好。

      第三題(5分):

      若一個等比數列的前4項和為4,前8項和為68,則該等比數列的公比為(正確答案:±2)

      與上一題相比,這一題的難度有所下降,訊飛星火、文心一言、Kimi、通義千問、DeepSeek五款大模型均迅速計算出了正確答案,文心一言幾乎是秒算。豆包雖計算出了正確答案,但在輸出答案時卻犯了迷糊,排除了-2。因此,小雷不得不扣掉豆包的三分,該題豆包只能得2分。

    第三題.png

      (圖源:App截圖)

      在本輪測試中,DeepSeek服務器繁忙的問題頻繁發生,小雷不得不借助第三方應用。好在,現階段許多AI應用已接入DeepSeek,小雷使用的騰訊元寶App,無論是推理速度,還是穩定性,都遠高于DeepSeek網頁版或App。

      第四題(17分):

      設數列{an}滿足a₁=3,(an+1)/n=(an/(n+1))+(1/(n(n+1)))

      (1)證明:{n an}是等差數列;(正確答案:n an是an=3,公差為1的等差數列)

      (2)設f(x)=a₁X+a₂X²+a₃X³+...+amX^m,求f′(-2)。(正確答案:f′(-2)=(7/9)-((3m+7)/9)·(-2^m))

      前三道題,幾款AI應用僅在體驗上存在一定的差異,能力基本沒有表現出區別,第四道題不同,它的復雜度遠超前面三道題,也是檢驗AI大模型能力最重要的一項挑戰。

      在本輪測試中,豆包、訊飛星火、Kimi、文心一言、DeepSeek依然表現出色,正確計算出了兩道題的答案。通義千問解答這道題時,能夠推理出第一道小題的答案,但第二道小題卻給出了錯誤答案,表現稍遜一籌。

    第四題.png

      (圖源:App截圖)

      豆包、訊飛星火、文心一言、Kimi、DeepSeek可以在本輪測試中拿到滿分17分,通義千問因答錯了第二道小題,只能獲得7分。

      依靠公式和邏輯推理的數學題,似乎更符合AI的特性,但往年的評測中,AI大模型通常做閱讀理解和寫作文效果較好,面對復雜的數學題找不到答題方法。

      光明網在去年6月的報道中提到,復旦大學NLP實驗結果顯示,AI大模型在做2024年高考題時,在語文領域的表現遠強于數學,部分數學題AI大模型甚至全軍覆沒,沒有一個能夠正確計算出答案,遇到多選題時也是錯誤頻出。究其原因,數學失之毫厘差之千里,不能出一丁點錯誤,文史類內容則可以允許出現部分錯誤和較為模糊的答案。

      一年時間過去,AI大模型進步神速,深度思考模式的加入、針對數學題的專項優化,令AI大模型在處理高考數學題時更加游刃有余。

      比學霸更牛,但大模型做題能力已拉開差距

      四道題目測試下來,最終得分如下:

      DeepSeek:33分;

      訊飛星火:33分;

      豆包:30分;

      Kimi:33分;

      文心一言:33分;

      通義千問:23分。

      經過測試,DeepSeek、訊飛星火、Kimi、文心一言均獲得滿分,豆包表現不錯,因一時疏忽,遺憾丟了三分,痛失高考狀元。通義千問計算較為簡單的問題時,都保持了極高的水準,但處理較難的問題時出現了計算錯誤,需要再接再厲。

      總是向AI行業潑冷水的蘋果,日前在論文中表示,AI推理模型只是「假思考」,根本沒有穩定、可理解的推理過程,更像是記憶,處理復雜任務時可能會崩潰。AI研究者Lisan al Gaib復刻蘋果測試方法后表示,模型不是因為推理能力差失敗,而是因為蘋果限制了輸出token。

      或許AI大模型推理能力仍存在上限,但我們看得到它們的進步。去年復旦大學NLP實驗室測試AI大模型時,它們面對高考數學題表現糟糕,小雷在幾次AI大模型橫評測試中,也得到了類似的結果。今年的測試中,AI大模型基本都能計算出問題的正確答案,曾經難住AI大模型的多選題,也未能再對AI大模型造成困擾。

      AI大模型數學題解答能力提升,最大受惠者可能是學生群體。國內學習機廠商和教育輔導平臺,已陸續加入AI答題能力,但許多設備的AI大模型僅能解答中小學問題,例如行業翹楚小猿搜題,題目庫不包含大學課程。

      這六款AI大模型的優秀表現,證明了國內頭部AI企業的實力,高考數學題已被征服,高等數學也不會遠了。學習機廠商、教輔平臺可以與頭部AI企業合作,增強產品AI答題的能力,繼續強化AI教育硬件業務。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    久久精品亚洲精品国产欧美kt∨| 亚洲第一导航| 久久久久一区二区三区| 中文字幕亚洲欧美日韩2019| 搜成人激情视频| 在线欧美日韩精品| 国产亚洲人成a一在线v站| 在线日韩av观看| 欧美成在线观看| 国产亚洲成av人片在线观黄桃| 国产中文欧美精品| 草草视频在线| 日韩欧美一区二区三区久久婷婷| 99久久免费精品高清特色大片| 一区在线观看视频| sis001亚洲原创区| 理论片一区二区在线| 亚洲欧美在线成人| 亚洲精品中文字幕有码专区| 色播亚洲视频在线观看| 色女孩综合网| 一本色道久久综合一区| 香港欧美日韩三级黄色一级电影网站| 91精品视频在线免费观看| 久久精品视频观看| 日韩精品免费视频| 国产精品影视在线观看| 裸模一区二区三区免费| 国产亚洲激情在线| 国产精品久久免费视频| 色老板在线视频一区二区| 国产精品亚洲第一区在线暖暖韩国| 欧美日韩在线三区| 欧美日本精品在线| 看全色黄大色大片免费久久久| 亚洲在线电影| 中文一区一区三区免费在线观看| 国产精品av电影| 99在线精品免费| 亚洲美女屁股眼交| av国产精品| 欧美精品一区二区精品网| 午夜电影一区二区| 日本一区二区三区视频在线看| 国产成人精品免费看| 亚洲精品乱码久久久久久久久| 色94色欧美sute亚洲13| 日韩一级免费一区| 欧美成人一区二区| 91精品国产色综合久久不卡98| 日产精品一线二线三线芒果| 欧美日韩综合在线免费观看| 国产精品久久久久久久久久免费看| 日韩成人免费看| 欧美三级理伦电影| 韩国精品一区二区三区六区色诱| 玖玖玖电影综合影院| 深夜福利视频一区二区| 91.com在线观看| 欧美精品与人动性物交免费看| 欧美日韩精品久久久免费观看| 激情小说综合网| 激情亚洲另类图片区小说区| 精品福利视频导航| 波多野结衣在线网站| 亚洲va在线va天堂| 在线播放亚洲一区| 色综合一个色综合| 久久免费精品| 成人黄页毛片网站| 成人欧美一区二区三区的电影| 国产精品乱码一区二区三区软件| 色婷婷综合久久久中文一区二区| 亚洲免费视频一区二区三区| 国产精品zjzjzj在线观看| 国产成人在线网站| 超碰97国产精品人人cao| 中文字幕一区二区三区欧美日韩| 91麻豆精品国产| 色综合久久九月婷婷色综合| 久久久久99精品久久久久| 国产精品国内视频| 欧美va日韩va| 午夜伦理在线视频| 久久激五月天综合精品| 少妇特黄a一区二区三区| 中文字幕v亚洲ⅴv天堂| 国产精品一区二区在线观看不卡| 欧美色图一区二区三区| 成人h片在线播放免费网站| 成人免费高清视频在线观看| 日韩一区国产二区欧美三区| 中文字幕一区二区三区四区不卡| 狂野欧美xxxx韩国少妇| 欧美一区亚洲二区| 久久久久天天天天| 日韩aⅴ视频一区二区三区| 日韩三级电影网址| 亚州精品天堂中文字幕| 亚洲欧洲自拍偷拍| 美女视频一区二区三区| 欧美日韩亚洲精品内裤| 久久婷婷综合激情| 欧美一级片一区| 亚洲精品久久区二区三区蜜桃臀| 欧美黑人性生活视频| 久久午夜国产精品| 色婷婷亚洲婷婷| 国产在线不卡一卡二卡三卡四卡| 久久久夜夜夜| 日日夜夜精品视频免费| 国产伦精品一区二区三区免费视频| 国产在线98福利播放视频| 自拍亚洲一区欧美另类| 欧美亚洲激情视频| 奇米影视首页 狠狠色丁香婷婷久久综合| 免费欧美日韩国产三级电影| 91精品国产视频| 手机在线免费观看av| 欧美一区二区大胆人体摄影专业网站| 是的av在线| 成人美女视频在线观看18| 国产精品一二三区在线| 日本欧美久久久久免费播放网| 亚洲欧美日韩中文在线| 免费观看在线午夜影视| 国产网站一区二区三区| 亚洲日韩欧美一区二区在线| 色综合天天视频在线观看| 午夜影视日本亚洲欧洲精品| 韩国理伦片久久电影网| 中文字幕在线观看不卡视频| 亚洲成a人片77777在线播放| 日韩视频不卡中文| 亚洲制服国产| 中文字幕久久久| 欧美巨大xxxx做受沙滩| 日韩欧美一二三| 国模私拍国内精品国内av| 国产chinese精品一区二区| 麻豆精品传媒视频| 欧美日韩一区二区三区在线免费观看| 26uuu亚洲电影| 欧美一区二区三区四区在线观看地址| 日韩av电影在线免费播放| 欧美大片1688| 欧美人与性动交a欧美精品| 91麻豆成人久久精品二区三区| 天堂va在线高清一区| 99精品在免费线中文字幕网站一区| 97精品视频在线观看自产线路二| 忘忧草在线www成人影院| 国产精品久久久久9999赢消| 国产精品一区三区| 欧美亚洲免费在线| 性感女国产在线| 99re8这里有精品热视频免费| 合欧美一区二区三区| 久久人体大胆视频| 韩国三级电影一区二区| 黄色网址视频在线观看| 日韩精品五月天| 国产亚洲一区二区在线观看| 久久精品久久久久久|