国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 云計算頻道 > 大模型

    「教科書級」數據能有多大作用?微軟超強小模型引熱議

    2023年09月14日 15:09:41 來源:微信公眾號機器之心

      本文來自于微信公眾號 機器之心(ID:almosthuman2014),作者:小舟。

      隨著大模型掀起新一輪 AI 熱潮,人們開始思考:大模型的強大能力來源于什么?

      當前,大模型一直在由不斷增加的「大數據」來推動!复竽P + 大數據」似乎已經成為構建模型的標準范式。但隨著模型規模和數據量的不斷增長,算力的需求會迅速膨脹。一些研究者嘗試探索新思路。

      6月,微軟發布了一篇題為《Textbooks Are All You Need》的論文,用規模僅為7B token 的「教科書質量」數據訓練了一個1.3B 參數的模型 ——phi-1。盡管在數據集和模型大小方面比競品模型小幾個數量級,但 phi-1在 HumanEval 的 pass@1上達到了50.6% 的準確率,在 MBPP 上達到了55.5%。

      phi-1證明高質量的「小數據」能夠讓模型具備良好的性能。最近,微軟又發表了論文《Textbooks Are All You Need II: phi-1.5technical report》,對高質量「小數據」的潛力做了進一步研究。

      模型簡介

      架構

      研究團隊使用 phi-1的研究方法,并將研究重點放在自然語言常識推理任務上,創建了擁有1.3B 參數的 Transformer 架構語言模型 phi-1.5。phi-1.5的架構與 phi-1完全相同,有24層,32個頭,每個頭的維度為64,并使用旋轉維度為32的旋轉嵌入,上下文長度為2048。

      此外,該研究還使用 flash-attention 進行訓練加速,并使用 codegen-mono 的 tokenizer。

      訓練數據

      phi-1.5的訓練數據是由 phi-1的訓練數據(7B token)和新創建的「教科書質量」數據(大約20B token)組成的。其中,新創建的「教科書質量」數據旨在讓模型掌握常識推理,研究團隊精心挑選了20K 個主題來生成新數據。

      值得注意的是,為了探討網絡數據(LLM 常用)的重要性,該研究還構建了 phi-1.5-web-only 和 phi-1.5-web 兩個模型。

      研究團隊表示:創建強大且全面的數據集需要的不僅是原始計算能力,還需要復雜的迭代、有效的主題選擇,以及對知識的深入了解,具備這些要素,才能確保數據的質量和多樣性。

      實驗結果

      對于語言理解任務,該研究在多個數據集(包括 PIQA、Hellaswag、OpenbookQA、SQUAD 和 MMLU)上評估了一些模型。評估結果如下表3所示,phi-1.5的性能可以媲美5倍大的模型:

      在常識推理基準上的測試結果如下表所示:

      在更復雜的推理任務(例如小學數學和基礎編碼任務)上 phi-1.5還超越了大多數 LLM:

      研究團隊認為,phi-1.5再次證明了高質量「小數據」的力量。

      質疑與討論

      或許是因為「大模型 + 大數據」的理念太深入人心,這項研究遭到了機器學習社區一些研究人員的質疑,甚至有人懷疑 phi-1.5直接在測試基準數據集上訓練了。

      網友 Susan Zhang 進行了一系列驗證,并指出:「phi-1.5能夠對 GSM8K 數據集中的原問題給出完全正確的回答,但只要稍微修改一下格式(例如換行),phi-1.5就不會回答了!

      還有修改問題中的數據,phi-1.5在解答問題的過程中就會出現「幻覺」。例如,在一個點餐問題中,只修改了「披薩的價格」,phi-1.5的解答就出現了錯誤。

      并且,phi-1.5似乎「記住了」最終答案,即使在修改數據的情況下該答案已經是錯誤的。

      對此,論文作者之一 Ronen Eldan 很快給出了回應,針對上述網友測試出現的問題給出解釋和反駁:

      但該網友再次闡明其觀點:測試說明 phi-1.5的回答對 prompt 的格式是非!复嗳酢沟,并對作者的回應提出質疑:

      論文第一作者 Yuanzhi Li 回應道:「由于沒有進行任何指令微調和對齊工作,phi-1.5在穩健性上的確不如 GPT-4。但『脆弱』并不是正確的術語,事實上,對于任何模型,pass@k 準確率都會比 pass@1高得多(所以模型正確就是偶然的)!

      看到這些質疑與討論,網友們直呼:「最簡單的回應方式就是直接公開合成數據集!

      對此,你怎么看?

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    久久五月天色综合| 久久久久国产精品午夜一区| 国产成人啪精品视频免费网| 国模 一区 二区 三区| 中文字幕色av一区二区三区| 国产精品女人久久久久久| 欧美韩国一区| 日产福利视频在线观看| 国产精品日本欧美一区二区三区| 日韩av在线播放中文字幕| jlzzjlzz国产精品久久| 欧美资源在线观看| av日韩一区| 日本免费一区二区视频| 黑人巨大精品欧美一区二区免费| 91精品国产福利| 九九视频精品全部免费播放| 韩国主播福利视频一区二区三区| 国产精品伊人色| 黄色小说综合网站| 亚洲美女视频在线| 亚洲女成人图区| 自拍视频在线看| 欧美精品色图| 久久久久亚洲蜜桃| 丝袜美腿美女被狂躁在线观看| 69视频在线免费观看| 日韩av专区| 欧美激情视频免费观看| 日韩欧美精品一区二区综合视频| 久久6免费高清热精品| 欧美国产一区二区在线| 久久影院模特热| 国产精品一区二区婷婷| 手机看片福利永久国产日韩| 在线精品观看国产| 欧美大片免费观看在线观看网站推荐| 免费看日产一区二区三区| 狠狠色狠狠色综合日日tαg| 夜夜精品视频| 欧美日韩国产一区精品一区| 亚洲激情午夜| 亚洲国产欧美在线观看| 精品久久久影院| 韩国一区二区在线观看| 老牛嫩草一区二区三区日本| 亚洲精品视频播放| yourporn在线观看视频| 欧美一区二区在线观看| 欧美日韩三级| 亚洲激情成人| 欧美日韩亚洲精品一区二区三区| 91超碰免费在线| 国产成人精品一区二区三区视频| 999久久精品| 欧美激情aⅴ一区二区三区| 99久久精品免费看国产一区二区三区| 日本国产一区| 久久免费福利| 国产乱人伦精品一区二区在线观看| 在线不卡一区二区| 91成人精品视频| av不卡一区二区| 亚洲国产成人av好男人在线观看| 色综合一区二区三区| 午夜久久福利| av人人综合网| 日韩一区二区免费在线观看| 视频二区一区| 国产成人l区| 成人在线一区二区三区| 亚洲精品日韩综合观看成人91| 欧美二区在线看| 日韩中文字幕高清在线观看| 亚洲欧洲日韩一区二区三区| 国精产品一区一区三区有限在线| 欧美日韩岛国| 欧美一区二区视频网站| 国内精品久久久久久久97牛牛| 欧美激情成人在线视频| 日韩高清专区| 精品国产一二三区| 91小视频免费看| 中文字幕欧美一| 亚洲精品免费播放| 最近高清中文在线字幕在线观看| 宅男网站在线免费观看| 日韩一级在线观看| 日本不卡高清| 欧美色精品天天在线观看视频| 亚洲毛片一区二区| 欧洲亚洲一区二区| 色呦呦呦在线观看| 亚洲美女色禁图| 欧美日韩激情小视频| 91成人抖音| 久久免费视频这里只有精品| 国产清纯在线一区二区www| 懂色av一区二区三区免费观看| 久久久久久久久久电影| 成人免费xxxxx在线观看| 午夜亚洲国产au精品一区二区| 日韩有码在线视频| 日韩高清有码在线| 久久精品成人欧美大片古装| 26uuu色噜噜精品一区二区| 高清日韩一区| 亚洲福利一区二区| 九九热精品在线| 欧美精品在线一区| 水蜜桃久久夜色精品一区的特点| 亚洲一区二区综合| 欧美日韩国产精品| 色狠狠久久av综合| 国产精品综合色区在线观看| 欧美日韩午夜视频在线观看| 欧美精品在线极品| 麻豆成人av在线| 中文字幕亚洲色图| 欧美少妇精品| 免费av一区二区三区| 久久日韩精品一区二区五区| 久久精品视频在线看| 日韩欧美精品一区二区三区| 色妞色视频一区二区三区四区| 国产欧美一区二区精品性色超碰| aaa日本高清在线播放免费观看| 国产成人小视频在线观看| 久久久精品蜜桃| 亚洲日韩欧美一区二区在线| 中文字幕亚洲综合久久五月天色无吗''| 色综合亚洲图丝熟| 久久精品99久久无色码中文字幕| 国产欧美日韩另类一区| 欧美激情在线狂野欧美精品| 97免费视频在线| 欧美乱偷一区二区三区在线| 久久久噜久噜久久综合| 国产精品亚洲自拍| 亚洲国产精品综合小说图片区| 欧美一级一区二区| 日韩欧美国产不卡| 超碰97网站| 亚洲精品aⅴ| 日韩精品分区| 欧美丰满片xxx777| 国产在线精品一区在线观看麻豆| 黄页在线观看免费| 日本不卡久久| 精品粉嫩aⅴ一区二区三区四区| 精品av久久707| 国产精品1区二区.| 91小视频免费观看| eeuss鲁片一区二区三区| 亚洲黄色成人久久久| 日韩av不卡电影| 91精品免费观看| 第四色男人最爱上成人网| 国产精品乱看| 欧美mv日韩| 亚洲午夜精品久久久久久app| 欧美高清视频在线高清观看mv色露露十八| 欧美性视频精品| 免费97视频在线精品国自产拍|