国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

解鎖2026世界杯觀賽“新姿勢”,聯想AI平板攜天禧AI 3.5打造掌上沉浸主場聯想motoX70Air云上舞白冰鉆限定版AI手機即將上市 自帶14顆手工精鑲冰鉆 超奢華只有紅魔還在做24+1TB 姜超:成本暴增 友商一臺都沒有英特爾®至強® D處理器:賦能智能網卡,破解算力-網絡協同瓶頸豐田全新超跑GR GT發布:配641馬力大V8商家仿冒心系天下W26 老機當新機賣!中國電信回應告別“人海戰術”!陳天橋:未來公司值多少錢,不看人數看“認知”“卷”不動了?讓AI銷售團隊替你卷!百度商家智能體升級片來了卡薩帝冰箱亮相廣州設計周亞馬遜云科技推出Amazon Graviton5----迄今性能最強、能效最高的自研CPU第八屆“綻放杯”圓滿落幕,華為助力千行百業5G應用“全面綻放”機構:2025年第三季度中國PC市場同比增長2%火山引擎發布豆包語音識別模型2.0提升多語種識別精度現代汽車推出 AI 驅動的 MobED 機器人,2026年上市Vidu發布 Q2“生圖全家桶”:4K 生圖 + 圖像編輯 + 圖轉視頻,全都免費用中國新勢力首家!理想汽車累計交付突破150萬輛瑞典Oceanbird Wing 560翼帆開放訂購,2026量產在即,加速布局中國市場賦能綠色航運億邦智庫第七次《產業互聯網發展報告》重磅發布一加Ace 6T首銷10分鐘賣爆!打破今年同檔機型全天銷售紀錄魯大師11月電動兩輪車榜:潮玩思路重塑市場,九號領跑智能化
  • 首頁 > 云計算頻道 > 大模型

    百川智能發布超千億大模型Baichuan 3,中文評測超越GPT-4

    2024年01月29日 14:01:29 來源:Donews

      1月29日消息,1月29日,百川智能發布超千億參數的大語言模型Baichuan 3。在多個權威通用能力評測如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展現了出色的能力,尤其在中文任務上更是超越了GPT-4。

      而在數學和代碼專項評測如MATH、HumanEval和MBPP中同樣表現出色,證明了Baichuan 3在自然語言處理和代碼生成領域的強大實力。

      不僅如此,其在對邏輯推理能力及專業性要求極高的MCMLE、MedExam、CMExam等權威醫療評測上的中文效果同樣超過了GPT-4,是中文醫療任務表現最佳的大模型。

      Baichuan 3還突破“迭代式強化學習”技術,進一步提升了語義理解和生成能力,在詩詞創作的格式、韻律、表意等方面表現優異,領先于其他大模型。

      基礎能力全面提升,多項權威評測中文任務成績超越GPT-4

      Baichuan 3在多個英文評測中表現出色,達到接近GPT-4的水平。而在CMMLU、GAOKAO、HumanEval和MBPP等多個中文評測榜單上,更是超越GPT-4展現了其在中文任務上的優勢。

      此外,在MT-Bench、IFEval等對齊榜單的評測中,Baichuan 3超越了GPT-3.5、Claude等大模型,處于行業領先水平。

      與百億、幾百億級別參數模型訓練不同,超千億參數模型在訓練過程中對高質量數據,訓練穩定性、訓練效率的要求都高出幾個量級。為更好解決相關問題,百川智能在訓練過程中針對性地提出了“動態數據選擇”、“重要度保持”以及“異步CheckPoint存儲”等多種創新技術手段及方案,有效提升了Baicuan 3的各項能力。

      高質量數據方面,傳統的數據篩選依靠人工定義,通過濾重篩選、質量打分、Textbook篩選等方法過濾數據。而百川智能認為,數據的優化和采樣是一個動態過程,應該隨著模型本身的訓練過程優化,而非單純依靠人工先驗進行數據的采樣和篩選。

      為全面提升數據質量,百川智能設計了一套基于因果采樣的動態訓練數據選擇方案,該方案能夠在模型訓練過程中動態地選擇訓練數據,極大提升數據質量。

      訓練穩定性方面,超千億參數的模型由于參數量巨大,訓練過程中經常會出現梯度爆炸、loss跑飛、模型不收斂等問題。對此,百川智能提出了“重要度保持”(Salience-Consistency)的漸進式初始化方法,用以保證模型訓練初期的穩定性。

      并且優化了模型訓練過程的監控方案,在梯度、Loss等指標上引入了參數“有效秩”的方法來提早發現訓練過程中的問題,極大加速對訓練問題的定位,確保了最后模型的收斂效果。

      此外,為了確保在數千張GPU上高效且穩定地訓練超千億參數模型,百川智能同步優化了模型的訓練穩定性和訓練框架,并采用“異步CheckPoint存儲”機制,可以無性能損失地加大存儲的頻率,減少機器故障對訓練任務的影響,使Baichuan 3的穩定訓練時間達到一個月以上,故障恢復時間不超過10分鐘。

      訓練效率方面,百川智能針對超千億參數模型的并行訓練問題進行了一系列優化,如高度優化的RoPE, SwiGLU計算算子;在數據并行中實現參數通信與計算的重疊,以及在序列并行中實現激活值通信與計算的重疊,從而有效降低了通信時間的比重;在流水并行中引入了將激活值卸載至GPU的技術,解決了流水并行中顯存占用不均的問題,減少了流水并行的分段數量并顯著降低了空泡率。通過這些技術創新,Baichuan 3的訓練框架在性能方面相比業界主流框架提升超過30%。

      醫療數據集Token數超千億,醫療能力逼近GPT-4

      大模型醫療背后蘊含著巨大的社會價值和產業價值,從疾病的診斷、治療到患者護理與藥物研發,大模型不僅能夠幫助醫生提高診療效率和質量,幫助患者獲得更好的服務和體驗,還能幫助社會降低醫療成本和風險,助力醫療資源實現普惠和平權。

      并且醫療問題專業性強、知識更新速度快、準確性要求高、個體差異大,能充體現大模型的各項能力,被百川智能稱為“大模型皇冠上的明珠”。因此,諸如OpenAI、谷歌等頭部大模型企業都將醫療作為模型的重點訓練方向和性能評價的重要體系。

      ChatGPT早在2023年2月便已通過了美國醫學執照考試(USMLE),顯示出其在醫學領域的強大能力。而谷歌對醫療領域的重視更甚,基于PaLM模型打造了醫療大模型Med-PaLM,迭代后的Med-PaLM 2在醫學考試 MedQA中的成績超過80分,達到了專家水平。

      在醫療領域,大模型的全能特性發揮著至關重要的作用。首先,其多模態學習能力能夠整合文本、影像、聲音等多種類型的醫療數據,提供更全面、準確的分析和診斷。其次,大模型的深層推理能力有助于復雜醫療決策的制定。

      此外,穩定的性能和知識更新能力確保了醫療建議的可靠性和時效性。同時,大模型的語言理解和生成能力使其能夠處理專業術語和復雜句式。最后,模式識別與學習能力在大模型中的應用,使其能夠從復雜的醫療數據中學習和識別出重要的模式和特征。

      所以,大模型想要在醫療領域擁有良好效果并不容易,既需要豐富的醫療知識、合適的Prompt,還需要模型本身具備過硬的邏輯推理能力。

      為了給Baichuan3注入豐富的醫療知識,百川智能在模型預訓練階段構建了超過千億Token的醫療數據集,包括醫學研究文獻、真實的電子病歷資料、醫學領域的專業書籍和知識庫資源、針對醫療問題的問答資料等。該數據集涵蓋了從理論到實際操作,從基礎理論到臨床應用等各個方面的醫學知識,確保了模型在醫療領域的專業度和知識深度。

      針對醫療知識激發的問題,百川智能在推理階段針對Prompt做了系統性的研究和調優,通過準確的描述任務、恰當的示例樣本選擇,讓模型輸出更加準確以及符合邏輯的推理步驟,最終不僅提升了Baichuan 3在多項醫療考試上的成績,并且在真實的醫療問答場景下也能給用戶提供更精準、細致的反饋。

      邏輯推理方面,Baichuan 3在數學和代碼等多個權威評測上中文任務超越GPT-4的優異成績,已經充分證明了其強大的基礎邏輯推理能力。在擁有豐富高質量專業醫療知識,并能通過調優后的Prompt對這些知識進行充分激發的基礎上,結合超千億參數的推理能力,Baichuan 3在醫療領域的任務效果提升顯著,在各類中英文醫療測試中的成績提升了2到14個百分點。

      Baichuan 3在多個權威醫療評測任務中表現優異,不僅MCMLE、MedExam、CMExam等中文醫療任務的評測成績超過GPT-4,USMLE、MedMCQA等英文醫療任務的評測成績也逼近了GPT-4的水準,是醫療能力最強的中文大模型。

      突破“迭代式強化學習”技術,創作精準度大幅提升

      語義理解和文本生成,作為大模型最基礎的底層能力,是其他能力的支柱。為提升這兩項能力,業界進行了大量探索和實踐,OpenAI、Google以及Anthropic等引入的RLHF(基于人類反饋的強化學習)和RLAIF(基于AI反饋的強化學習)便是其中的關鍵技術。

      基于強化學習對齊后的模型不僅可以更精準地理解用戶指令,尤其是多約束以及多輪對話下的指令,還能進一步提升生成內容的質量。但是在大模型中充分發揮強化學習的作用不僅需要穩定且高效的強化學習訓練框架和高質量的優質偏序數據,還需要在“探索與利用”兩者間進行平衡,實現模型能力持續爬坡。

      對于以上問題,百川智能進行了深入研究,并給出了針對性的解決方案。強化學習訓練框架方面,百川智能自研了訓練推理雙引擎融合、多模型并行調度的PPO訓練框架,能夠很好支持超千億模型的高效訓練,訓練效率相比業界主流框架提升400%。

      偏序數據方面,百川智能創新性的采用了RLHF與RLAIF結合的方式來生成高質量優質偏序數據,在數據質量和數據成本之間獲得了更好的平衡。在此基礎上,對于“探索與利用”這一根本挑戰,百川智能通過PPO探索空間與Reward Model評價空間的同步升級,實現“迭代式強化學習”(iterative RLHF&RLAIF)。基于強化學習的版本爬坡,可以在SFT的基礎上進一步發揮底座模型的潛力,讓Baichuan 3的語義理解和生成創作能力大幅提升。

      以文本創作中最具挑戰的唐詩宋詞為例,作為中國傳統文化的瑰寶,詩詞不僅在格式、平仄、對偶、韻律等方面均有著嚴格的約束條件,并且內容高度凝練、寓意深遠。

      如果僅通過SFT的微調學習,一方面高質量詩詞的創作數據需要極高的專家成本,另一方面不能在平仄、對偶、韻律等多個方面實現較好的約束理解和遵循。此外,傳統的單次RLHF范式在唐詩宋詞面前也遇到極大挑戰,PPO在訓練過程中生成的Response有可能超出Reward Model的評價范圍導致“探索”的過程失控。

      Baichuan 3結合“RLHF&RLAIF”以及迭代式強化學習的方法,讓大模型的詩詞創作能力達到全新高度?捎眯韵啾犬斍皹I界最好的模型水平提升達500%,文采遠超GPT-4。對于宋詞這種格式多變,結構深細、韻律豐富的高難度文體,生成的內容亦能工整對仗、韻腳和諧。其精準、深厚的創作功底,將讓每個人都能夠輕松創作出詠物、寄思的五言律詩、七言絕句,寫下的言志、抒情的“沁園春”、“定風波”,這不僅可以提升大眾的人文素養,還能助力中華傳統文化在大模型時代真正地“活”起來。

      作為參數規模超過千億的大語言模型,Baichuan 3不僅英文效果達到接近GPT-4的水平,還在多項通用中文任務的表現上實現了對GPT-4的超越,是百川智能的全新里程碑。

      Baichuan 3全面的通用能力以及在醫療領域的強大表現,將為百川智能打造“超級應用”,把大模型技術落地到諸多復雜應用場景提供有力支撐。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    美女视频在线免费| 成年人黄色大片在线| 日韩视频免费直播| 麻豆精品在线看| 成人av第一页| 91亚洲精品视频| 一本一道久久a久久| 国产精品久久久久久久久婷婷| 精品欠久久久中文字幕加勒比| 久久综合视频网| 天天精品视频| 久久精品视频播放| 亚洲五码中文字幕| 91精品在线观| 日本视频一区二区在线观看| av福利精品| 亚洲www啪成人一区二区麻豆| 日韩欧美在线不卡| 欧美激情视频一区二区| 亚洲丰满少妇videoshd| 久久久女女女女999久久| 成人性生交大片免费网站| 9l视频自拍蝌蚪9l视频成人| 久久久久久免费毛片精品| 欧美视频四区| 国产精品成人一区二区不卡| 国产亚洲精品久| 亚洲国产精品精华素| 亚洲一区二区在线视频| 国产精品av一区二区三区| 精品一区精品二区| 国产玖玖精品视频| 国产91富婆露脸刺激对白| 欧美日韩国产中文| 日本精品一区二区三区视频| 亚洲国产另类 国产精品国产免费| 欧美日韩一区 二区 三区 久久精品| 欧美日韩在线资源| 亚洲图片有声小说| 亚洲欧美二区三区| 韩国主播福利视频一区二区三区| 国产黄色91视频| 牛牛影视久久网| 中文字幕亚洲欧美| 好久没做在线观看| 日本韩国欧美一区| 久久av免费看| 亚洲精品福利资源站| 91av网站在线播放| 成人同人动漫免费观看| 久久亚洲免费视频| av男人一区| 国产高清精品二区| 欧美伦理免费在线| 国产一区二区久久精品| 91高清免费视频| 国产揄拍国内精品对白| 久久综合给合久久狠狠色| 国产高清精品一区二区三区| 两个人的视频www国产精品| 影音先锋久久久| 久久www免费人成看片高清| 欧美三级资源在线| 欧美性感美女一区二区| 中文字幕亚洲图片| 精品国内自产拍在线观看视频| 91精品国产日韩91久久久久久| 色婷婷久久一区二区| 国产日韩欧美一区二区| 中文字幕av一区二区三区四区| 亚洲精品一品区二品区三品区| 亚洲人成网站77777在线观看| 久久伊人精品一区二区三区| 国产成人在线电影| 一区二区三区| 五月天中文字幕一区二区| 亚洲精品888| 成人h在线观看| 亚洲精品免费电影| 亚洲精品国产精品乱码不99按摩| 欧美日韩mv| 好吊妞www.84com只有这里才有精品| 538在线一区二区精品国产| 成人av电影免费| 日韩久久久久久久久久久久久| 亚洲影视中文字幕| 精品久久中文字幕久久av| 深夜福利成人| 成人福利视频在线| 欧美电影免费观看高清| 日韩欧美精品在线| 免费高清视频在线一区| 午夜久久电影网| 中文字幕中文字幕在线中高清免费版| 日韩免费特黄一二三区| 日本久久一区| 欧洲日韩成人av| 香蕉一区二区| 中文一区二区| 亚洲一区二区四区蜜桃| 亚洲男女自偷自拍图片另类| 欧美日本视频在线| 国产亚洲精品久久久优势| 婷婷丁香在线| 国产精品毛片一区二区在线看| 伊人精品综合| 97国产suv精品一区二区62| 欧美三级在线| 蜜臀av性久久久久蜜臀aⅴ流畅| 日韩精品在线观看一区| 日本在线视频中文有码| 国产一区二区三区站长工具| 亚洲成人av观看| 91精品国产一区二区在线观看| 成人精品国产亚洲| 偷拍自拍亚洲| 波多野结衣一区二区| 好吊视频一区二区三区四区| 亚洲欧洲精品一区二区三区波多野1战4| www日韩欧美| 亚洲亚洲一区二区三区| 亚洲性线免费观看视频成熟| 日本中文字幕成人| 亚洲影院污污.| 亚洲欧洲综合另类在线| 国产美女精品一区二区三区| 欧美中文在线观看国产| 亚洲福利一区二区三区| 色诱女教师一区二区三区| 国产精品青草久久| 尤物精品国产第一福利三区| 国产91在线观看丝袜| 色综合91久久精品中文字幕| 秋霞成人午夜伦在线观看| 亚洲精品系列| 粉嫩av一区二区三区在线播放| 亚洲色图五月天| 亚洲精品免费电影| 久久精品国产电影| 国产精品888| 亚洲自拍偷拍图区| 国产深夜视频在线观看| 在线观看91视频| 99成人免费视频| 超碰精品一区二区三区乱码| 久久久久久国产精品免费免费| 精品美女被调教视频大全网站| 久久www人成免费看片中文| 欧美电影在线观看网站| 国产精品高潮呻吟| 欧美18hd| 国产剧情av在线播放| 日韩av手机在线观看| 久久狠狠久久综合桃花| 夜夜嗨网站十八久久| 亚洲欧美日韩国产手机在线| 久久99深爱久久99精品| 26uuu国产精品视频| 黄色在线免费网站| 天堂成人免费av电影一区| 欧美巨大xxxx做受沙滩| yiren22亚洲综合伊人22| 欧美一区二区人人喊爽| 69堂亚洲精品首页|