国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

一加15丨Ace 6雙艦齊發,「性能 Ultra」一加 15 售價 3999 元起一加 15丨Ace 6 雙艦齊發,「性能 Ultra」一加 15 售價 3999 元起學術磁場:頂尖科學家論壇賦能腦疾病學術研討!2025WLF臨港·腦疾病大會順利閉幕零代碼上手即用!智元推出機器人內容創作平臺“靈創”Intel進軍ASIC定制服務市場 幾乎放棄AI!三大原因防止與固態電池混淆 知情人士:半固態電池將更名為固液電池NVIDIA N1筆記本CPU新消息:2026年年中推出!外星人先用首款海外商用手機eSIM中國芯!紫光同芯斬獲GSMA認證華為、vivo、OPPO等合作撰寫!中國快充方案成為全球標準:在國際電信聯盟發布鴻蒙生態手機 WIKO X70宣布10月30日發布 支持一鍵北斗廣汽推出三款具身智能機器人,布局康養安防場景瀾起科技成功量產 DDR5 第四子代寄存時鐘驅動器芯片金倉數據庫異構多活架構破解多院區集團化醫院信創難題RTX 5060 Ti 8GB賣不動了!限制供貨、不許降價美團LongCat-Video視頻生成模型發布:可輸出5分鐘長視頻樂道L90上市86天交付破三萬,持續刷新純電大型SUV最快交付記錄亞信科技、蒙東礦建達成戰略合作,打造車網協同、智能礦山標桿華為MatePad Pro流金典藏版開賣:售價7799元余承東曝鴻蒙智行新款享界S9將于11月上市SK海力士推出專為人工智能定制的下一代 NAND 存儲產品
  • 首頁 > 云計算頻道 > 大模型

    OpenAI o1式思維鏈,開源模型也可以有,成功案例來了

    2024年09月18日 09:40:20 來源:機器之心公眾號

      北京時間9月13日午夜,OpenAI 發布了推理性能強大的 ο1系列模型。之后,各路研究者一直在嘗試挖掘 ο1卓越性能背后的技術并嘗試復現它。當然,OpenAI 也想了一些方法來抑制窺探,比如有多名用戶聲稱曾試圖誘導 ο1模型公布其思維過程,然后收到了 OpenAI 的封號威脅。

      盡管如此,不過三四天時間,就已經有研究者宣稱已經成功復現/開發出了與 ο1性能差不多的推理技術,并且還不止一個!

      Llamaberry:教會 AI 像聰明人一樣思考

      Llamaberry 的提出者是 Martin Bowling。他開發的項目包括 RAGMiner.dev 和 Replit;其中前者可以幫助用戶毫不費力地將網站轉換成 Markdown、XML 或 JSON 等格式以便 RAG 和 LLM 應用使用,而后者則是一個使用 AI 將想法變成代碼的項目。

      Llamaberry 的核心思路是使用思維鏈(CoT)來實現推理。這個名字自然源自代表 o1模型的 Strawberry(草莓)。

      HuggingFace地址:https://huggingface.co/spaces/martinbowling/Llamaberry

      什么是思維鏈?Bowling 在博客中打了個比方:「思維鏈推理就像是給 AI 一個筆記本來展示其工作過程。其中不僅僅是簡單地給出答案,而是會帶領我們經歷其思維過程。」

      Llamaberry 能教會 AI 透徹地思考,就像是一位人類專家攻克難題時那樣。

      具體來說,Llamaberry 是一個多輪思維鏈推理系統的實現,其基于運行在 Groq 上的 Llama3.170B 模型。

      多輪推理是關鍵

      多輪推理,顧名思義,就是讓模型在給出答案之前進行多步思考,而不是一步給出答案。打個比方,這就像是看一位大廚從備菜到完成擺盤一步步地完成一道精美菜肴,而不是直接微波加熱預制菜。

      舉個示例:

      第1輪:AI 先嘗試解決當前問題。

      第2輪:AI 回顧第一次嘗試并盡力改進或優化其思維過程。

      第3輪:再進行一輪反思和改進。

      綜合結果:最后,將所有這些思考綜合到一起,得到一個連貫且合理的答案。

      下面展示了這個多輪過程的示意圖:

      可以看到,前一輪的輸出會成為后一輪的輸入,從而讓 AI 可在每個階段不斷完善其思維。最后,所有這些思考會凝練成一個合理的最終答案。就像看著一枚莓果逐漸成熟!

      如何實現

      下面將深入 Llamaberry 的實現細節。

      1.設置舞臺

      首先,我們需要為 AI 助手設置一些基本規則,代碼如下:

      initial_system_prompt="""YouareanAIassistantcapableofdetailed,step-by-stepthinking.Whenpresentedwithaquestionorproblem,breakdownyourthoughtprocessintoclear,logicalsteps.Foreachstep,explainyourreasoning.Concludewithafinalanswer.Usethefollowingmarkdownstructure:

      這就是提供給 AI 大廚的菜譜。它知道需要逐步分解其思考過程并解釋每個步驟,并且以 Markdown 格式將它們顯示出來。

      2.思考過程

      在每一輪推理中,都需要讓 AI 對問題進行思考。但在第一輪結束后,還需要求它思考之前已經思考過的東西。這就像問朋友,「嘿,還記得你之前說過什么嗎?讓我們再想一想!

      下面是每一輪的生成方式:

      asyncdefgenerate_turn(query:str,previous_turns:list=None)->str:

      該函數是多輪推理的核心。它決定我們是在第一輪還是在后續輪,并以此構建提示詞。對于后續輪,它會將之前所有推理輪都包含在上下文中,讓 AI 可以基于之前的思考進行構建。

      3.綜合結果

      經過三輪思考之后,再讓 AI 檢視其所有思考并得出一個合理的最終答案。這就像是讓專家討論問題,然后編寫最終報告。

      asyncdefsynthesize_turns(query:str,turns:list)->str:turns_text="\n\n".join([f"Turn{i+1}:\n{turn}"fori,turninenumerate(turns)])messages=[{"role":"system","content":synthesis_prompt},{"role":"user","content":f"OriginalQuery:{query}\n\nTurnsofReasoning:\n{turns_text}"}]returnawaitcall_llm(messages)

      這個綜合步驟至關重要,是 AI 綜合所有思考內容凝練出最終答案的一步。

      單輪推理 vs 多輪推理

      Martin Bowling 在其博客中簡單比較了單輪和多輪推理。

      這里他采用了一個簡單示例,即詢問 AI:「人工智能對就業市場有什么潛在影響?」

      單輪推理:

      AI:Artificialintelligencewilllikelyhavesignificantimpactsonthejobmarket,including:

      使用 Llamaberry 執行多輪推理:

      第1輪:

      AI:Let'sapproachthisstep-by-step:

      第2輪:

      AI:Let'srefineourthinking:

      第3輪:

      AI:Let'sdelvedeeper:

      綜合答案:

      AI:Aftercarefulconsiderationacrossmultipleturnsofreasoning,wecansynthesizeourthoughtsonthepotentialimpactsofartificialintelligenceonthejobmarket:

      可以看到,多輪方法能實現更加精細、全面的分析。這能從多個角度考慮問題,優化其思考,最后得到更加深思熟慮和全面詳細的答案。

      Bowling 表示,這樣的多輪推理在思考深度、自我提升、透明度、靈活性等方面都有巨大優勢,同時其還采用了 Markdown 格式,使其結果更容易閱讀和用于后續流程。

      因此,這種技術可讓 AI 進入更多實際應用場景,比如醫療診斷、法律分析、科學研究、商業策略、教育。當然,在使用 Llamaberry 等多輪推理系統時,也需要注意它們的局限和潛在的道德倫理問題,比如偏見、計算成本、過度依賴和隱私問題。

      如何使用 Llamaberry?

      Llamaberry 也很容易使用,點擊幾下就能擁有你自己的多輪推理系統。步驟如下:

      前往 Replit,點擊該鏈接獲取 Llamaberry 模板:https://replit.com/@MartinBowling/Llamaberry-Powered-By-Groq?v=1

      創建模板分支:點擊 Fork 按鈕創建你自己的 Llamaberry 項目副本。

      獲取你的 Groq API Key:注冊 Groq 賬戶,獲取 API Key。

      設置環境:在你的分支 Replit 項目中,找到「Secrets」選項卡。添加一個新密鑰,密鑰為 GROQ_API_KEY,值是你的 Groq API 密鑰。

      運行項目:單擊 Replit 界面頂部的 Run 按鈕。這將啟動 Llamaberry 應用。

      開始實驗:應用運行起來后,你將看到一個 Gradio 界面。你可以在其中輸入問題并查看 Llamaberry 多輪推理的實際效果!并且輸出是簡潔漂亮的 Markdown 格式!

      了解了 Llamaberry,下面來看另一個號稱實現了類 o1推理鏈的項目:g1。

      g1:實現類似 ο1的推理鏈

      g1這個項目來自 Benjamin Klieger,他是 Groq 的一位研究者。也因此,g1同樣基于 Groq,并且其也使用了 Llama3.170b 模型。

      不同于 Llamaberry 使用的多輪思維鏈推理,g1的策略是角色扮演、思維鏈提示 、格式化以及另一些提示技巧。并且,g1開源了。

      開發者宣稱 g1有70% 的時間能成功數出 Strawberry 中有多少個 R,同時無需任何微調或少樣本技術。下面是其一次執行過程:

      開發者 Klieger 表示,g1和 ο1一樣能讓 LLM 有能力「思考」和解決之前的領先模型難以應對的邏輯問題。但不同之處在于,g1會大方地展示所有推理 token。同時,他也強調了 g1和 ο1在技術上的差異,其中后者使用了大規模強化學習來執行思維鏈推理。而 g1則是通過發掘提示詞工程的潛力來幫助 LLM 解決簡單的邏輯問題,讓現有的開源模型也能受益于動態推理鏈和優化般的探索界面。

      g1的工作方式

      由 Llama3.170b 支持的 g1會創建一種動態的思維鏈。

      在每個步驟中,LLM 可以選擇是繼續進行另一個推理步驟,還是提供最終答案。每個步驟都有標題,并且對用戶可見。

      系統提示詞中還會包含給 LLM 的提示。其提示策略如下:

      YouareanexpertAIassistantthatexplainsyourreasoningstepbystep.Foreachstep,provideatitlethatdescribeswhatyou'redoinginthatstep,alongwiththecontent.Decideifyouneedanothersteporifyou'rereadytogivethefinalanswer.RespondinJSONformatwith'title','content',and'next_action'(either'continue'or'final_answer')keys.USEASMANYREASONINGSTEPSASPOSSIBLE.ATLEAST3.BEAWAREOFYOURLIMITATIONSASANLLMANDWHATYOUCANANDCANNOTDO.INYOURREASONING,INCLUDEEXPLORATIONOFALTERNATIVEANSWERS.CONSIDERYOUMAYBEWRONG,ANDIFYOUAREWRONGINYOURREASONING,WHEREITWOULDBE.FULLYTESTALLOTHERPOSSIBILITIES.YOUCANBEWRONG.WHENYOUSAYYOUARERE-EXAMINING,ACTUALLYRE-EXAMINE,ANDUSEANOTHERAPPROACHTODOSO.DONOTJUSTSAYYOUARERE-EXAMINING.USEATLEAST3METHO***ODERIVETHEANSWER.USEBESTPRACTICES.

      對這些提示詞的詳細解釋請參閱原項目的 Prompt Breakdown 一節。這里就不贅述了,僅給出幾個示例,比如可以在提示詞中加入「include exploration of alternative answers」(探索其它答案)和「use at least3methods to derive the answer」(使用至少三種方法來得出答案)。

      這樣一來,通過組合思維鏈以及嘗試多種方法、探索其它答案、質疑之前草擬的解答、考慮 LLM 的局限性等策略,就能顯著提升 LLM 的推理能力。

      在數 Strawberry 中有多少個 R 這個經典問題上,無需任何訓練,g1就能幫助 Llama3.170b 達到約70% 的準確度(n=10, How many Rs are in strawberry?)。而如果不使用提示技術,Llama3.170b 的準確率為0%,ChatGPT-4o 的也只有30%。

      下面展示了另一個示例:0.9和0.11哪個更大?

      詳細的安裝過程和代碼請參閱原項目。

      最后,順便一提,另有開發者發布了 g1的分支版 Mult1,該版本的一大改進是可使用多個 AI 提供商來創建類似 o1的推理鏈

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    亚洲福利精品在线| 久9久9色综合| 一级毛片视频在线| 亚洲日本成人网| 91美女片黄在线观看游戏| 男人的天堂亚洲一区| 一区二区不卡在线视频 午夜欧美不卡在| 欧美日韩一区 二区 三区 久久精品| 亚洲综合偷拍欧美一区色| 国产精品三级在线观看| 国产精品香蕉| 亚洲成a人片综合在线| 亚洲欧美日韩国产一区二区三区| 亚洲综合五月| 欧美多人乱p欧美4p久久| 欧美精品三级在线观看| 久久影院模特热| 成人欧美一区二区三区1314| 国产一区二区0| 亚洲精品网址在线观看| 26uuu亚洲电影| 日韩美脚连裤袜丝袜在线| 国产传媒在线播放| 特黄特色欧美大片| 三级三级久久三级久久18| 专区另类欧美日韩| 久久综合资源网| 国产精品一区二区久久精品爱涩| 国产一精品一av一免费爽爽| 狂野欧美一区| 欧美性久久久| 欧美激情欧美激情在线五月| 特级西西444www大精品视频| 久久99国产精品自在自在app| 欧美一级全黄| 国语自产精品视频在线看| 91黑丝高跟在线| 人人鲁人人莫人人爱精品| 黄a在线观看| 午夜精品剧场| www久久久| 精品国产乱子伦一区二区| 超碰一区二区三区| 国产日韩欧美制服另类| 日本亚洲精品在线观看| 欧美一区三区三区高中清蜜桃| 中文字幕亚洲欧美日韩高清| 另类天堂av| 欧美+日本+国产+在线a∨观看| 国产精品青青在线观看爽香蕉| 欧美一级大胆视频| 国产嫩草一区二区三区在线观看| 成人永久在线| 国产欧美日韩在线视频| 亚洲18女电影在线观看| 色噜噜狠狠一区二区三区| 日韩伦理一区二区三区| 中文日韩欧美| 5252色成人免费视频| 国产欧美日韩一区二区三区在线| 99re国产在线播放| 99国产欧美久久久精品| 国产黄大片在线观看画质优化| 色婷婷精品国产一区二区三区| 成人亚洲一区二区一| 欧美中文字幕在线观看| 免费不卡欧美自拍视频| 国产福利一区在线观看| 久久不见久久见免费视频7| 日本高清视频在线观看| 激情五月色综合国产精品| 亚洲成人综合在线| 成人av免费观看| 永久免费精品影视网站| 91porn在线观看| 一色桃子av在线| 91精品国产综合久久精品图片| caoporn成人| 成人高清伦理免费影院在线观看| 丝袜诱惑一区二区| 中文字幕区一区二区三| 在线国产精品一区| 国新精品乱码一区二区三区18| 精品综合在线| 日韩高清电影一区| 欧美jizz18hd性欧美| 琪琪一区二区三区| 日韩免费视频一区| 久久久女女女女999久久| 日韩精品极品视频在线观看免费| 成人在线免费观看视频| 精品乱色一区二区中文字幕| 亚洲电影二区| 亚洲自拍偷拍在线| 99免费精品在线| 亚洲欧美日韩一区二区三区在线| 日本丶国产丶欧美色综合| 蜜桃视频在线观看成人| 亚洲一区二区三区四区| 亚洲一区二区三区四区在线| 久久久久国产精品麻豆ai换脸| 日韩激情啪啪| 国产精品欧美亚洲777777| 国产精品自拍网| 亚洲美女一区| 欧美成人dvd在线视频| 男人和女人做事情在线视频网站免费观看| 精品国产一区二区三区2021| 亚洲国产你懂的| 免费国产自线拍一欧美视频| 米奇777四色精品人人爽| 亚洲剧情一区二区| 91视频-88av| 精品国产一区二区三区久久久久久| 国产精品va视频| 久久久影视传媒| a在线免费观看| 在线免费一区三区| 久久艳妇乳肉豪妇荡乳av| 视频一区二区欧美| 神马欧美一区二区| 欧美日韩国产综合视频在线观看| 91免费版网站入口| 视频在线精品一区| 欧美极品美女电影一区| 欧美日韩精品免费观看视频完整| 91精品天堂| 国产日韩欧美91| 成人精品高清在线| 亚洲欧美日韩在线| 久久伊人色综合| 视频在线这里都是精品| 国产精品一级久久久| 在线观看免费版| 大胆人体一区二区| 91在线视频播放地址| 国产精品13p| 日韩高清不卡在线| 久久99精品久久久野外观看| 日韩精品久久久久久福利| 午夜精品剧场| a级大胆欧美人体大胆666| 国产午夜精品一区二区三区四区| 色姑娘综合av| 日韩久久精品成人| 一区二区三区在线播放欧美| 精品国产免费一区二区三区四区| 免费国产亚洲视频| 国内精品嫩模av私拍在线观看| 成人中心免费视频| 久久久伦理片| 亚洲欧美偷拍另类a∨色屁股| 日本在线免费看| 国产精品视频午夜| 日韩精品最新在线观看| 欧美亚洲日本国产| 黄色欧美视频| 在线观看的日韩av| 日韩高清不卡av| 小草在线视频免费播放| 精品午夜电影| 1024成人网色www| 久久蜜桃av一区精品变态类天堂| 黑人狂躁日本妞一区二区三区|