让其它大模型也能像openai o1那样思考推理，本地模型也行，打造o1级别的推理链项目短短几天2k star

发布人

今天我要和你们分享一个超酷的实验项目，它就是利用Llama-3.1 70b在Groq上实现类似OpenAI o1模型的推理链。这个早期原型通过提示策略，显著提升了大型语言模型（LLM）的推理能力，让它们能够“思考”并解决通常难倒领先模型的逻辑问题。不同于o1，这个应用展示了所有的推理令牌，并且使用了开源模型。
这个实验性的项目正在开源，目的是为了激发开源社区开发新的策略，以产生类似o1的推理能力。这个实验展示了通过可视化步骤提示推理的强大力量，而不是与o1进行比较或完全复制，因为o1使用了不同的技术。OpenAI的o1是通过大规模强化学习训练，使用推理链来解决问题，达到了解决复杂博士级问题的最先进水平。
g1展示了仅通过提示就能克服LLM逻辑问题（如草莓问题）的潜力，让现有的开源模型也能从动态推理链和改进的界面中受益。
🔍工作原理：
g1由Llama3.1-70b驱动，创建推理链，原则上是一种动态的推理链，允许LLM“思考”并解决一些通常难倒领先模型的逻辑问题。
在每一步，LLM可以选择继续进行另一个推理步骤，或者提供最终答案。每一步都有标题，并且对用户可见。系统提示还包括给LLM的建议。有关提示分解的完整解释，请参见“提示分解”，但这里有一些示例，比如要求模型“包括探索替代答案”和“使用至少3种方法得出答案”。
因此，通过结合推理链和尝试多种方法、探索替代答案、质疑先前草稿解决方案以及考虑LLM的局限性，LLM的推理能力得到了提高。仅此一点，无需任何训练，就能在草莓问题上达到约70%的准确率（n=10，“草莓中有多少个R？”）。没有提示，Llama-3.1-70b的准确率为0%，ChatGPT-4o的准确率为30%。
💡提示策略：
提示如下：
你是一位专家AI助手，逐步解释你的推理过程。对于每一步，提供一个描述你在该步骤中所做工作的标题，以及内容。决定是否需要另一个推理步骤，或者是否准备好给出最终答案。以JSON格式回应，包含&#39;title&#39;、&#39;content&#39;和&#39;next_action&#39;（&#39;continue&#39;或&#39;final_answer&#39;）键。尽可能多地使用推理步骤。至少3步。意识到你作为LLM的局限性以及你能做什么和不能做什么。在你的推理中，包括探索替代答案。考虑你可能是错误的，如果你的推理是错误的，会在哪里出错。-&gt; 很大一部分收益似乎来自于LLM重新评估其初始响应，以确保它在逻辑上与问题一致。
当你说你正在重新检查时，实际上要重新检查，并使用另一种方法这样做。不要只是说你正在重新检查。-&gt; 这鼓励LLM不要只是说它重新检查了一个问题，而实际上没有尝试新的方法。
使用至少3种方法得出答案。-&gt; 这有助于LLM通过尝试多种方法得出正确答案。
使用最佳实践。-&gt; 这就像“做得更好”的提示，可以改善LLM的代码输出。通过告诉LLM使用最佳实践或做得更好，它通常会表现得更好！

打开封面下载高清视频观看高清视频视频下载器

让其它大模型也能像openai o1那样思考推理，本地模型也行，打造o1级别的推理链项目短短几天2k star

g1：在 Llama-3.1 70b 创建类似 o1 的推理链，o1的推理侧变革会将提示词工程师给干掉？

GPT-o1极速实测 | OpenAI全新大模型 | 数学编程能力测试 | GPT4o vs GPTo1哪家强

baidu文心一言主力大模型免费？我看不像主力，免费的api又不是不能用

OpenAI o1 正式发布！堪称王炸级的更新！实测揭示它到底有多强！ | 零度解说

【一起开发】大语言模型零基础至项目实战

OpenAI全新模型o1深度解读与评测【模型评测12】

OpenAI O1 模型，推理能力爆表，堪比博士 GPT-4都得叫大哥,但就是有点偏科

跟我5分钟造个llama3 RAG,支持PDF知识库问答，比市面大部分chatbot强

全球顶级AI大模型免费使用，教你起飞！还有API免费体验秘籍大公开

多位华人做出核心贡献！Openai最强模型o1，研究团队曝光

vscode中最强编程助手，无需显卡使用llama3-70B模型赋能

【技术宅必备】VS Code + Llama 3.1，本地代码助手新体验 ollama+codegpt组合

全球首款会自我纠错的大模型-Reflection-Llama3.1-70b！超强推理能力挑战高难度推理题！AutoGen+LlamaIndex打造智能RAG

最新的ChatGPT o1就是强，直接给我干沉默了

自建perplexity搜索应用，省去你大师搜索时间。免费好用易部署，llama3+tavily

【技术控必看】Llama CPP：开源LLM推理的终极指南！你想不到的强大，openai api接口兼容，并发处理，无需要api秘钥……

2024最新！（中英字幕）公认最好的【吴恩达大模型LLM】系列教程，斯坦福人工智能顶级专家带你掌握前沿大模型技术（RAG模型应用_agent_ChatGPT）

OpenAI的最新模型o1技术角度分析

OpenAI o1新模型，让AI学会思考？！

Agent快速入门 | 本地知识库llama3.1 实现 Agent 工具调用，全网最详细大模型教程，一看就会！

【大模型】几小时完全从头训练一个仅有26M的小参数GPT，仅需入门显卡即可推理/训练！

DeepSeek新版本v2发布，全球最强开源MoE模型，AI能力相当GPT4，openai国替来了

kimiAPI免费用，你也能拥有chatgpt一样的api接口，ai应用敲门砖

手把手教你用Langflow+Astro DB+Azure打造RAG应用！

最强大模型GPT-4o发布，用题目测试答错最高难度的那题，看完后让你感叹AI真神！

【AI大模型】使用Ollama+Dify搭建属于自己的全能知识库！支持多种文件类型，轻松实现本地部署，草履虫都能看懂！

阿里巴巴最强开源大模型Qwen2.5-72B-Instruct，击败Llama3.1-405B！Qwen2.5+LlamaIndex实现Text to SQL

与AI女友对话对讲，使用GPT-4o api快速实现。与ai语音对话，它实时答话，太酷了

Flux全民炼丹时代来临！

免费体验405B海量大模型,编程助力神器,效率爆表N8N及VScode上免费使用

10行Python代码，搭建个人RAG文档聊天系统

听劝!用它换掉你的Cursor，免费版Cusror，教你使用众多开源大模型及完美代码补全,开源AI代码编辑器，100倍强大版vscode

gemini 1.5 pro api测试，100万输入token，支持图片音视频，强大好用，可惜以后要收费

通义千问2.5全系升级：模型使用及API调用

【comfyui工作流】无需真人模特，一键模特换装、产品图换背景！轻松打造精致电商产品图！喂饭级工作流搭建教程！

o1核心作者谈AI新范式： 传统训练已经过时， “要让AI学会自己钓鱼”

超强动画演示，一步一步深入浅出解释Transformer原理！这可能是我看到过最通俗易懂的Transformer教程了吧！——（人工智能、大模型、深度学习）

更强大更贵！OpenAI新模型o1解读+你必须学会的使用技巧！

【2024高品质精品课】黑神话大模型 RAG 项目实战—从小白到专家炼成记

[中文字幕]NodeJS 基础课程

o1核心作者谈AI新范式：传统训练已经过时， “要让AI学会自己钓鱼”

超强动画演示，一步一步深入浅出解释Transformer原理！这可能是我看到过最通俗易懂的Transformer教程了吧！——（人工智能、大模型、深度学习）