V
主页
让其它大模型也能像openai o1那样思考推理,本地模型也行,打造o1级别的推理链项目短短几天2k star
发布人
今天我要和你们分享一个超酷的实验项目,它就是利用Llama-3.1 70b在Groq上实现类似OpenAI o1模型的推理链。这个早期原型通过提示策略,显著提升了大型语言模型(LLM)的推理能力,让它们能够“思考”并解决通常难倒领先模型的逻辑问题。不同于o1,这个应用展示了所有的推理令牌,并且使用了开源模型。 这个实验性的项目正在开源,目的是为了激发开源社区开发新的策略,以产生类似o1的推理能力。这个实验展示了通过可视化步骤提示推理的强大力量,而不是与o1进行比较或完全复制,因为o1使用了不同的技术。OpenAI的o1是通过大规模强化学习训练,使用推理链来解决问题,达到了解决复杂博士级问题的最先进水平。 g1展示了仅通过提示就能克服LLM逻辑问题(如草莓问题)的潜力,让现有的开源模型也能从动态推理链和改进的界面中受益。 🔍工作原理: g1由Llama3.1-70b驱动,创建推理链,原则上是一种动态的推理链,允许LLM“思考”并解决一些通常难倒领先模型的逻辑问题。 在每一步,LLM可以选择继续进行另一个推理步骤,或者提供最终答案。每一步都有标题,并且对用户可见。系统提示还包括给LLM的建议。有关提示分解的完整解释,请参见“提示分解”,但这里有一些示例,比如要求模型“包括探索替代答案”和“使用至少3种方法得出答案”。 因此,通过结合推理链和尝试多种方法、探索替代答案、质疑先前草稿解决方案以及考虑LLM的局限性,LLM的推理能力得到了提高。仅此一点,无需任何训练,就能在草莓问题上达到约70%的准确率(n=10,“草莓中有多少个R?”)。没有提示,Llama-3.1-70b的准确率为0%,ChatGPT-4o的准确率为30%。 💡提示策略: 提示如下: 你是一位专家AI助手,逐步解释你的推理过程。对于每一步,提供一个描述你在该步骤中所做工作的标题,以及内容。决定是否需要另一个推理步骤,或者是否准备好给出最终答案。以JSON格式回应,包含'title'、'content'和'next_action'('continue'或'final_answer')键。尽可能多地使用推理步骤。至少3步。意识到你作为LLM的局限性以及你能做什么和不能做什么。在你的推理中,包括探索替代答案。考虑你可能是错误的,如果你的推理是错误的,会在哪里出错。-> 很大一部分收益似乎来自于LLM重新评估其初始响应,以确保它在逻辑上与问题一致。 当你说你正在重新检查时,实际上要重新检查,并使用另一种方法这样做。不要只是说你正在重新检查。-> 这鼓励LLM不要只是说它重新检查了一个问题,而实际上没有尝试新的方法。 使用至少3种方法得出答案。-> 这有助于LLM通过尝试多种方法得出正确答案。 使用最佳实践。-> 这就像“做得更好”的提示,可以改善LLM的代码输出。通过告诉LLM使用最佳实践或做得更好,它通常会表现得更好!
打开封面
下载高清视频
观看高清视频
视频下载器
g1:在 Llama-3.1 70b 创建类似 o1 的推理链,o1的推理侧变革会将提示词工程师给干掉?
GPT-o1极速实测 | OpenAI全新大模型 | 数学编程能力测试 | GPT4o vs GPTo1哪家强
baidu文心一言主力大模型免费?我看不像主力,免费的api又不是不能用
OpenAI o1 正式发布!堪称王炸级的更新!实测揭示它到底有多强! | 零度解说
【一起开发】大语言模型零基础至项目实战
OpenAI全新模型o1深度解读与评测【模型评测12】
OpenAI O1 模型,推理能力爆表,堪比博士 GPT-4都得叫大哥,但就是有点偏科
跟我5分钟造个llama3 RAG,支持PDF知识库问答,比市面大部分chatbot强
全球顶级AI大模型免费使用,教你起飞!还有API免费体验秘籍大公开
多位华人做出核心贡献!Openai最强模型o1,研究团队曝光
vscode中最强编程助手,无需显卡使用llama3-70B模型赋能
【技术宅必备】VS Code + Llama 3.1,本地代码助手新体验 ollama+codegpt组合
全球首款会自我纠错的大模型-Reflection-Llama3.1-70b!超强推理能力挑战高难度推理题!AutoGen+LlamaIndex打造智能RAG
最新的ChatGPT o1就是强,直接给我干沉默了
自建perplexity搜索应用,省去你大师搜索时间。免费好用易部署,llama3+tavily
【技术控必看】Llama CPP:开源LLM推理的终极指南!你想不到的强大,openai api接口兼容,并发处理,无需要api秘钥……
2024最新!(中英字幕)公认最好的【吴恩达大模型LLM】系列教程,斯坦福人工智能顶级专家带你掌握前沿大模型技术(RAG模型应用_agent_ChatGPT)
OpenAI的最新模型o1技术角度分析
OpenAI o1新模型,让AI学会思考?!
Agent快速入门 | 本地知识库llama3.1 实现 Agent 工具调用,全网最详细大模型教程,一看就会!
【大模型】几小时完全从头训练一个仅有26M的小参数GPT,仅需入门显卡即可推理/训练!
DeepSeek新版本v2发布,全球最强开源MoE模型,AI能力相当GPT4,openai国替来了
kimiAPI免费用,你也能拥有chatgpt一样的api接口,ai应用敲门砖
手把手教你用Langflow+Astro DB+Azure打造RAG应用!
最强大模型GPT-4o发布,用题目测试答错最高难度的那题,看完后让你感叹AI真神!
【AI大模型】使用Ollama+Dify搭建属于自己的全能知识库!支持多种文件类型,轻松实现本地部署,草履虫都能看懂!
阿里巴巴最强开源大模型Qwen2.5-72B-Instruct,击败Llama3.1-405B!Qwen2.5+LlamaIndex实现Text to SQL
与AI女友对话对讲,使用GPT-4o api快速实现。与ai语音对话,它实时答话,太酷了
Flux全民炼丹时代来临!
免费体验405B海量大模型,编程助力神器,效率爆表N8N及VScode上免费使用
10行Python代码,搭建个人RAG文档聊天系统
听劝!用它换掉你的Cursor,免费版Cusror,教你使用众多开源大模型及完美代码补全,开源AI代码编辑器,100倍强大版vscode
gemini 1.5 pro api测试,100万输入token,支持图片音视频,强大好用,可惜以后要收费
通义千问2.5全系升级:模型使用及API调用
【comfyui工作流】无需真人模特,一键模特换装、产品图换背景!轻松打造精致电商产品图!喂饭级工作流搭建教程!
o1核心作者谈AI新范式: 传统训练已经过时, “要让AI学会自己钓鱼”
超强动画演示,一步一步深入浅出解释Transformer原理!这可能是我看到过最通俗易懂的Transformer教程了吧!——(人工智能、大模型、深度学习)
更强大更贵!OpenAI新模型o1解读+你必须学会的使用技巧!
【2024高品质精品课】黑神话大模型 RAG 项目实战—从小白到专家炼成记
[中文字幕]NodeJS 基础课程