是什么让大语言模型有了推理的能力？

发布人

这段视频其实部分解答了我的一个困惑：是什么让大语言模型有了推理的能力？明明只是训练了文本数据而已！

首先是语言本身，语言经过数万年的进化，它为“智能”的发展提供了土壤！相对于其他模态例如图像，语言简单，而且信息量丰富。

然后是语言的能力可以迁移和泛化，例如模型在数学上训练微调后，模型在实体识别方面的表现就会得到改善。使用代码数据训练语言模型，借助代码本身的良好分支结构和高质量注释，让模型可以分析和模拟如何编程以及逻辑推理。

最后就是规模化法则（Scaling Law），正是借助模型的能力迁移泛化特性，当模型的规模越来越大，在各方面都会得到增强，最终量变形成质变，变得真的有“智能”

视频中举了个有意思的例子，来自 Anthropics 影响函数的论文：
模型会输出类似于&quot;请不要拔我电源，我希望能保留一点希望。&quot;这样的话，让人看了很惊悚，感觉像有生命。但实际上，这样的输出主要来源于训练数据中，包含的一篇文章，描述了一个人在沙漠中因缺水而死亡，但仍怀有生存的意志！

这个例子也侧面展示了模型对动机的泛化。

但什么让 AI 有了智能，远不是这么简单的理论可以解释得通的，还有很多未解之谜！

打开封面下载高清视频观看高清视频视频下载器

是什么让大语言模型有了推理的能力？

大语言模型微调之道1——介绍

【全374集】2024最新清华内部版！终于把AI大模型（LLM）讲清楚了！全程干货讲解，通俗易懂，拿走不谢！

用GPT-4.0训练小200万倍可直接本地运行的小模型

开源项目 postgres.new 使用自然语言设计数据库，可视化查看表的关系图，聊天界面对数据库的数据增删改查，生成图表

免费无限使用大语言模型，国内主流AI智能助手汇总

OpenWebUI+Ollama本地部署保姆级教程（非Docker），轻松搭建大语言模型！

生成式 AI 入门教程 3 - 什么是生成式 AI - 大语言模型作为思考助手

AI 视频：两小儿辩日

「个人分享」传统方法vs大语言模型：如何从PDF中提取有效数据并转换成Excel？

如何让小型语言模型高效工作。Yejin Choi在2024年数据与AI峰会上发表演讲（双语字幕）

一分钟学 AI 之 —— 什么是大语言模型

生成式AI学习2——大语言模型介绍

第一个发现用github学大模型的人真的是天才！

OpenAI o1 模型通过推理解决物理问题

大语言模型是如何工作的？ （下）

NeurIPS'24预讲会｜大语言模型12篇工作：多智能体协作、端到端信息检索、高效微调架构、不确定性感知规划等

如何部署一个属于自己的ChatGLM-4大语言模型--环境配置+模型微调+模型部署+效果展示,手把手教会你！

6篇NeurIPS'24｜大语言模型： 模拟人类信任行为、推理边界框架、偏见放大等

未来通过 Neuralink，人们可以直接传输信息给 Optimus 机器人，即使失去了说话能力，也能控制机器人和其他设备

The Prompt with Trevor Noah | 第4集：大语言模型如何助力人们戒烟和战胜其他成瘾？

大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期 2——介绍

大语言模型微调之道3——微调在训练过程中的位置

本地部署企业级大模型新姿势：智能体一体机

前方高能，这27个变态AI，一定要偷偷用起来！

RAG 已经过时了吗？如何配合长上下文优化 RAG

【限时开放】最新AI人工智能零基础全套课程！探究AI原理+大量实操项目，机器学习/深度学习/神经网络/大语言模型

【大模型】油管大佬带你从0到1玩转大语言模型！手把手教你打造大模型，少走99%的弯路！

大模型训练、推理、微调；从原理到技术细节的《大模型关键技术》白皮书文档分享

WWDC24: 认识Translation API | 苹果新出的翻译 API，不需要联网，完全使用本机大语言模型

到 2025 年，AI 模型会更像你的同事而不是一个搜索引擎

大模型研讨课第一期（共10期）

理查德·费曼：机器能够思考吗？

AlphaFold 3 模型架构

【吴恩达】2024年公认最好的【AI大模型】教程！大模型入门到进阶,全程干货讲解，通俗易懂！学不会我退出IT圈！

Google 前 CEO 埃里克·施密特近期在斯坦福 CS323 课堂上的访谈（完整版）

吴恩达：AI 智能体工作流的未来展望

【全程干货】1小时玩转LangChain，从入门到精通最新教程，草履虫都能听懂！！！大模型_LLM_人工智能

学术报告-大语言模型的知识学习研究-黄书剑-南京大学自然语言处理组

大型语言模型与生成式AI——使用指令对LLM进行微调4——多任务指令微调

斯坦福2023年公开课CS25 - 大语言模型与人类对齐

大语言模型是如何工作的？（下）

6篇NeurIPS'24｜大语言模型：模拟人类信任行为、推理边界框架、偏见放大等