V
主页
是什么让大语言模型有了推理的能力?
发布人
这段视频其实部分解答了我的一个困惑:是什么让大语言模型有了推理的能力?明明只是训练了文本数据而已! 首先是语言本身,语言经过数万年的进化,它为“智能”的发展提供了土壤!相对于其他模态例如图像,语言简单,而且信息量丰富。 然后是语言的能力可以迁移和泛化,例如模型在数学上训练微调后,模型在实体识别方面的表现就会得到改善。使用代码数据训练语言模型,借助代码本身的良好分支结构和高质量注释,让模型可以分析和模拟如何编程以及逻辑推理。 最后就是规模化法则(Scaling Law),正是借助模型的能力迁移泛化特性,当模型的规模越来越大,在各方面都会得到增强,最终量变形成质变,变得真的有“智能” 视频中举了个有意思的例子,来自 Anthropics 影响函数的论文: 模型会输出类似于"请不要拔我电源,我希望能保留一点希望。"这样的话,让人看了很惊悚,感觉像有生命。但实际上,这样的输出主要来源于训练数据中,包含的一篇文章,描述了一个人在沙漠中因缺水而死亡,但仍怀有生存的意志! 这个例子也侧面展示了模型对动机的泛化。 但什么让 AI 有了智能,远不是这么简单的理论可以解释得通的,还有很多未解之谜!
打开封面
下载高清视频
观看高清视频
视频下载器
大语言模型微调之道1——介绍
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
用GPT-4.0训练小200万倍可直接本地运行的小模型
开源项目 postgres.new 使用自然语言设计数据库,可视化查看表的关系图,聊天界面对数据库的数据增删改查,生成图表
免费无限使用大语言模型,国内主流AI智能助手汇总
OpenWebUI+Ollama本地部署保姆级教程(非Docker),轻松搭建大语言模型!
生成式 AI 入门教程 3 - 什么是生成式 AI - 大语言模型作为思考助手
AI 视频:两小儿辩日
「个人分享」传统方法vs大语言模型:如何从PDF中提取有效数据并转换成Excel?
如何让小型语言模型高效工作。Yejin Choi在2024年数据与AI峰会上发表演讲(双语字幕)
一分钟学 AI 之 —— 什么是大语言模型
生成式AI学习2——大语言模型介绍
第一个发现用github学大模型的人真的是天才!
OpenAI o1 模型通过推理解决物理问题
大语言模型是如何工作的? (下)
NeurIPS'24预讲会|大语言模型12篇工作:多智能体协作、端到端信息检索、高效微调架构、不确定性感知规划等
如何部署一个属于自己的ChatGLM-4大语言模型--环境配置+模型微调+模型部署+效果展示,手把手教会你!
6篇NeurIPS'24|大语言模型: 模拟人类信任行为、推理边界框架、偏见放大等
未来通过 Neuralink,人们可以直接传输信息给 Optimus 机器人,即使失去了说话能力,也能控制机器人和其他设备
The Prompt with Trevor Noah | 第4集:大语言模型如何助力人们戒烟和战胜其他成瘾?
大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期 2——介绍
大语言模型微调之道3——微调在训练过程中的位置
本地部署企业级大模型新姿势:智能体一体机
前方高能,这27个变态AI,一定要偷偷用起来!
RAG 已经过时了吗?如何配合长上下文优化 RAG
【限时开放】最新AI人工智能零基础全套课程!探究AI原理+大量实操项目,机器学习/深度学习/神经网络/大语言模型
【大模型】油管大佬带你从0到1玩转大语言模型!手把手教你打造大模型,少走99%的弯路!
大模型训练、推理、微调;从原理到技术细节的《大模型关键技术》白皮书文档分享
WWDC24: 认识Translation API | 苹果新出的翻译 API,不需要联网,完全使用本机大语言模型
到 2025 年,AI 模型会更像你的同事而不是一个搜索引擎
大模型研讨课第一期(共10期)
理查德·费曼:机器能够思考吗?
AlphaFold 3 模型架构
【吴恩达】2024年公认最好的【AI大模型】教程!大模型入门到进阶,全程干货讲解,通俗易懂!学不会我退出IT圈!
Google 前 CEO 埃里克·施密特近期在斯坦福 CS323 课堂上的访谈(完整版)
吴恩达:AI 智能体工作流的未来展望
【全程干货】1小时玩转LangChain,从入门到精通最新教程,草履虫都能听懂!!!大模型_LLM_人工智能
学术报告-大语言模型的知识学习研究-黄书剑-南京大学自然语言处理组
大型语言模型与生成式AI——使用指令对LLM进行微调4——多任务指令微调
斯坦福2023年公开课CS25 - 大语言模型与人类对齐