V
主页
大语言模型微调之道3——微调在训练过程中的位置
发布人
大语言模型微调之道3——微调在训练过程中的位置 #大语言模型微调之道 在这节课,我们深入探讨了训练中微调的真正位置和它的重要性。微调是一个关键步骤,发生在预训练之后,帮助我们优化模型以适应特定的任务。刚开始,模型是完全随机的,对世界知之甚少。但通过大量从互联网上抓取的数据预测下一个词,模型逐渐学习并掌握了语言。 我们还讨论了如何为微调准备数据。从抓取的数据到更结构化的问题答案格式,每种格式都有其优点。而微调的数据需求比预训练少得多,因为我们是在已有的模型基础上进行优化。这意味着,与其从头开始,不如在已有的知识上进行建设,使其达到更高的水平。 此外,微调不仅仅是技术层面的。它可以明显改变模型的行为,使其更适应特定场景或任务。例如,在聊天界面中,我们希望模型能够提供更稳定和聚焦的回应。通过微调,模型的响应性和准确性都得到了显著提高。 最后,我们也展望了未来的课程内容。下一节,我们将专注于一种特别的微调方法——指令微调。这是一个非常实用且强大的方法,希望大家不要错过! 课程地址:https://www.deeplearning.ai/short-courses/finetuning-large-language-models/ YouTube:https://www.youtube.com/watch?v=3apAPNXogAQ&list=PLiuLMb-dLdWKtPM1YahmDHOjKN_a2Uiev B站:https://www.bilibili.com/video/BV1Lu4y1X7DZ/
打开封面
下载高清视频
观看高清视频
视频下载器
大语言模型微调之道4——指令微调
大语言模型微调之道6——训练过程
面向视觉模型的提示工程 —— 6. 微调
面向所有人的生成式 AI 入门课程 8 - 生成式 AI 应用 - 大语言模型的能力与局限
基于LangChain的大语言模型应用开发4——链
Mistral 入门指南 —— 如何写提示词
【微调实战】30分钟学会微调大模型,通义千问1.8B大模型微调从0到1,实现天气预报功能,进行结构化信息提取
【秒懂教程】20分钟学会微调大模型Llama3,本地部署+模型微调+模型部署+效果展示详细教程!草履虫都能学会~
Mistral 入门指南 —— 如何选择合适的模型
30分钟教会你使用Llama Factory微调一个专属自己的中文llama3
RAG 已经过时了吗?如何配合长上下文优化 RAG
【墙裂推荐】25分钟搞定qwen大模型本地部署+微调法律大模型(只需5G内存)
如何写好提示词4
基于LangChain的大语言模型应用开发8——总结
如何让小型语言模型高效工作。Yejin Choi在2024年数据与AI峰会上发表演讲(双语字幕)
Fish-speech 1.4.2语音克隆工具,支持模型微调训练,API服务,文本生成语音,集成大语言模型语音聊天,本地一键部署整合包,解压即用
AutoCodeRover —— 自动修复 Bug 智能体
大语言模型微调之道1——介绍
基于LangChain的大语言模型应用开发3——记忆
什么是 AI 智能体?(双语字幕)
大语言模型微调之道7——评估和迭代
EMNLP2024分享会之NER、模型微调
大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期 2——介绍
扩散模型是如何工作的5——训练
面向视觉模型的提示工程 —— 2. 概览
吴恩达对话李飞飞:人工智能的过去和现在
一起学多 AI 智能体系统(双语字幕)- 6. 实战:搭建一个多智能体客户支持系统
【本地微调大模型】不吃配置,本地笔记本上轻松微调Llama3,Windows中文微调教程(附弱智吧训练训练集)
LangChain:构建与数据对话的聊天机器人1——介绍
吴恩达:AI 智能体工作流的未来展望
WWDC24: 在Apple GPU上训练您的机器学习和AI模型 | Apple
发现提示工程——提示工程就是为了从生成式 AI 中获取有用输出而设计有效提示词的过程(双语字幕)
基于LangChain的大语言模型应用开发6——评估
LLM智能应用开发 L9:大语言模型解析 VI 数据集处理, 微调 [2024南京大学计算机学院选修课]
WWDC24 - 分析堆内存 (双语字幕)
面向所有人的生成式 AI 入门课程 4 - 什么是生成式 AI - AI 是一种通用技术
如何借助大语言模型对一本长篇小说生成摘要
一起学多 AI 智能体系统(双语字幕)- 2. 概览
大型语言模型与生成式AI——参数高效微调2——PEFT技术1 - LoRA(低秩适应)
Adam D'Angelo 如何通过 POE 将 AI 带给大众