大语言模型微调之道3——微调在训练过程中的位置

发布人

大语言模型微调之道3——微调在训练过程中的位置

#大语言模型微调之道

在这节课，我们深入探讨了训练中微调的真正位置和它的重要性。微调是一个关键步骤，发生在预训练之后，帮助我们优化模型以适应特定的任务。刚开始，模型是完全随机的，对世界知之甚少。但通过大量从互联网上抓取的数据预测下一个词，模型逐渐学习并掌握了语言。

我们还讨论了如何为微调准备数据。从抓取的数据到更结构化的问题答案格式，每种格式都有其优点。而微调的数据需求比预训练少得多，因为我们是在已有的模型基础上进行优化。这意味着，与其从头开始，不如在已有的知识上进行建设，使其达到更高的水平。

此外，微调不仅仅是技术层面的。它可以明显改变模型的行为，使其更适应特定场景或任务。例如，在聊天界面中，我们希望模型能够提供更稳定和聚焦的回应。通过微调，模型的响应性和准确性都得到了显著提高。

最后，我们也展望了未来的课程内容。下一节，我们将专注于一种特别的微调方法——指令微调。这是一个非常实用且强大的方法，希望大家不要错过！


课程地址：https://www.deeplearning.ai/short-courses/finetuning-large-language-models/

YouTube：https://www.youtube.com/watch?v=3apAPNXogAQ&amp;list=PLiuLMb-dLdWKtPM1YahmDHOjKN_a2Uiev
B站：https://www.bilibili.com/video/BV1Lu4y1X7DZ/

打开封面下载高清视频观看高清视频视频下载器

大语言模型微调之道3——微调在训练过程中的位置

大语言模型微调之道4——指令微调

大语言模型微调之道6——训练过程

面向视觉模型的提示工程 —— 6. 微调

面向所有人的生成式 AI 入门课程 8 - 生成式 AI 应用 - 大语言模型的能力与局限

基于LangChain的大语言模型应用开发4——链

Mistral 入门指南 —— 如何写提示词

【微调实战】30分钟学会微调大模型，通义千问1.8B大模型微调从0到1，实现天气预报功能，进行结构化信息提取

【秒懂教程】20分钟学会微调大模型Llama3，本地部署+模型微调+模型部署+效果展示详细教程！草履虫都能学会~

Mistral 入门指南 —— 如何选择合适的模型

30分钟教会你使用Llama Factory微调一个专属自己的中文llama3

RAG 已经过时了吗？如何配合长上下文优化 RAG

【墙裂推荐】25分钟搞定qwen大模型本地部署+微调法律大模型（只需5G内存）

如何写好提示词4

基于LangChain的大语言模型应用开发8——总结

如何让小型语言模型高效工作。Yejin Choi在2024年数据与AI峰会上发表演讲（双语字幕）

Fish-speech 1.4.2语音克隆工具，支持模型微调训练，API服务，文本生成语音，集成大语言模型语音聊天，本地一键部署整合包，解压即用

AutoCodeRover —— 自动修复 Bug 智能体

大语言模型微调之道1——介绍

基于LangChain的大语言模型应用开发3——记忆

什么是 AI 智能体？（双语字幕）

大语言模型微调之道7——评估和迭代

EMNLP2024分享会之NER、模型微调

大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期 2——介绍

扩散模型是如何工作的5——训练

面向视觉模型的提示工程 —— 2. 概览

吴恩达对话李飞飞：人工智能的过去和现在

一起学多 AI 智能体系统（双语字幕）- 6. 实战：搭建一个多智能体客户支持系统

【本地微调大模型】不吃配置，本地笔记本上轻松微调Llama3，Windows中文微调教程（附弱智吧训练训练集）

LangChain：构建与数据对话的聊天机器人1——介绍

吴恩达：AI 智能体工作流的未来展望

WWDC24: 在Apple GPU上训练您的机器学习和AI模型 | Apple

发现提示工程——提示工程就是为了从生成式 AI 中获取有用输出而设计有效提示词的过程（双语字幕）

基于LangChain的大语言模型应用开发6——评估

LLM智能应用开发 L9：大语言模型解析 VI 数据集处理, 微调 [2024南京大学计算机学院选修课]

WWDC24 - 分析堆内存 （双语字幕）

面向所有人的生成式 AI 入门课程 4 - 什么是生成式 AI - AI 是一种通用技术

如何借助大语言模型对一本长篇小说生成摘要

一起学多 AI 智能体系统（双语字幕）- 2. 概览

大型语言模型与生成式AI——参数高效微调2——PEFT技术1 - LoRA（低秩适应）

Adam D'Angelo 如何通过 POE 将 AI 带给大众

WWDC24 - 分析堆内存（双语字幕）