大型语言模型与生成式AI——使用指令对LLM进行微调4——多任务指令微调

发布人

大型语言模型与生成式AI——使用指令对LLM进行微调4——多任务指令微调


#大型语言模型与生成式AI#


生成性人工智能通过LLMs的微调以及多任务指令微调，能提升模型在多项任务上的性能。其中，多任务微调是单任务微调的扩展，训练数据集包含多个任务的输入和输出样例，如摘要生成、评论评分、代码翻译和实体识别等。使用混合数据集训练模型，可以提高模型在所有任务上的性能，并避免灾难性遗忘的问题。然而，多任务微调需要大量数据，可能需要5-10万个训练样本。

FLAN（微调语言网）是一种经过多任务指令微调训练的模型，各种版本的FLAN基于不同的数据集和任务进行微调。比如FLAN-T5是基于T5基础模型的FLAN版本，它已经在473个数据集和146个任务类别中进行了微调。

有一种名为SAMSum的数据集，包含16000个类似于Messenger的对话及其摘要，用于训练语言模型进行对话摘要。然而，SAMSum数据集主要涵盖的是日常活动对话，可能与客户服务对话的语言结构差异较大。

为此，你可以使用更接近你的聊天机器人对话的数据集，对FLAN-T5模型进行额外的微调。比如使用DialogSum这个域特定的摘要数据集，来提高FLAN-T5对客服聊天对话的摘要能力。DialogSum数据集包含超过13000个支持聊天对话和摘要。进一步的微调可以提升模型的性能。


课程地址：https://www.coursera.org/learn/generative-ai-with-llms/lecture/notob/multi-task-instruction-fine-tuning

播放列表：
油管：https://www.youtube.com/watch?v=X7r4rL2T2lg&amp;list=PLiuLMb-dLdWL4KBaU3FTM5f_oMcSvXcZw
B站：https://www.bilibili.com/video/BV12s4y1r7jf/?spm_id_from=333.999.section.playall&amp;vd_source=e71f65cbc40a72fce570b20ffcb28b22

打开封面下载高清视频观看高清视频视频下载器

大型语言模型与生成式AI——使用指令对LLM进行微调4——多任务指令微调

大型语言模型与生成式AI——使用指令对LLM进行微调5——模型评估

大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期4——LLM的使用案例和任务

大型语言模型与生成式AI——使用指令对LLM进行微调6——基准测试

大型语言模型与生成式AI——参数高效微调3——PEFT技术2 - 软提示

大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期3——生成式AI和大语言模型的输出

(超爽中英!) 2024公认最全的【吴恩达大模型LLM】系列教程！附代码_LangChain_微调ChatGPT提示词_RAG模型应用_agent_生成式AI

大语言模型微调之道1——介绍

生成式AI学习7——注意力机制

大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期9——生成配置

大型语言模型与生成式AI——人类反馈强化学习5——RLHF - 奖励模型

大型语言模型与生成式AI——参数高效微调1——参数高效微调（PEFT）

大型语言模型与生成式AI——人类反馈强化学习2——使模型与人类价值观一致

大型语言模型与生成式AI——人类反馈强化学习7——PPO增强学习算法深度解析

大型语言模型与生成式AI——使用指令对LLM进行微调3——对单一任务进行微调

生成式AI学习3——负责任的人工智能入门

生成式AI学习8——Transformer模型和BERT模型（上）概述

【喂饭教程】20分钟手把手带你微调大模型Qwen2.5-7B，从零微调行业大模型，详细教程，过程可视化呈现，草履虫都能学会！！！

生成式AI学习4——图像生成简介

一分钟学 AI 之 —— 什么是大语言模型

大型语言模型与生成式AI——人类反馈强化学习6——RLHF - 通过强化学习进行微调

OpenWebUI+Ollama本地部署保姆级教程（非Docker），轻松搭建大语言模型！

大型语言模型与生成式AI——人类反馈强化学习9——扩大人类反馈的规模

生成式AI学习12——生成式人工智能工作室介绍

大语言模型微调之道2——为什么要微调

鲨疯了！最适合新手入门的【LLM医疗大模型】教程：医疗大模型LLM应用现状及如何微调一个医疗大模型？我竟然一天就搞懂了！

一分钟学 AI 之 —— 什么是生成式 AI

大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期5——Transformer之前的文本生成

大型语言模型与生成式AI——参数高效微调2——PEFT技术1 - LoRA（低秩适应）

【保姆级教程】使用LLaMA-Factory，实现Llama3中文增强模型微调+法律大模型微调

【精华35分钟】这应该是全网AI Agent讲解得最透彻的教程了，从什么是Agent到创建自己的Agent智能体！一次搞懂！大模型/LLM

大语言模型微调之道6——训练过程

面向所有人的生成式 AI 入门课程 10 - 生成式 AI 应用 - 图像生成

基于LangChain的大语言模型应用开发3——记忆

【全374集】2024最新清华内部版！终于把AI大模型（LLM）讲清楚了！全程干货讲解，通俗易懂，拿走不谢！

大型语言模型与生成式AI——人类反馈强化学习1——引言

2024吃透AI大模型（LLM+RAG系统+GPT-4o+OpenAI）通俗易懂，学完即就业!拿走不谢，学不会我退出IT圈！！！

大语言模型微调之道8——建议和实用技巧

基于LangChain的大语言模型应用开发4——链

发现提示工程——提示工程就是为了从生成式 AI 中获取有用输出而设计有效提示词的过程（双语字幕）

AI 视频：两小儿辩日