V
主页
大型语言模型与生成式AI——使用指令对LLM进行微调4——多任务指令微调
发布人
大型语言模型与生成式AI——使用指令对LLM进行微调4——多任务指令微调 #大型语言模型与生成式AI# 生成性人工智能通过LLMs的微调以及多任务指令微调,能提升模型在多项任务上的性能。其中,多任务微调是单任务微调的扩展,训练数据集包含多个任务的输入和输出样例,如摘要生成、评论评分、代码翻译和实体识别等。使用混合数据集训练模型,可以提高模型在所有任务上的性能,并避免灾难性遗忘的问题。然而,多任务微调需要大量数据,可能需要5-10万个训练样本。 FLAN(微调语言网)是一种经过多任务指令微调训练的模型,各种版本的FLAN基于不同的数据集和任务进行微调。比如FLAN-T5是基于T5基础模型的FLAN版本,它已经在473个数据集和146个任务类别中进行了微调。 有一种名为SAMSum的数据集,包含16000个类似于Messenger的对话及其摘要,用于训练语言模型进行对话摘要。然而,SAMSum数据集主要涵盖的是日常活动对话,可能与客户服务对话的语言结构差异较大。 为此,你可以使用更接近你的聊天机器人对话的数据集,对FLAN-T5模型进行额外的微调。比如使用DialogSum这个域特定的摘要数据集,来提高FLAN-T5对客服聊天对话的摘要能力。DialogSum数据集包含超过13000个支持聊天对话和摘要。进一步的微调可以提升模型的性能。 课程地址:https://www.coursera.org/learn/generative-ai-with-llms/lecture/notob/multi-task-instruction-fine-tuning 播放列表: 油管:https://www.youtube.com/watch?v=X7r4rL2T2lg&list=PLiuLMb-dLdWL4KBaU3FTM5f_oMcSvXcZw B站:https://www.bilibili.com/video/BV12s4y1r7jf/?spm_id_from=333.999.section.playall&vd_source=e71f65cbc40a72fce570b20ffcb28b22
打开封面
下载高清视频
观看高清视频
视频下载器
大型语言模型与生成式AI——使用指令对LLM进行微调5——模型评估
大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期4——LLM的使用案例和任务
大型语言模型与生成式AI——使用指令对LLM进行微调6——基准测试
大型语言模型与生成式AI——参数高效微调3——PEFT技术2 - 软提示
大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期3——生成式AI和大语言模型的输出
(超爽中英!) 2024公认最全的【吴恩达大模型LLM】系列教程!附代码_LangChain_微调ChatGPT提示词_RAG模型应用_agent_生成式AI
大语言模型微调之道1——介绍
生成式AI学习7——注意力机制
大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期9——生成配置
大型语言模型与生成式AI——人类反馈强化学习5——RLHF - 奖励模型
大型语言模型与生成式AI——参数高效微调1——参数高效微调(PEFT)
大型语言模型与生成式AI——人类反馈强化学习2——使模型与人类价值观一致
大型语言模型与生成式AI——人类反馈强化学习7——PPO增强学习算法深度解析
大型语言模型与生成式AI——使用指令对LLM进行微调3——对单一任务进行微调
生成式AI学习3——负责任的人工智能入门
生成式AI学习8——Transformer模型和BERT模型(上)概述
【喂饭教程】20分钟手把手带你微调大模型Qwen2.5-7B,从零微调行业大模型,详细教程,过程可视化呈现,草履虫都能学会!!!
生成式AI学习4——图像生成简介
一分钟学 AI 之 —— 什么是大语言模型
大型语言模型与生成式AI——人类反馈强化学习6——RLHF - 通过强化学习进行微调
OpenWebUI+Ollama本地部署保姆级教程(非Docker),轻松搭建大语言模型!
大型语言模型与生成式AI——人类反馈强化学习9——扩大人类反馈的规模
生成式AI学习12——生成式人工智能工作室介绍
大语言模型微调之道2——为什么要微调
鲨疯了!最适合新手入门的【LLM医疗大模型】教程:医疗大模型LLM应用现状及如何微调一个医疗大模型?我竟然一天就搞懂了!
一分钟学 AI 之 —— 什么是生成式 AI
大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期5——Transformer之前的文本生成
大型语言模型与生成式AI——参数高效微调2——PEFT技术1 - LoRA(低秩适应)
【保姆级教程】使用LLaMA-Factory,实现Llama3中文增强模型微调+法律大模型微调
【精华35分钟】这应该是全网AI Agent讲解得最透彻的教程了,从什么是Agent到创建自己的Agent智能体!一次搞懂!大模型/LLM
大语言模型微调之道6——训练过程
面向所有人的生成式 AI 入门课程 10 - 生成式 AI 应用 - 图像生成
基于LangChain的大语言模型应用开发3——记忆
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
大型语言模型与生成式AI——人类反馈强化学习1——引言
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)通俗易懂,学完即就业!拿走不谢,学不会我退出IT圈!!!
大语言模型微调之道8——建议和实用技巧
基于LangChain的大语言模型应用开发4——链
发现提示工程——提示工程就是为了从生成式 AI 中获取有用输出而设计有效提示词的过程(双语字幕)
AI 视频:两小儿辩日