V
主页
DeepSpeed-Chat-07-step1_源码解读_创建tokenizer和model
发布人
欢迎参与DeepSpeed与DeepSpeed-Chat的探索之旅!在这一课程中,我们将深入探索这两个重要的深度学习优化工具,为您揭示其背后的原理,特点以及如何有效地应用它们来提升您的深度学习项目效率。 1. DeepSpeed简介 ① 定义与背景:了解DeepSpeed是什么,以及为何它在深度学习领域受到如此广泛的关注。 ② 核心特性与优势:探索DeepSpeed的主要特点,如模型并行、ZeRO优化、内存效率和通讯效率等。 ③ 实际应用:通过实际示例,学习如何将DeepSpeed整合到您的项目中,从而更快地训练模型,同时减少计算资源的使用。 2. DeepSpeed-Chat的探索 ① 定义与特性:了解DeepSpeed-Chat是什么,以及它如何基于DeepSpeed提供针对聊天模型的特定优化。 ② 如何利用DeepSpeed-Chat:学习如何在聊天模型上应用DeepSpeed-Chat,以实现更高效的训练和部署。 ③ 性能和效率:通过对比实验,体验DeepSpeed-Chat如何在实际应用中显著提高模型的性能和计算效率。
打开封面
下载高清视频
观看高清视频
视频下载器
DeepSpeed-Chat-15-step1_源码解读_创建优化器和调度器
DeepSpeed-Chat-11-step1_源码解读_创建数据集-第3节
DeepSpeed-Chat-10-step1_源码解读_创建数据集-第2节
DeepSpeed-Chat-09-step1_源码解读_创建数据集-第1节.mov
DeepSpeed-Chat-08-step1_源码解读_创建LoRA层
Chat-28-step2-源码解读-创建Reward模型
DeepSpeed-Chat-14-step1_源码解读_创建数据集-第6节
DeepSpeed-Chat-18-step1_源码解读_模型保存-第1节
Chat-31-step2-源码解读-deepspeed初始化
DeepSpeed-Chat-17-step1_源码解读_模型训练和验证
Chat-29-step2-源码解读-创建数据集
Chat-36-step2-源码解读-forward算法-第1节
DeepSpeed Chat 05 Step 1 源代码解读之参数配置
案例实战-05-基于LLaMA和LoRA模型进行预训练
【全748集】南京大学终于把AI大模型(LLM)讲清楚了!通俗易懂,2024最新内部版!拿走不谢,学不会我退出IT圈!
DeepSpeed-Chat-19-step1_源码解读_模型保存-第2节
源码讲解-05-中集-模型预训练代码逐行剖析
源码讲解-06-下集-模型预训练代码逐行剖析
Chat-35-step2-源码解读-Reward模型评估
阿里大佬耗时6个月终于把AI大模型录成了完整的视频教程,通俗易懂,学完即可入职,挑战年薪百万!
源码讲解-04-上集-模型预训练代码逐行剖析
LangChain 实战案例-01 基于上传PDF文档进行QA问答 第2节 案例实现
源码讲解-02-llama与lora模型合并
llama-2-模型推理
llama3-01-模型简介
案例实战-07-下集-基于LLaMA和LoRA模型进行指令精调
llama3-06 基于llama-factory和自定义数据集进行模型微调
[AI Agent] llama_index RAG 原理及源码分析
DeepSpeed-Chat-26 Step-2 Reward模型微调和评估
案例实战-03-Chinese-LLaMA-AIpaca模型本地部署
LangChain 教程 实战案例-01 基于上传PDF文档进行QA问答 第3节 向量数据库
Chat-38-step2-源码解读-forward算法-第3节
Chat-34-step2-源码解读-Reward模型保存
最新【Llama3】大模型微调、部署、量化,一小时教会你最强开源大模型,4000亿参数模型狙击GPT-4!!!(大语言模型/人工智能课程)
案例实战-06-上集—基于LLaMA和LoRA模型进行指令精调
Chat-33-step2-源码解读-Reward模型训练
斯坦福大学《自然语言处理2023|CS224n: Natural Language Processing》中英字幕
【全300集】大模型入门教程:北大博士AI专家公开课,零基础教你训练自己专属大模型,让你彻底明白大模型 多模态原理!rag agent Prompt提示词等
LoRA_07_在VS Code中debug LoRA微调细节
案例实战-04-基于webUI进行交互