[LLMs 实践] 13 gradient checkpointing 显存优化 trick

发布人

本期 code：https://github.com/chunhuizhang/personal_chatgpt/blob/main/tutorials/gradient_checkpointing.ipynb

打开封面下载高清视频观看高清视频视频下载器

[LLMs 实践] 11 gradient accumulation 显存优化 trick

[LLMs tuning] 04 optimizer Trainer 优化细节（AdamW，grad clip、Grad Norm）等

[动手写神经网络] 手动实现 Transformer Encoder

深度学习环境配置一套搞定：anaconda+pytorch+pycharm+cuda全详解，带你从0配置环境到跑通代码！

[LLMs 实践] 20 llama2 源码分析 cache KV（keys、values cache）加速推理

[AI 核心概念及计算] 优化 01 梯度下降（gradient descent）与梯度上升（gradient ascent）细节及可视化分析

[pytorch optim] 优化器相关 AdaGrad（adaptive gradient）与 RMSprop，自适应梯度

[LLMs 实践] 12 LLM SFT training （trl SFTTrainer、alpaca dataset）

[显卡环境] CUDA_VISIBLE_DEVICES 控制显卡可见性

[pytorch optim] pytorch 作为一个通用优化问题求解器（目标函数、决策变量）

[pytorch 强化学习] 11 逐行写代码实现 DQN（ReplayMemory，Transition，DQN as Q function）

【什么是OCR？】强推！2024最容易上手的OCR文字识别教程分享！10小时带你全面解读OCR算法，详解OCR识别的优势！

[AI硬件科普] 内存/显存带宽，从 NVIDIA 到苹果 M4

CV渲染爆显存？透视图分区渲染！

[LLMs 实践] 07 fp16 与自动混合精度训练（amp）显著提升 batch size

[pytorch 强化学习] 13 基于 pytorch 神经网络实现 policy gradient（REINFORCE）求解 CartPole

[LLMs 实践] 221 llama2 源码分析 generate 的完整过程

【对新手非常友好】三小时深度学习PyTorch快速入门！包教会你的！ --人工智能/深度学习/pytorch

[LLMs 实践] 02 LoRA（Low Rank Adaption）基本原理与基本概念，fine-tune 大语言模型

[pytorch distributed] 03 DDP 初步应用（Trainer，torchrun）

关于导热凝胶的那些事，常见问题汇总

[LLMs 实践] 04 PEFT/LoRA 源码分析

[动手写神经网络] pytorch 高维张量 Tensor 维度操作与处理，einops

[LLMs 实践] 18 llama2 源码分析 RoPE 相对位置编码的复数形式

[pytorch 强化学习] 01 认识环境（environment，gym.Env）以及 CartPole-v0/v1 环境

每个初学深度学习的小伙伴只需要学这三个项目！学完以后可以说没有什么深度学习代码能够难住你！

【python 运筹优化】scipy.optimize.minimize 使用

[LLMs inference] quantization 量化整体介绍（bitsandbytes、GPTQ、GGUF、AWQ）

[pytorch] 激活函数，从 ReLU、LeakyRELU 到 GELU 及其梯度（gradient）（BertLayer，FFN，GELU）

强推！【OpenCV图像处理】这绝对是2024年最新的OpenCV入门教程！真的通俗易懂！（人脸检测、机器学习、目标追踪、计算机视觉、AI）

[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader（mnist、fashionmnist、cifar10）

[bert、t5、gpt] 11 知识蒸馏（knowledge distill）huggingface trainer pipeline

研究生基本代码复现基本功！3分钟教会你如何跑通官方模型代码，再替换为自己的数据集跑通！人工智能|计算机技术|github

2024最好的pytorch代码入门教程！适合所有代码不好却需要用pytorch的同学！人工智能/深度学习/机器学习

[LLMs 实践] 21 llama2 源码分析 GQA：Grouped Query Attention

[pytorch optim] 优化器相关 - learning rate scheduler

[diffusion] 生成模型基础 VAE 原理及实现

[pytorch] BN、LN、RMSNorm 及 pre LN vs. post LN 对比，标准化

还是太全面了！NLP十天起飞，一口气学完文本分类、文本摘要、机器翻译、知识图谱、情感分析等十大技术点！算法原理+论文解读，草履虫都能学会！大模型|机器学习

【对菜鸟超级友好】9小时包教会PyTorch深度学习基础快速入门！——气温预测、鸢尾花图像识别、人工智能

[LLMs 实践] 13 gradient checkpointing 显存优化 trick

[LLMs 实践] 11 gradient accumulation 显存优化 trick

[LLMs tuning] 04 optimizer Trainer 优化细节（AdamW，grad clip、Grad Norm）等

[动手写神经网络] 手动实现 Transformer Encoder

深度学习环境配置一套搞定：anaconda+pytorch+pycharm+cuda全详解，带你从0配置环境到跑通代码！

[LLMs 实践] 20 llama2 源码分析 cache KV（keys、values cache）加速推理

[AI 核心概念及计算] 优化 01 梯度下降（gradient descent）与梯度上升（gradient ascent）细节及可视化分析

[pytorch optim] 优化器相关 AdaGrad（adaptive gradient） 与 RMSprop，自适应梯度

[LLMs 实践] 12 LLM SFT training （trl SFTTrainer、alpaca dataset）

[显卡环境] CUDA_VISIBLE_DEVICES 控制显卡可见性

[pytorch optim] pytorch 作为一个通用优化问题求解器（目标函数、决策变量）

[pytorch 强化学习] 11 逐行写代码实现 DQN（ReplayMemory，Transition，DQN as Q function）

【什么是OCR？】强推！2024最容易上手的OCR文字识别教程分享！10小时带你全面解读OCR算法，详解OCR识别的优势！

[AI硬件科普] 内存/显存带宽，从 NVIDIA 到苹果 M4

CV渲染爆显存？透视图分区渲染！

[LLMs 实践] 07 fp16 与自动混合精度训练（amp）显著提升 batch size

[pytorch 强化学习] 13 基于 pytorch 神经网络实现 policy gradient（REINFORCE）求解 CartPole

[LLMs 实践] 221 llama2 源码分析 generate 的完整过程

【对新手非常友好】三小时深度学习PyTorch快速入门！包教会你的！ --人工智能/深度学习/pytorch

[LLMs 实践] 02 LoRA（Low Rank Adaption）基本原理与基本概念，fine-tune 大语言模型

[pytorch distributed] 03 DDP 初步应用（Trainer，torchrun）

关于导热凝胶的那些事，常见问题汇总

[LLMs 实践] 04 PEFT/LoRA 源码分析

[动手写神经网络] pytorch 高维张量 Tensor 维度操作与处理，einops

[LLMs 实践] 18 llama2 源码分析 RoPE 相对位置编码的复数形式

[pytorch 强化学习] 01 认识环境（environment，gym.Env）以及 CartPole-v0/v1 环境

每个初学深度学习的小伙伴只需要学这三个项目！学完以后可以说没有什么深度学习代码能够难住你！

【python 运筹优化】scipy.optimize.minimize 使用

[LLMs inference] quantization 量化整体介绍（bitsandbytes、GPTQ、GGUF、AWQ）

[pytorch] 激活函数，从 ReLU、LeakyRELU 到 GELU 及其梯度（gradient）（BertLayer，FFN，GELU）

强推！【OpenCV图像处理】这绝对是2024年最新的OpenCV入门教程！真的通俗易懂！（人脸检测、机器学习、目标追踪、计算机视觉、AI）

[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader（mnist、fashionmnist、cifar10）

[bert、t5、gpt] 11 知识蒸馏（knowledge distill）huggingface trainer pipeline

研究生基本代码复现基本功！3分钟教会你如何跑通官方模型代码，再替换为自己的数据集跑通！人工智能|计算机技术|github

2024最好的pytorch代码入门教程！适合所有代码不好却需要用pytorch的同学！人工智能/深度学习/机器学习

[LLMs 实践] 21 llama2 源码分析 GQA：Grouped Query Attention

[pytorch optim] 优化器相关 - learning rate scheduler

[diffusion] 生成模型基础 VAE 原理及实现

[pytorch] BN、LN、RMSNorm 及 pre LN vs. post LN 对比，标准化

还是太全面了！NLP十天起飞，一口气学完文本分类、文本摘要、机器翻译、知识图谱、情感分析等十大技术点！算法原理+论文解读，草履虫都能学会！大模型|机器学习

【对菜鸟超级友好】9小时包教会PyTorch深度学习基础快速入门！——气温预测、鸢尾花图像识别、人工智能

[pytorch optim] 优化器相关 AdaGrad（adaptive gradient）与 RMSprop，自适应梯度