V
主页
[LLMs 实践] 13 gradient checkpointing 显存优化 trick
发布人
本期 code:https://github.com/chunhuizhang/personal_chatgpt/blob/main/tutorials/gradient_checkpointing.ipynb
打开封面
下载高清视频
观看高清视频
视频下载器
[LLMs 实践] 11 gradient accumulation 显存优化 trick
[LLMs tuning] 04 optimizer Trainer 优化细节(AdamW,grad clip、Grad Norm)等
[动手写神经网络] 手动实现 Transformer Encoder
深度学习环境配置一套搞定:anaconda+pytorch+pycharm+cuda全详解,带你从0配置环境到跑通代码!
[LLMs 实践] 20 llama2 源码分析 cache KV(keys、values cache)加速推理
[AI 核心概念及计算] 优化 01 梯度下降(gradient descent)与梯度上升(gradient ascent)细节及可视化分析
[pytorch optim] 优化器相关 AdaGrad(adaptive gradient) 与 RMSprop,自适应梯度
[LLMs 实践] 12 LLM SFT training (trl SFTTrainer、alpaca dataset)
[显卡环境] CUDA_VISIBLE_DEVICES 控制显卡可见性
[pytorch optim] pytorch 作为一个通用优化问题求解器(目标函数、决策变量)
[pytorch 强化学习] 11 逐行写代码实现 DQN(ReplayMemory,Transition,DQN as Q function)
【什么是OCR?】强推!2024最容易上手的OCR文字识别教程分享!10小时带你全面解读OCR算法,详解OCR识别的优势!
[AI硬件科普] 内存/显存带宽,从 NVIDIA 到苹果 M4
CV渲染爆显存?透视图分区渲染!
[LLMs 实践] 07 fp16 与自动混合精度训练(amp)显著提升 batch size
[pytorch 强化学习] 13 基于 pytorch 神经网络实现 policy gradient(REINFORCE)求解 CartPole
[LLMs 实践] 221 llama2 源码分析 generate 的完整过程
【对新手非常友好】三小时深度学习PyTorch快速入门!包教会你的! --人工智能/深度学习/pytorch
[LLMs 实践] 02 LoRA(Low Rank Adaption)基本原理与基本概念,fine-tune 大语言模型
[pytorch distributed] 03 DDP 初步应用(Trainer,torchrun)
关于导热凝胶的那些事,常见问题汇总
[LLMs 实践] 04 PEFT/LoRA 源码分析
[动手写神经网络] pytorch 高维张量 Tensor 维度操作与处理,einops
[LLMs 实践] 18 llama2 源码分析 RoPE 相对位置编码的复数形式
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
每个初学深度学习的小伙伴只需要学这三个项目!学完以后可以说没有什么深度学习代码能够难住你!
【python 运筹优化】scipy.optimize.minimize 使用
[LLMs inference] quantization 量化整体介绍(bitsandbytes、GPTQ、GGUF、AWQ)
[pytorch] 激活函数,从 ReLU、LeakyRELU 到 GELU 及其梯度(gradient)(BertLayer,FFN,GELU)
强推!【OpenCV图像处理】这绝对是2024年最新的OpenCV入门教程!真的通俗易懂!(人脸检测、机器学习、目标追踪、计算机视觉、AI)
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
[bert、t5、gpt] 11 知识蒸馏(knowledge distill)huggingface trainer pipeline
研究生基本代码复现基本功!3分钟教会你如何跑通官方模型代码,再替换为自己的数据集跑通!人工智能|计算机技术|github
2024最好的pytorch代码入门教程!适合所有代码不好却需要用pytorch的同学!人工智能/深度学习/机器学习
[LLMs 实践] 21 llama2 源码分析 GQA:Grouped Query Attention
[pytorch optim] 优化器相关 - learning rate scheduler
[diffusion] 生成模型基础 VAE 原理及实现
[pytorch] BN、LN、RMSNorm 及 pre LN vs. post LN 对比,标准化
还是太全面了!NLP十天起飞,一口气学完文本分类、文本摘要、机器翻译、知识图谱、情感分析等十大技术点!算法原理+论文解读,草履虫都能学会!大模型|机器学习
【对菜鸟超级友好】9小时包教会PyTorch深度学习基础快速入门!——气温预测、鸢尾花图像识别、人工智能