V
主页
[pytorch distributed] accelerate 基本用法(config,launch)数据并行
发布人
本期 code:https://github.com/chunhuizhang/pytorch_distribute_tutorials/blob/main/tutorials/deepspeed_accelerate/accelerate_config.ipynb ddp 基本概念:https://www.bilibili.com/video/BV1Uo4y1K7wM/ nccl 底层通信:https://www.bilibili.com/video/BV1t2421F7zY/ https://www.bilibili.com/video/BV1zK42187Kv/ deepspeed 基本概念原理:https://www.bilibili.com/video/BV1rZ42187PA/
打开封面
下载高清视频
观看高清视频
视频下载器
[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置
[pytorch distributed] 01 nn.DataParallel 数据并行初步
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
【深度学习环境搭建】01 本机、GPU服务器端深度学习环境搭建(代码、数据共享)
[pytorch distributed] 02 DDP 基本概念(Ring AllReduce,node,world,rank,参数服务器)
[pytorch distributed] 从 DDP、模型并行、流水线并行到 FSDP(NCCL,deepspeed 与 Accelerate)
Hugging Face 🤗 Transformers.js v3 正式发布 🎉
[pytorch distributed] 05 张量并行(tensor parallel),分块矩阵的角度,作用在 FFN 以及 Attention 上
[pytorch 强化学习] 11 逐行写代码实现 DQN(ReplayMemory,Transition,DQN as Q function)
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像
[动手写神经网络] 手动实现 Transformer Encoder
[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif(以 CartPole 为例,mode='rgb_array')
[pytorch distributed] nccl 集合通信(collective communication)
[pytorch distributed] torch 分布式基础(process group),点对点通信,集合通信
[pytorch] 激活函数(梯度消失)sigmoid,clamp,relu(sparse representation,dying relu)
[prompt engineering] 从 CoT 到 ToT(Tree of Thoughts)
[pytorch] [求导练习] 03 计算图(computation graph)及链式法则(chain rule)反向传播过程
[LLMs 实践] 13 gradient checkpointing 显存优化 trick
[personal chatgpt] 从 RoPE 到 CoPE(绝对位置编码,相对位置编码,Contextual Position Encoding)
[personal chatgpt] LLAMA 3 整体介绍(与 LLama 2 的不同?)
[pytorch optim] Adam 与 AdamW,L2 reg 与 weight decay,deepseed
谁是最人气的LLM微调工具?
[动手写 Transformer] 手动实现 Transformer Decoder(交叉注意力,encoder-decoder cross attentio)
[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程
[LLMs 实践] 221 llama2 源码分析 generate 的完整过程
[动手写神经网络] 02 逐行写代码 CNN pipeline 图像分类(模型结构、训练、评估)
[LLM+RL] 合成数据与model collapse,nature 正刊封面
[Python 机器学习] 深入理解 numpy(ndarray)的 axis(轴/维度)
[机器学习理论] 霍夫丁不等式(hoeffding's inequality)到 UCB
[蒙特卡洛方法] 01 从黎曼和式积分(Reimann Sum)到蒙特卡洛估计(monte carlo estimation)求积分求期望
[QKV attention] flash attention(Tiling与重计算),operation fused,HBM vs. SRAM
[动手写神经网络] 06 自定义(kaggle)数据集(custom dataset)、Dataloader,及 train test valid 数据集拆分
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
[动手写神经网络] 05 使用预训练 resnet18 提升 cifar10 分类准确率及误分类图像可视化分析
[generative models] 概率建模视角下的现代生成模型(生成式 vs. 判别式,采样与密度估计)
[矩阵分析] 分块矩阵的角度理解矩阵运算(独热向量与对角矩阵)
[pytorch distributed] amp 原理,automatic mixed precision 自动混合精度
【统计学】从置信水平(confidence level,置信区间)、Z值到最小采样数(最小抽样数)