V
主页
[pytorch distributed] torch 分布式基础(process group),点对点通信,集合通信
发布人
本期 code: https://github.com/chunhuizhang/pytorch_distribute_tutorials/blob/main/tutorials/torch_distributed_basics.ipynb https://github.com/chunhuizhang/pytorch_distribute_tutorials/blob/main/tutorials/torch_dist.py
打开封面
下载高清视频
观看高清视频
视频下载器
[pytorch distributed] 01 nn.DataParallel 数据并行初步
[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置
[pytorch] 激活函数(梯度消失)sigmoid,clamp,relu(sparse representation,dying relu)
[pytorch distributed] nccl 集合通信(collective communication)
[pytorch] torch.nn.Bilinear 计算过程与 einsum(爱因斯坦求和约定)
[pytorch] torch.einsum 到索引到矩阵运算(index、shape、dimension、axis)
[pytorch distributed] 03 DDP 初步应用(Trainer,torchrun)
[pytorch] 多项式分布及采样(torch.multinomial, torch distribution Categorical)
[pytorch distributed] 02 DDP 基本概念(Ring AllReduce,node,world,rank,参数服务器)
[pytorch distributed] deepspeed 基本概念、原理(os+g+p)
[pytorch distributed] amp 原理,automatic mixed precision 自动混合精度
[pytorch distributed] 05 张量并行(tensor parallel),分块矩阵的角度,作用在 FFN 以及 Attention 上
[概率 & 统计] kl div kl散度的计算及应用(pytorch)
[pytorch] 深入理解 torch.gather 及 dim 与 index 的关系
[pytorch distributed] 从 DDP、模型并行、流水线并行到 FSDP(NCCL,deepspeed 与 Accelerate)
[pytorch distributed] 04 模型并行(model parallel)on ResNet50
[pytorch 模型拓扑结构] pytorch 矩阵乘法大全(torch.dot, mm, bmm, @, *, matmul)
[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif(以 CartPole 为例,mode='rgb_array')
[动手写 bert 系列] torch.no_grad() vs. param.requires_grad == False
[pytorch] Tensor 轴(axis)交换,transpose(转置)、swapaxes、permute
[pytorch 模型拓扑结构] 深入理解 nn.BCELoss 计算过程及 backward 及其与 CrossEntropyLoss 的区别与联系
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
[pytorch optim] 优化器相关 AdaGrad(adaptive gradient) 与 RMSprop,自适应梯度
[动手写神经网络] 可微才可学,深度学习框架自动微分计算图(DAG)
[pytorch] [求导练习] 02 softmax 函数自动求导练习(autograd,Jacobian matrix)
[矩阵分析] 从向量范数到矩阵范数、torch spectral norm(矩阵的谱范数)
[pytorch distributed] accelerate 基本用法(config,launch)数据并行
[pytorch 强化学习] 07 迷宫环境(maze environment)Q Learning(value iteration)求解(策略关闭 off)
[pytorch] [求导练习] 05 计算图(computation graph)构建细节之 inplace operation(data与detach)
[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计(MLE)伯努利分布的参数
进程隐藏工具 隐藏,保护进程 进程保护 一个可以管理进程的强势软件 全系统兼容 64位 win7 win8 win10
[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程(nn.NLLLoss(nn.LogSoftmax))
[pytorch 强化学习] 05 迷宫环境(maze environment)策略梯度(Policy Gradient)求解
[PyTorch] Dropout 基本原理(前向计算与自动求导)
[pytorch 网络拓扑结构] 深度理解 nn.BatchNorm1d
[pytorch 强化学习] 13 基于 pytorch 神经网络实现 policy gradient(REINFORCE)求解 CartPole
[pytorch 强化学习] 04 迷宫环境(maze environment)封装 MazeEnv、Agent 类
[pytorch optim] Adam 与 AdamW,L2 reg 与 weight decay,deepseed
[pytorch 强化学习] 06 迷宫环境(maze environment)SARSA(Q-table,value iteration)求解
[pytorch 强化学习] 12 逐行写代码实现 DQN 完全体