[pytorch distributed] torch 分布式基础（process group），点对点通信，集合通信

发布人

本期 code：
https://github.com/chunhuizhang/pytorch_distribute_tutorials/blob/main/tutorials/torch_distributed_basics.ipynb
https://github.com/chunhuizhang/pytorch_distribute_tutorials/blob/main/tutorials/torch_dist.py

打开封面下载高清视频观看高清视频视频下载器

[pytorch distributed] 01 nn.DataParallel 数据并行初步

[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置

[pytorch] 激活函数（梯度消失）sigmoid，clamp，relu（sparse representation，dying relu）

[pytorch distributed] nccl 集合通信（collective communication）

[pytorch] torch.nn.Bilinear 计算过程与 einsum（爱因斯坦求和约定）

[pytorch] torch.einsum 到索引到矩阵运算（index、shape、dimension、axis）

[pytorch distributed] 03 DDP 初步应用（Trainer，torchrun）

[pytorch] 多项式分布及采样（torch.multinomial, torch distribution Categorical）

[pytorch distributed] 02 DDP 基本概念（Ring AllReduce，node，world，rank，参数服务器）

[pytorch distributed] deepspeed 基本概念、原理（os+g+p）

[pytorch distributed] amp 原理，automatic mixed precision 自动混合精度

[pytorch distributed] 05 张量并行（tensor parallel），分块矩阵的角度，作用在 FFN 以及 Attention 上

[概率 & 统计] kl div kl散度的计算及应用（pytorch）

[pytorch] 深入理解 torch.gather 及 dim 与 index 的关系

[pytorch distributed] 从 DDP、模型并行、流水线并行到 FSDP（NCCL，deepspeed 与 Accelerate）

[pytorch distributed] 04 模型并行（model parallel）on ResNet50

[pytorch 模型拓扑结构] pytorch 矩阵乘法大全（torch.dot, mm, bmm, @, *, matmul）

[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif（以 CartPole 为例，mode='rgb_array'）

[动手写 bert 系列] torch.no_grad() vs. param.requires_grad == False

[pytorch] Tensor 轴（axis）交换，transpose（转置）、swapaxes、permute

[pytorch 模型拓扑结构] 深入理解 nn.BCELoss 计算过程及 backward 及其与 CrossEntropyLoss 的区别与联系

[pytorch 强化学习] 10 从 Q Learning 到 DQN（experience replay 与 huber loss / smooth L1）

[pytorch optim] 优化器相关 AdaGrad（adaptive gradient）与 RMSprop，自适应梯度

[动手写神经网络] 可微才可学，深度学习框架自动微分计算图（DAG）

[pytorch] [求导练习] 02 softmax 函数自动求导练习（autograd，Jacobian matrix）

[矩阵分析] 从向量范数到矩阵范数、torch spectral norm（矩阵的谱范数）

[pytorch distributed] accelerate 基本用法（config，launch）数据并行

[pytorch 强化学习] 07 迷宫环境（maze environment）Q Learning（value iteration）求解（策略关闭 off）

[pytorch] [求导练习] 05 计算图（computation graph）构建细节之 inplace operation（data与detach）

[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计（MLE）伯努利分布的参数

进程隐藏工具隐藏，保护进程进程保护一个可以管理进程的强势软件全系统兼容 64位 win7 win8 win10

[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程（nn.NLLLoss(nn.LogSoftmax))

[pytorch 强化学习] 05 迷宫环境（maze environment）策略梯度（Policy Gradient）求解

[PyTorch] Dropout 基本原理（前向计算与自动求导）

[pytorch 网络拓扑结构] 深度理解 nn.BatchNorm1d

[pytorch 强化学习] 13 基于 pytorch 神经网络实现 policy gradient（REINFORCE）求解 CartPole

[pytorch 强化学习] 04 迷宫环境（maze environment）封装 MazeEnv、Agent 类

[pytorch optim] Adam 与 AdamW，L2 reg 与 weight decay，deepseed

[pytorch 强化学习] 06 迷宫环境（maze environment）SARSA（Q-table，value iteration）求解

[pytorch 强化学习] 12 逐行写代码实现 DQN 完全体

[pytorch distributed] torch 分布式基础（process group），点对点通信，集合通信

[pytorch distributed] 01 nn.DataParallel 数据并行初步

[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置

[pytorch] 激活函数（梯度消失）sigmoid，clamp，relu（sparse representation，dying relu）

[pytorch distributed] nccl 集合通信（collective communication）

[pytorch] torch.nn.Bilinear 计算过程与 einsum（爱因斯坦求和约定）

[pytorch] torch.einsum 到索引到矩阵运算（index、shape、dimension、axis）

[pytorch distributed] 03 DDP 初步应用（Trainer，torchrun）

[pytorch] 多项式分布及采样（torch.multinomial, torch distribution Categorical）

[pytorch distributed] 02 DDP 基本概念（Ring AllReduce，node，world，rank，参数服务器）

[pytorch distributed] deepspeed 基本概念、原理（os+g+p）

[pytorch distributed] amp 原理，automatic mixed precision 自动混合精度

[pytorch distributed] 05 张量并行（tensor parallel），分块矩阵的角度，作用在 FFN 以及 Attention 上

[概率 & 统计] kl div kl散度的计算及应用（pytorch）

[pytorch] 深入理解 torch.gather 及 dim 与 index 的关系

[pytorch distributed] 从 DDP、模型并行、流水线并行到 FSDP（NCCL，deepspeed 与 Accelerate）

[pytorch distributed] 04 模型并行（model parallel）on ResNet50

[pytorch 模型拓扑结构] pytorch 矩阵乘法大全（torch.dot, mm, bmm, @, *, matmul）

[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif（以 CartPole 为例，mode='rgb_array'）

[动手写 bert 系列] torch.no_grad() vs. param.requires_grad == False

[pytorch] Tensor 轴（axis）交换，transpose（转置）、swapaxes、permute

[pytorch 模型拓扑结构] 深入理解 nn.BCELoss 计算过程及 backward 及其与 CrossEntropyLoss 的区别与联系

[pytorch 强化学习] 10 从 Q Learning 到 DQN（experience replay 与 huber loss / smooth L1）

[pytorch optim] 优化器相关 AdaGrad（adaptive gradient） 与 RMSprop，自适应梯度

[动手写神经网络] 可微才可学，深度学习框架自动微分计算图（DAG）

[pytorch] [求导练习] 02 softmax 函数自动求导练习（autograd，Jacobian matrix）

[矩阵分析] 从向量范数到矩阵范数、torch spectral norm（矩阵的谱范数）

[pytorch distributed] accelerate 基本用法（config，launch）数据并行

[pytorch 强化学习] 07 迷宫环境（maze environment）Q Learning（value iteration）求解（策略关闭 off）

[pytorch] [求导练习] 05 计算图（computation graph）构建细节之 inplace operation（data与detach）

[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计（MLE）伯努利分布的参数

进程隐藏工具 隐藏，保护进程 进程保护 一个可以管理进程的强势软件 全系统兼容 64位 win7 win8 win10

[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程（nn.NLLLoss(nn.LogSoftmax))

[pytorch 强化学习] 05 迷宫环境（maze environment）策略梯度（Policy Gradient）求解

[PyTorch] Dropout 基本原理（前向计算与自动求导）

[pytorch 网络拓扑结构] 深度理解 nn.BatchNorm1d

[pytorch 强化学习] 13 基于 pytorch 神经网络实现 policy gradient（REINFORCE）求解 CartPole

[pytorch 强化学习] 04 迷宫环境（maze environment）封装 MazeEnv、Agent 类

[pytorch optim] Adam 与 AdamW，L2 reg 与 weight decay，deepseed

[pytorch 强化学习] 06 迷宫环境（maze environment）SARSA（Q-table，value iteration）求解

[pytorch 强化学习] 12 逐行写代码实现 DQN 完全体

[pytorch optim] 优化器相关 AdaGrad（adaptive gradient）与 RMSprop，自适应梯度

进程隐藏工具隐藏，保护进程进程保护一个可以管理进程的强势软件全系统兼容 64位 win7 win8 win10