V
主页
[pytorch distributed] 04 模型并行(model parallel)on ResNet50
发布人
本期 code:https://github.com/chunhuizhang/pytorch_distribute_tutorials/blob/main/tutorials/04_model_parallel_resnet50.ipynb
打开封面
下载高清视频
观看高清视频
视频下载器
[pytorch distributed] 从 DDP、模型并行、流水线并行到 FSDP(NCCL,deepspeed 与 Accelerate)
[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置
[pytorch distributed] 05 张量并行(tensor parallel),分块矩阵的角度,作用在 FFN 以及 Attention 上
[pytorch distributed] 03 DDP 初步应用(Trainer,torchrun)
[pytorch distributed] torch 分布式基础(process group),点对点通信,集合通信
[pytorch distributed] deepspeed 基本概念、原理(os+g+p)
[pytorch distributed] 01 nn.DataParallel 数据并行初步
[pytorch distributed] amp 原理,automatic mixed precision 自动混合精度
[pytorch distributed] accelerate 基本用法(config,launch)数据并行
[pytorch 强化学习] 06 迷宫环境(maze environment)SARSA(Q-table,value iteration)求解
[pytorch distributed] 02 DDP 基本概念(Ring AllReduce,node,world,rank,参数服务器)
[LLM && AIGC] 04 深入理解 openai tokenizer 及 api 中的 logit_bias 与 logprobs
[动手写 bert 系列] bert model architecture 模型架构初探(embedding + encoder + pooler)
[pytorch] Tensor 轴(axis)交换,transpose(转置)、swapaxes、permute
[模型拓扑结构] pytorch 注册钩子函数(register_forward_hook)实现对各个层(layer)输入输出 shape 的查看
[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程(nn.NLLLoss(nn.LogSoftmax))
[pytorch] [求导练习] 05 计算图(computation graph)构建细节之 inplace operation(data与detach)
[pytorch 强化学习] 11 逐行写代码实现 DQN(ReplayMemory,Transition,DQN as Q function)
[pytorch 加速] CPU传输 & GPU计算的并行(pin_memory,non_blocking)
[pytorch] [求导练习] 02 softmax 函数自动求导练习(autograd,Jacobian matrix)
[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新(forward,loss.backward(), optimizer.step)
[pytorch 强化学习] 04 迷宫环境(maze environment)封装 MazeEnv、Agent 类
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
[pytorch 强化学习] 08 CartPole Q learning 连续状态离散化(digitize 分桶)及 display_frame_as_gif
[模型拓扑接口] 经典 RNN 模型(一)模型参数及训练参数的介绍
[personal chatgpt] trl reward model 与 RewardTrainer(奖励模型,分类模型)
[diffusion] 生成模型基础 VAE 原理及实现
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
[pytorch optim] 优化器相关 AdaGrad(adaptive gradient) 与 RMSprop,自适应梯度
[LLMs 实践] 03 LoRA fine-tune 大语言模型(peft、bloom 7b)
[bert、t5、gpt] 06 GPT2 整体介绍(tokenizer,model forward)
[pytorch] nn.Embedding 前向查表索引过程与 one hot 关系及 max_norm 的作用
[LLM+RL] 合成数据与model collapse,nature 正刊封面
[pytorch] [求导练习] 03 计算图(computation graph)及链式法则(chain rule)反向传播过程
[pytorch] torch.einsum 到索引到矩阵运算(index、shape、dimension、axis)
[动手写神经网络] pytorch 高维张量 Tensor 维度操作与处理,einops
[pytorch] 深入理解 torch.gather 及 dim 与 index 的关系
[pytorch] Tensor shape 变化 view 与 reshape(contiguous 的理解)
[LangChain] 06 基于LangGraph 实现 Reflexion Agent(generator vs. critic)
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像