V
主页
[pytorch distributed] 02 DDP 基本概念(Ring AllReduce,node,world,rank,参数服务器)
发布人
本期 code:https://github.com/chunhuizhang/pytorch_distribute_tutorials/blob/main/tutorials/02_ddp_basics.ipynb
打开封面
下载高清视频
观看高清视频
视频下载器
[pytorch distributed] 从 DDP、模型并行、流水线并行到 FSDP(NCCL,deepspeed 与 Accelerate)
[LLMs 实践] 02 LoRA(Low Rank Adaption)基本原理与基本概念,fine-tune 大语言模型
[pytorch distributed] deepspeed 基本概念、原理(os+g+p)
[pytorch distributed] 03 DDP 初步应用(Trainer,torchrun)
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
[矩阵分析] LoRA 矩阵分析基础之 SVD low rank approximation(低秩逼近)
[LangChain] 03 LangGraph 基本概念(AgentState、StateGraph,nodes,edges)
[pytorch distributed] 01 nn.DataParallel 数据并行初步
[动手写神经网络] 手动实现 Transformer Encoder
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置
[pytorch distributed] accelerate 基本用法(config,launch)数据并行
[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计(MLE)伯努利分布的参数
[pytorch distributed] nccl 集合通信(collective communication)
[AI 核心概念及计算] 优化 01 梯度下降(gradient descent)与梯度上升(gradient ascent)细节及可视化分析
[pytorch distributed] 05 张量并行(tensor parallel),分块矩阵的角度,作用在 FFN 以及 Attention 上
[pytorch distributed] 04 模型并行(model parallel)on ResNet50
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像
[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif(以 CartPole 为例,mode='rgb_array')
【深度学习环境搭建】01 本机、GPU服务器端深度学习环境搭建(代码、数据共享)
[pytorch 强化学习] 11 逐行写代码实现 DQN(ReplayMemory,Transition,DQN as Q function)
[pytorch distributed] amp 原理,automatic mixed precision 自动混合精度
【推荐系统】【缺失值处理】【矩阵分析】基于低秩矩阵补全(low rank matrix completing,矩阵分解 matrix factorizatio)
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
[pytorch distributed] torch 分布式基础(process group),点对点通信,集合通信
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
[pytorch optim] pytorch 作为一个通用优化问题求解器(目标函数、决策变量)
[pytorch] BN、LN、RMSNorm 及 pre LN vs. post LN 对比,标准化
[强化学习基础 01] MDP 基础(概率转移,与POMDP、I-POMDP)
[pytorch 强化学习] 07 迷宫环境(maze environment)Q Learning(value iteration)求解(策略关闭 off)
[pytorch 强化学习] 03 动手写迷宫环境(maze env)状态及动作策略初步(及动画保存)
[LLMs 实践] 04 PEFT/LoRA 源码分析
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[全栈深度学习] 02 vscode remote(远程)gpus 服务器开发调试 debugger(以 nanoGPT 为例)
[LLMs tuning] 02 accelerate ddp 与 trl SFTTrainer
[PyTorch] Dropout 基本原理(前向计算与自动求导)
【深度学习环境搭建】02 gpu 服务器端部署 jupyter notebook server
[调包侠] 使用 PyTorch Swin Transformer 完成图像分类
【开源】自己用Vue3和Node开发的一套十分简洁的权限后台管理系统,给大家瞅一瞅啊
[Python 机器学习] 深入理解 numpy(ndarray)的 axis(轴/维度)