V
主页
[概率 & 统计] kl div kl散度的计算及应用(pytorch)
发布人
本期 code:https://github.com/chunhuizhang/deeplearning_math/blob/main/tutorials/prob_stats/kl_div_basics.ipynb https://github.com/chunhuizhang/deeplearning_math/blob/main/tutorials/prob_stats/pytorch_kl_div_examples.ipynb
打开封面
下载高清视频
观看高清视频
视频下载器
[pytorch] 深入理解 nn.KLDivLoss(kl 散度) 与 nn.CrossEntropyLoss(交叉熵)
[概率 & 统计] KL 散度(KL div)forward vs. reverse
[pytorch] [求导练习] 03 计算图(computation graph)及链式法则(chain rule)反向传播过程
[DRL] 从 TRPO 到 PPO(PPO-penalty,PPO-clip)
[pytorch distributed] deepspeed 基本概念、原理(os+g+p)
[diffusion] 生成模型基础 VAE 原理及实现
[pytorch distributed] 01 nn.DataParallel 数据并行初步
[pytorch distributed] 02 DDP 基本概念(Ring AllReduce,node,world,rank,参数服务器)
[概率 & 统计] Thompson Sampling(随机贝叶斯后验采样)与多臂老虎机
[蒙特卡洛方法] 02 重要性采样(importance sampling)及 python 实现
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像
[pytorch distributed] 从 DDP、模型并行、流水线并行到 FSDP(NCCL,deepspeed 与 Accelerate)
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
[pytorch 番外] Tensorboard 与计算图初步(算子与 ATen)
[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计(MLE)伯努利分布的参数
[pytorch] torch.einsum 到索引到矩阵运算(index、shape、dimension、axis)
[pytorch] [求导练习] 05 计算图(computation graph)构建细节之 inplace operation(data与detach)
[PyTorch] Dropout 基本原理(前向计算与自动求导)
[generative models] 概率建模视角下的现代生成模型(生成式 vs. 判别式,采样与密度估计)
[pytorch 强化学习] 07 迷宫环境(maze environment)Q Learning(value iteration)求解(策略关闭 off)
[pytorch 强化学习] 11 逐行写代码实现 DQN(ReplayMemory,Transition,DQN as Q function)
[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程(nn.NLLLoss(nn.LogSoftmax))
[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新(forward,loss.backward(), optimizer.step)
【统计】从P值到6σ(六西格玛)质量控制(P值与Z值,与置信水平的关系,python scipy 计算)
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[pytorch] [求导练习] 06 计算图(computation graph)细节之 retain graph(multi output/backwar)
[pytorch] torch.nn.Bilinear 计算过程与 einsum(爱因斯坦求和约定)
[pytorch optim] Adam 与 AdamW,L2 reg 与 weight decay,deepseed
[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程
[pytorch 网络模型结构] 深入理解 nn.BatchNorm1d/2d 计算过程
[pytorch] 激活函数(梯度消失)sigmoid,clamp,relu(sparse representation,dying relu)
[pytorch distributed] accelerate 基本用法(config,launch)数据并行
[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif(以 CartPole 为例,mode='rgb_array')
【统计学】p-value(p值) 与 z-score(标准分/z得分/z分数)定义,计算以及适用场景
[pytorch distributed] nccl 集合通信(collective communication)
[强化学习基础 01] MDP 基础(概率转移,与POMDP、I-POMDP)
[pytorch] 深入理解 torch.gather 及 dim 与 index 的关系
[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程
[leetcode reviews] 01 计算思维与刷题方法