[概率 & 统计] kl div kl散度的计算及应用（pytorch）

发布人

本期 code：https://github.com/chunhuizhang/deeplearning_math/blob/main/tutorials/prob_stats/kl_div_basics.ipynb
https://github.com/chunhuizhang/deeplearning_math/blob/main/tutorials/prob_stats/pytorch_kl_div_examples.ipynb

打开封面下载高清视频观看高清视频视频下载器

[pytorch] 深入理解 nn.KLDivLoss（kl 散度）与 nn.CrossEntropyLoss（交叉熵）

[概率 & 统计] KL 散度（KL div）forward vs. reverse

[pytorch] [求导练习] 03 计算图（computation graph）及链式法则（chain rule）反向传播过程

[DRL] 从 TRPO 到 PPO（PPO-penalty，PPO-clip）

[pytorch distributed] deepspeed 基本概念、原理（os+g+p）

[diffusion] 生成模型基础 VAE 原理及实现

[pytorch distributed] 01 nn.DataParallel 数据并行初步

[pytorch distributed] 02 DDP 基本概念（Ring AllReduce，node，world，rank，参数服务器）

[概率 & 统计] Thompson Sampling（随机贝叶斯后验采样）与多臂老虎机

[蒙特卡洛方法] 02 重要性采样（importance sampling）及 python 实现

[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像

[pytorch distributed] 从 DDP、模型并行、流水线并行到 FSDP（NCCL，deepspeed 与 Accelerate）

[pytorch 强化学习] 10 从 Q Learning 到 DQN（experience replay 与 huber loss / smooth L1）

[pytorch 强化学习] 01 认识环境（environment，gym.Env）以及 CartPole-v0/v1 环境

[pytorch 番外] Tensorboard 与计算图初步（算子与 ATen）

[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计（MLE）伯努利分布的参数

[pytorch] torch.einsum 到索引到矩阵运算（index、shape、dimension、axis）

[pytorch] [求导练习] 05 计算图（computation graph）构建细节之 inplace operation（data与detach）

[PyTorch] Dropout 基本原理（前向计算与自动求导）

[generative models] 概率建模视角下的现代生成模型（生成式 vs. 判别式，采样与密度估计）

[pytorch 强化学习] 07 迷宫环境（maze environment）Q Learning（value iteration）求解（策略关闭 off）

[pytorch 强化学习] 11 逐行写代码实现 DQN（ReplayMemory，Transition，DQN as Q function）

[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程（nn.NLLLoss(nn.LogSoftmax))

[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新（forward，loss.backward(), optimizer.step）

【统计】从P值到6σ（六西格玛）质量控制（P值与Z值，与置信水平的关系，python scipy 计算）

[动手写bert系列] 01 huggingface tokenizer （vocab，encode，decode）原理及细节

[pytorch] [求导练习] 06 计算图（computation graph）细节之 retain graph（multi output/backwar）

[pytorch] torch.nn.Bilinear 计算过程与 einsum（爱因斯坦求和约定）

[pytorch optim] Adam 与 AdamW，L2 reg 与 weight decay，deepseed

[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程

[pytorch 网络模型结构] 深入理解 nn.BatchNorm1d/2d 计算过程

[pytorch] 激活函数（梯度消失）sigmoid，clamp，relu（sparse representation，dying relu）

[pytorch distributed] accelerate 基本用法（config，launch）数据并行

[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif（以 CartPole 为例，mode='rgb_array'）

【统计学】p-value（p值）与 z-score（标准分/z得分/z分数）定义，计算以及适用场景

[pytorch distributed] nccl 集合通信（collective communication）

[强化学习基础 01] MDP 基础（概率转移，与POMDP、I-POMDP）

[pytorch] 深入理解 torch.gather 及 dim 与 index 的关系

[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程

[leetcode reviews] 01 计算思维与刷题方法

[概率 & 统计] kl div kl散度的计算及应用（pytorch）

[pytorch] 深入理解 nn.KLDivLoss（kl 散度） 与 nn.CrossEntropyLoss（交叉熵）

[概率 & 统计] KL 散度（KL div）forward vs. reverse

[pytorch] [求导练习] 03 计算图（computation graph）及链式法则（chain rule）反向传播过程

[DRL] 从 TRPO 到 PPO（PPO-penalty，PPO-clip）

[pytorch distributed] deepspeed 基本概念、原理（os+g+p）

[diffusion] 生成模型基础 VAE 原理及实现

[pytorch distributed] 01 nn.DataParallel 数据并行初步

[pytorch distributed] 02 DDP 基本概念（Ring AllReduce，node，world，rank，参数服务器）

[概率 & 统计] Thompson Sampling（随机贝叶斯后验采样）与多臂老虎机

[蒙特卡洛方法] 02 重要性采样（importance sampling）及 python 实现

[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像

[pytorch distributed] 从 DDP、模型并行、流水线并行到 FSDP（NCCL，deepspeed 与 Accelerate）

[pytorch 强化学习] 10 从 Q Learning 到 DQN（experience replay 与 huber loss / smooth L1）

[pytorch 强化学习] 01 认识环境（environment，gym.Env）以及 CartPole-v0/v1 环境

[pytorch 番外] Tensorboard 与计算图初步（算子与 ATen）

[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计（MLE）伯努利分布的参数

[pytorch] torch.einsum 到索引到矩阵运算（index、shape、dimension、axis）

[pytorch] [求导练习] 05 计算图（computation graph）构建细节之 inplace operation（data与detach）

[PyTorch] Dropout 基本原理（前向计算与自动求导）

[generative models] 概率建模视角下的现代生成模型（生成式 vs. 判别式，采样与密度估计）

[pytorch 强化学习] 07 迷宫环境（maze environment）Q Learning（value iteration）求解（策略关闭 off）

[pytorch 强化学习] 11 逐行写代码实现 DQN（ReplayMemory，Transition，DQN as Q function）

[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程（nn.NLLLoss(nn.LogSoftmax))

[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新（forward，loss.backward(), optimizer.step）

【统计】从P值到6σ（六西格玛）质量控制（P值与Z值，与置信水平的关系，python scipy 计算）

[动手写bert系列] 01 huggingface tokenizer （vocab，encode，decode）原理及细节

[pytorch] [求导练习] 06 计算图（computation graph）细节之 retain graph（multi output/backwar）

[pytorch] torch.nn.Bilinear 计算过程与 einsum（爱因斯坦求和约定）

[pytorch optim] Adam 与 AdamW，L2 reg 与 weight decay，deepseed

[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程

[pytorch 网络模型结构] 深入理解 nn.BatchNorm1d/2d 计算过程

[pytorch] 激活函数（梯度消失）sigmoid，clamp，relu（sparse representation，dying relu）

[pytorch distributed] accelerate 基本用法（config，launch）数据并行

[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif（以 CartPole 为例，mode='rgb_array'）

【统计学】p-value（p值） 与 z-score（标准分/z得分/z分数）定义，计算以及适用场景

[pytorch distributed] nccl 集合通信（collective communication）

[强化学习基础 01] MDP 基础（概率转移，与POMDP、I-POMDP）

[pytorch] 深入理解 torch.gather 及 dim 与 index 的关系

[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程

[leetcode reviews] 01 计算思维与刷题方法

[pytorch] 深入理解 nn.KLDivLoss（kl 散度）与 nn.CrossEntropyLoss（交叉熵）

【统计学】p-value（p值）与 z-score（标准分/z得分/z分数）定义，计算以及适用场景