V
主页
[pytorch 网络模型结构] batchnorm train 及 eval 模式的差异及(running_mean, running_var)的计算细节
发布人
code:https://github.com/chunhuizhang/bilibili_vlogs/tree/master/learn_torch/tutorials pytorch batchnorm 系列: https://www.bilibili.com/video/BV19B4y1q743?spm_id_from=333.999.0.0 https://www.bilibili.com/video/BV1dv4y1M79T?spm_id_from=333.999.0.0 https://www.bilibili.com/video/BV1vY411N7gb?spm_id_from=333.999.0.0
打开封面
下载高清视频
观看高清视频
视频下载器
[pytorch 网络模型结构] 深入理解 nn.BatchNorm1d/2d 计算过程
[pytorch 网络拓扑结构] 深度理解 nn.BatchNorm1d
[动手写神经网络] 02 逐行写代码 CNN pipeline 图像分类(模型结构、训练、评估)
[pytorch 加速] CPU传输 & GPU计算的并行(pin_memory,non_blocking)
[动手写Bert系列] bertencoder self attention 计算细节及计算过程
[pytorch 神经网络拓扑结构] pad_sequence/pack_padded_sequence 时序模型如何处理不定长输入
[pytorch模型拓扑结构] nn.MultiheadAttention, init/forward, 及 query,key,value 的计算细节
[pytorch 模型拓扑结构] 深入理解 nn.BCELoss 计算过程及 backward 及其与 CrossEntropyLoss 的区别与联系
[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程(nn.NLLLoss(nn.LogSoftmax))
[概率 & 统计] kl div kl散度的计算及应用(pytorch)
[LLMs 实践] 09 BPE gpt2 tokenizer 与 train tokenizer
[动手写神经网络] 06 自定义(kaggle)数据集(custom dataset)、Dataloader,及 train test valid 数据集拆分
[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程
[PyTorch] Dropout 基本原理(前向计算与自动求导)
[AI 核心概念及计算] 优化 01 梯度下降(gradient descent)与梯度上升(gradient ascent)细节及可视化分析
[pytorch 模型拓扑结构] pytorch 矩阵乘法大全(torch.dot, mm, bmm, @, *, matmul)
[pytorch 模型拓扑结构] 深入理解 nn.BatchNorm2d/3d
[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计(MLE)伯努利分布的参数
[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif(以 CartPole 为例,mode='rgb_array')
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
[调包侠] 04 使用预训练模型进行图像特征向量提取(image feature extractor,img2vec)并进行相似性计算
[模型拓扑结构] pytorch 注册钩子函数(register_forward_hook)实现对各个层(layer)输入输出 shape 的查看
[pytorch 强化学习] 06 迷宫环境(maze environment)SARSA(Q-table,value iteration)求解
[LLMs 实践] 13 gradient checkpointing 显存优化 trick
[pytorch] [求导练习] 06 计算图(computation graph)细节之 retain graph(multi output/backwar)
[pytorch 强化学习] 12 逐行写代码实现 DQN 完全体
[pytorch 强化学习] 07 迷宫环境(maze environment)Q Learning(value iteration)求解(策略关闭 off)
[模型拓扑接口] 经典 RNN 模型(一)模型参数及训练参数的介绍
[pytorch distributed] amp 原理,automatic mixed precision 自动混合精度
[pytorch] [求导练习] 05 计算图(computation graph)构建细节之 inplace operation(data与detach)
[数值计算] 快速计算、秒算大数乘除运算,对数变换将乘除变为加减,再通过查表(logarithm table)获得10-99之间的对数值
[动手写神经网络] 如何对数据集归一化(transforms.Normalize)以 mnist 数据集为例(mean=0.1307, std=0.3081)
[pytorch 强化学习] 08 CartPole Q learning 连续状态离散化(digitize 分桶)及 display_frame_as_gif
[diffusion] 生成模型基础 VAE 原理及实现
[python 多进程、多线程] 03 GIL、threading、多进程,concurrent.futures
[pytorch 番外] Tensorboard 与计算图初步(算子与 ATen)
[LLM && AIGC] 04 深入理解 openai tokenizer 及 api 中的 logit_bias 与 logprobs
[pytorch 强化学习] 03 动手写迷宫环境(maze env)状态及动作策略初步(及动画保存)
[pytorch 强化学习] 05 迷宫环境(maze environment)策略梯度(Policy Gradient)求解
[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置