V
主页
[动手写神经网络] 可微才可学,深度学习框架自动微分计算图(DAG)
发布人
本期 code:https://github.com/chunhuizhang/llm_aigc/blob/main/tutorials/nn_basics/grad/%E5%8F%AF%E5%BE%AE%E6%89%8D%E5%8F%AF%E5%AD%A6.ipynb 参考: torch 计算图:BV1hv4y1B7pE torch 前向计算/反向传播:BV13G4y1m7MC 非叶子节点grad:BV1DH4y1N7it
打开封面
下载高清视频
观看高清视频
视频下载器
[矩阵微分] 标量/矢量关于矢量/矩阵的矩阵微分,深度学习框架反向传播
[动手写神经网络] 手动实现 Transformer Encoder
[PyTorch] Dropout 基本原理(前向计算与自动求导)
[pytorch] [求导练习] 03 计算图(computation graph)及链式法则(chain rule)反向传播过程
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
[动手写神经网络] 08 WandB(weights & biases)深度学习调参利器
[动手写神经网络] 如何设计卷积核(conv kernel)实现降2采样,以及初探vggnet/resnet 卷积设计思路(不断降空间尺度,升channel)
[pytorch] [求导练习] 01 sigmoid 函数自动求导练习(autograd,单变量,多变量 multivariables 形式)
[pytorch] torch.nn.Bilinear 计算过程与 einsum(爱因斯坦求和约定)
[动手写神经网络] 02 逐行写代码 CNN pipeline 图像分类(模型结构、训练、评估)
[动手写神经网络] 05 使用预训练 resnet18 提升 cifar10 分类准确率及误分类图像可视化分析
[动手写神经网络] pytorch 高维张量 Tensor 维度操作与处理,einops
[pytorch] [求导练习] 02 softmax 函数自动求导练习(autograd,Jacobian matrix)
[动手写神经网络] 如何对数据集归一化(transforms.Normalize)以 mnist 数据集为例(mean=0.1307, std=0.3081)
[多元变量微分] 方向导数与梯度下降方法(directional derivatives)
[AI硬件科普] 内存/显存带宽,从 NVIDIA 到苹果 M4
【深度学习环境搭建】01 本机、GPU服务器端深度学习环境搭建(代码、数据共享)
[番外] float16 与 bf16 表示和计算细节
[pytorch] [求导练习] 06 计算图(computation graph)细节之 retain graph(multi output/backwar)
[personal chatgpt] 从 RoPE 到 CoPE(绝对位置编码,相对位置编码,Contextual Position Encoding)
[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程
[动手写神经网络] 06 自定义(kaggle)数据集(custom dataset)、Dataloader,及 train test valid 数据集拆分
[pytorch 强化学习] 13 基于 pytorch 神经网络实现 policy gradient(REINFORCE)求解 CartPole
[动手写神经网络] 03 自定义 CNN 模型适配新的数据集 CIFAR10(适配+简单调参)
[AI 核心概念及计算] 优化 01 梯度下降(gradient descent)与梯度上升(gradient ascent)细节及可视化分析
【数值计算】牛顿迭代法(Newton's method,Newton-Raphson method,牛顿-拉夫逊(拉弗森))计算二次方根(sqrt)三次方根
[动手写神经网络] 07 预训练 resnet 解决 kaggle weather dataset(validation dataset)的使用
[leetcode reviews] 01 计算思维与刷题方法
[动手写神经网络] 04 使用预训练 vgg 提升 cifar10 分类准确率
[全栈深度学习] 02 vscode remote(远程)gpus 服务器开发调试 debugger(以 nanoGPT 为例)
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[pytorch] torch.einsum 到索引到矩阵运算(index、shape、dimension、axis)
[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新(forward,loss.backward(), optimizer.step)
[LLMs 实践] 20 llama2 源码分析 cache KV(keys、values cache)加速推理
[矩阵分析] 从向量范数到矩阵范数、torch spectral norm(矩阵的谱范数)
[矩阵分析] LoRA 矩阵分析基础之 SVD low rank approximation(低秩逼近)
[调包侠] 04 使用预训练模型进行图像特征向量提取(image feature extractor,img2vec)并进行相似性计算
[diffusion] 生成模型基础 VAE 原理及实现
[概率 & 统计] kl div kl散度的计算及应用(pytorch)