V
主页
[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程(nn.NLLLoss(nn.LogSoftmax))
发布人
https://pytorch.org/docs/stable/generated/torch.nn.CrossEntropyLoss.html https://pytorch.org/docs/stable/generated/torch.nn.NLLLoss.html
打开封面
下载高清视频
观看高清视频
视频下载器
[pytorch 网络模型结构] 深入理解 nn.BatchNorm1d/2d 计算过程
[pytorch] 深入理解 nn.KLDivLoss(kl 散度) 与 nn.CrossEntropyLoss(交叉熵)
[pytorch 模型拓扑结构] 深入理解 nn.BCELoss 计算过程及 backward 及其与 CrossEntropyLoss 的区别与联系
[pytorch模型拓扑结构] nn.MultiheadAttention, init/forward, 及 query,key,value 的计算细节
[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程
[pytorch 网络拓扑结构] 深度理解 nn.BatchNorm1d
[pytorch] [求导练习] 03 计算图(computation graph)及链式法则(chain rule)反向传播过程
[调包侠] 04 使用预训练模型进行图像特征向量提取(image feature extractor,img2vec)并进行相似性计算
[pytorch] nn.Embedding 前向查表索引过程与 one hot 关系及 max_norm 的作用
[pytorch] Tensor shape 变化 view 与 reshape(contiguous 的理解)
[pytorch 神经网络拓扑结构] pad_sequence/pack_padded_sequence 时序模型如何处理不定长输入
[模型拓扑结构] pytorch 注册钩子函数(register_forward_hook)实现对各个层(layer)输入输出 shape 的查看
[LangChain] 05 LangChain、LangGraph 结构化输出(Structured output),gpt-4o-2024-08-06
[pytorch 网络模型结构] batchnorm train 及 eval 模式的差异及(running_mean, running_var)的计算细节
[pytorch] 激活函数(梯度消失)sigmoid,clamp,relu(sparse representation,dying relu)
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
[pytorch] [求导练习] 05 计算图(computation graph)构建细节之 inplace operation(data与detach)
[pytorch] torch.nn.Bilinear 计算过程与 einsum(爱因斯坦求和约定)
【手推公式】从二分类到多分类,从sigmoid到softmax,从最大似然估计到 cross entropy
[pytorch 模型拓扑结构] 深入理解 nn.BatchNorm2d/3d
[pytorch 模型拓扑结构] pytorch 矩阵乘法大全(torch.dot, mm, bmm, @, *, matmul)
[动手写神经网络] 02 逐行写代码 CNN pipeline 图像分类(模型结构、训练、评估)
[pytorch] 激活函数,从 ReLU、LeakyRELU 到 GELU 及其梯度(gradient)(BertLayer,FFN,GELU)
[模型拓扑接口] 经典 RNN 模型(一)模型参数及训练参数的介绍
[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新(forward,loss.backward(), optimizer.step)
[pytorch] 深入理解 torch.gather 及 dim 与 index 的关系
[pytorch 强化学习] 07 迷宫环境(maze environment)Q Learning(value iteration)求解(策略关闭 off)
[LLMs 实践] 13 gradient checkpointing 显存优化 trick
[蒙特卡洛方法] 01 从黎曼和式积分(Reimann Sum)到蒙特卡洛估计(monte carlo estimation)求积分求期望
[pytorch] [求导练习] 01 sigmoid 函数自动求导练习(autograd,单变量,多变量 multivariables 形式)
[pytorch 番外] Tensorboard 与计算图初步(算子与 ATen)
[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
【约束满足问题】AIMA | Chap 6 | CSP | AC-3 | Arc Consistency
[pytorch optim] Adam 与 AdamW,L2 reg 与 weight decay,deepseed
[pytorch distributed] 01 nn.DataParallel 数据并行初步
[调包侠] 使用 gensim 完成 word2vec 的计算,及 model.most_similar 的计算过程(positive,negative)
[Python 机器学习] 深入理解 numpy(ndarray)的 axis(轴/维度)
PyTorch深度学习实践!不愧是公认讲的最好的【pytorch实践教程】12小时带你从入门到实践
[diffusion] 生成模型基础 VAE 原理及实现