V
主页
[pytorch 模型拓扑结构] 深入理解 nn.BCELoss 计算过程及 backward 及其与 CrossEntropyLoss 的区别与联系
发布人
本期code:https://github.com/chunhuizhang/bilibili_vlogs/blob/master/learn_torch/loss/01_BCELoss_binary_cross_entropy.ipynb pytorch 系列:https://space.bilibili.com/59807853/channel/collectiondetail?sid=446911 crossentropyloss:https://www.bilibili.com/video/BV1NY4y1E76o/
打开封面
下载高清视频
观看高清视频
视频下载器
[pytorch 强化学习] 11 逐行写代码实现 DQN(ReplayMemory,Transition,DQN as Q function)
[pytorch 强化学习] 05 迷宫环境(maze environment)策略梯度(Policy Gradient)求解
[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新(forward,loss.backward(), optimizer.step)
【统计学】p-value(p值) 与 z-score(标准分/z得分/z分数)定义,计算以及适用场景
[pytorch distributed] deepspeed 基本概念、原理(os+g+p)
[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif(以 CartPole 为例,mode='rgb_array')
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[pytorch 强化学习] 12 逐行写代码实现 DQN 完全体
[模型拓扑接口] 经典 RNN 模型(一)模型参数及训练参数的介绍
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
[pytorch 强化学习] 06 迷宫环境(maze environment)SARSA(Q-table,value iteration)求解
[diffusion] 生成模型基础 VAE 原理及实现
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像
[pytorch distributed] torch 分布式基础(process group),点对点通信,集合通信
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
[pytorch] [求导练习] 03 计算图(computation graph)及链式法则(chain rule)反向传播过程
[pytorch distributed] 02 DDP 基本概念(Ring AllReduce,node,world,rank,参数服务器)
[pytorch optim] pytorch 作为一个通用优化问题求解器(目标函数、决策变量)
[调包侠] 使用 PyTorch Swin Transformer 完成图像分类
[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程
[pytorch 强化学习] 03 动手写迷宫环境(maze env)状态及动作策略初步(及动画保存)
[pytorch distributed] 01 nn.DataParallel 数据并行初步
[pytorch] 深入理解 torch.gather 及 dim 与 index 的关系
[pytorch distributed] 03 DDP 初步应用(Trainer,torchrun)
[leetcode reviews] 01 计算思维与刷题方法
[动手写Bert系列] bertencoder self attention 计算细节及计算过程
[LLMs 实践] 02 LoRA(Low Rank Adaption)基本原理与基本概念,fine-tune 大语言模型
[pytorch distributed] amp 原理,automatic mixed precision 自动混合精度
[LLM 番外] 自回归语言模型cross entropy loss,及 PPL 评估
[pytorch 强化学习] 13 基于 pytorch 神经网络实现 policy gradient(REINFORCE)求解 CartPole
[LLMs 实践] 03 LoRA fine-tune 大语言模型(peft、bloom 7b)
[pytorch distributed] 04 模型并行(model parallel)on ResNet50
[LLMs 实践] 04 PEFT/LoRA 源码分析
[LLM && AIGC] 04 深入理解 openai tokenizer 及 api 中的 logit_bias 与 logprobs
[pytorch 模型拓扑结构] 深入理解 nn.BatchNorm2d/3d
[pytorch 强化学习] 04 迷宫环境(maze environment)封装 MazeEnv、Agent 类
[Python 机器学习] 深入理解 numpy(ndarray)的 axis(轴/维度)
[pytorch] [求导练习] 01 sigmoid 函数自动求导练习(autograd,单变量,多变量 multivariables 形式)
[pytorch] torch.einsum 到索引到矩阵运算(index、shape、dimension、axis)
[番外] float16 与 bf16 表示和计算细节