V
主页
[多元变量微分] 方向导数与梯度下降方法(directional derivatives)
发布人
本期 code:https://github.com/chunhuizhang/deeplearning_math/blob/main/tutorials/calculus/derivative_partial_directional.ipynb 往期视频:BV1ga4y1i75Q
打开封面
下载高清视频
观看高清视频
视频下载器
[AI 核心概念及计算] 优化 01 梯度下降(gradient descent)与梯度上升(gradient ascent)细节及可视化分析
【手推公式】可导损失函数(loss function)的梯度下降(GD)、随机梯度下降(SGD)以及mini-batch gd梯度优化策略
[手推公式] sigmoid 及其导数 softmax 及其导数性质(从 logits 到 probabilities)
[优化算法] 梯度下降、共轭梯度、牛顿法、逆牛顿法(BFGS)
【手推公式】梯度下降(一阶泰勒展开)的一种直观形式
【回归】多元线性回归分析(最小二乘法,矩阵矢量形式,解析解)
excel单变量求解工具进行企业生产活动的盈亏平衡分析
[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新(forward,loss.backward(), optimizer.step)
[pytorch] 激活函数(梯度消失)sigmoid,clamp,relu(sparse representation,dying relu)
[pytorch 强化学习] 05 迷宫环境(maze environment)策略梯度(Policy Gradient)求解
【机器学习中的数学】【概率论】正态分布的导数与拐点(inflection points)
[蒙特卡洛方法] 04 重要性采样补充,数学性质及 On-policy vs. Off-policy
[pytorch] 激活函数,从 ReLU、LeakyRELU 到 GELU 及其梯度(gradient)(BertLayer,FFN,GELU)
[pytorch] [求导练习] 01 sigmoid 函数自动求导练习(autograd,单变量,多变量 multivariables 形式)
[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计(MLE)伯努利分布的参数
[pytorch 模型拓扑结构] 深入理解 nn.BatchNorm2d/3d
[DRL] 从策略梯度到 TRPO(Lagrange Duality,拉格朗日对偶性)
[动手写神经网络] 可微才可学,深度学习框架自动微分计算图(DAG)
[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif(以 CartPole 为例,mode='rgb_array')
[leetcode reviews] 01 计算思维与刷题方法
【python 运筹优化】scipy.optimize.minimize 使用
[矩阵微分] 标量/矢量关于矢量/矩阵的矩阵微分,深度学习框架反向传播
[蒙特卡洛方法] 01 从黎曼和式积分(Reimann Sum)到蒙特卡洛估计(monte carlo estimation)求积分求期望
[python 多进程、多线程、协程] 02 用 python 多线程实现生产者消费者流程
【python app 开发】01 使用 tkinter 及 pyinstaller 制作一个简单的日期管理软件
[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程(nn.NLLLoss(nn.LogSoftmax))
[flask web 核心] 02 使用 jinja 创建模板 html 及初步使用 bootstrap 丰富页面内容
[动手写 bert 系列] 02 tokenizer encode_plus, token_type_ids(mlm,nsp)
【手推公式】xgboost自定义损失函数(cross entropy/squared log loss)及其一阶导数gradient二阶导数hessian
[动手写神经网络] 手动实现 Transformer Encoder
[pytorch 强化学习] 12 逐行写代码实现 DQN 完全体
[番外] float16 与 bf16 表示和计算细节
[LLMs 实践] 221 llama2 源码分析 generate 的完整过程
【python 数学编程】SymPy 数学家的朋友 | hessian | Jacobian
[sbert 01] sentence-transformers pipeline
[pytorch distributed] deepspeed 基本概念、原理(os+g+p)
[pytorch 网络拓扑结构] 深度理解 nn.BatchNorm1d
[pytorch] [求导练习] 05 计算图(computation graph)构建细节之 inplace operation(data与detach)
[全栈深度学习] 02 vscode remote(远程)gpus 服务器开发调试 debugger(以 nanoGPT 为例)
[LLMs 实践] 03 LoRA fine-tune 大语言模型(peft、bloom 7b)