V
主页
京东 11.11 红包
[凸函数] convex 性质与简森不等式(jensen's inequality)与 ELBO、投资组合理论(Porfolio)
发布人
本期 code:https://github.com/chunhuizhang/deeplearning_math/blob/main/tutorials/calculus/convex_function_jensen_inequality.ipynb
打开封面
下载高清视频
观看高清视频
视频下载器
[机器学习理论] 霍夫丁不等式(hoeffding's inequality)到 UCB
[diffusion] 生成模型基础 VAE 原理及实现
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
[pytorch] 激活函数(梯度消失)sigmoid,clamp,relu(sparse representation,dying relu)
[动手写神经网络] 手动实现 Transformer Encoder
[pytorch] [求导练习] 02 softmax 函数自动求导练习(autograd,Jacobian matrix)
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
[程序员说金融] 对数回报率(收益率)及其性质(可加性,负对称性,及泰勒展开下的近似相等)
【python 运筹优化】scipy.optimize.minimize 使用
[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
[工具的使用] python jupyter 环境安装配置拓展(nbextension)(ExcecuteTime:执行时间,Table of Content)
[蒙特卡洛方法] 04 重要性采样补充,数学性质及 On-policy vs. Off-policy
[pytorch] [求导练习] 01 sigmoid 函数自动求导练习(autograd,单变量,多变量 multivariables 形式)
[bert、t5、gpt] 10 知识蒸馏(knowledge distill)初步,模型结构及损失函数设计
[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif(以 CartPole 为例,mode='rgb_array')
[数据可视化] 绘制交互式 3d plot(interactive 3d plot, Axes3d) z=f(x, y) (三维空间中的 surface)
[LLM+RL] 合成数据与model collapse,nature 正刊封面
[Python 机器学习] 深入理解 numpy(ndarray)的 axis(轴/维度)
[pytorch 强化学习] 09 (逐行写代码)CartPole Q learning 基于连续状态离散化(digitize 分桶)
[pytorch optim] pytorch 作为一个通用优化问题求解器(目标函数、决策变量)
[矩阵分析] LoRA 矩阵分析基础之 SVD low rank approximation(低秩逼近)
[pytorch 强化学习] 06 迷宫环境(maze environment)SARSA(Q-table,value iteration)求解
【python 运筹】约束满足规划问题 | CP-SAT solver | ortools | 自定义打印所有可行解的回调函数
[模型拓扑结构] pytorch 注册钩子函数(register_forward_hook)实现对各个层(layer)输入输出 shape 的查看
[pytorch 强化学习] 03 动手写迷宫环境(maze env)状态及动作策略初步(及动画保存)
[损失函数设计] 为什么多分类问题损失函数用交叉熵损失,而不是 MSE
【python 数学编程】SymPy 数学家的朋友 | hessian | Jacobian
【回归分析】最小二乘法的 python 实现以及 excel 回归分析及其可视化
[手推公式] sigmoid 及其导数 softmax 及其导数性质(从 logits 到 probabilities)
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[animation & rendering] matplotlib funcanimation 多重动画绘制(multiple lines plot)
[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计(MLE)伯努利分布的参数
[personal chatgpt] Llama2 7B vs. Llama3 8B (词表、attention 及 mlp)
[pytorch 模型拓扑结构] 深入理解 nn.BCELoss 计算过程及 backward 及其与 CrossEntropyLoss 的区别与联系
[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程(nn.NLLLoss(nn.LogSoftmax))
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
[调包侠] 04 使用预训练模型进行图像特征向量提取(image feature extractor,img2vec)并进行相似性计算
[动手写bert系列] BertSelfLayer 多头注意力机制(multi head attention)的分块矩阵实现
【统计学】p-value(p值) 与 z-score(标准分/z得分/z分数)定义,计算以及适用场景