V
主页
[凸函数] convex 性质与简森不等式(jensen's inequality)与 ELBO、投资组合理论(Porfolio)
发布人
本期 code:https://github.com/chunhuizhang/deeplearning_math/blob/main/tutorials/calculus/convex_function_jensen_inequality.ipynb
打开封面
下载高清视频
观看高清视频
视频下载器
[机器学习理论] 霍夫丁不等式(hoeffding's inequality)到 UCB
[diffusion] 生成模型基础 VAE 原理及实现
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
[蒙特卡洛方法] 04 重要性采样补充,数学性质及 On-policy vs. Off-policy
[pytorch 强化学习] 11 逐行写代码实现 DQN(ReplayMemory,Transition,DQN as Q function)
[损失函数设计] 为什么多分类问题损失函数用交叉熵损失,而不是 MSE
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
[pytorch] [求导练习] 01 sigmoid 函数自动求导练习(autograd,单变量,多变量 multivariables 形式)
[Python 机器学习] 深入理解 numpy(ndarray)的 axis(轴/维度)
[personal chatgpt] instructGPT 中的 reward modeling,概率建模与损失函数性质
[数据可视化] 绘制交互式 3d plot(interactive 3d plot, Axes3d) z=f(x, y) (三维空间中的 surface)
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
[pytorch] 激活函数(梯度消失)sigmoid,clamp,relu(sparse representation,dying relu)
[矩阵分析] LoRA 矩阵分析基础之 SVD low rank approximation(低秩逼近)
[动手写神经网络] 02 逐行写代码 CNN pipeline 图像分类(模型结构、训练、评估)
[动手写神经网络] 05 使用预训练 resnet18 提升 cifar10 分类准确率及误分类图像可视化分析
[pytorch distributed] 01 nn.DataParallel 数据并行初步
[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新(forward,loss.backward(), optimizer.step)
[LLM & AIGC] 03 openai embedding (text-embedding-ada-002)基于 embedding 的文本语义匹配
[手推公式] sigmoid 及其导数 softmax 及其导数性质(从 logits 到 probabilities)
[LLMs inference] quantization 量化整体介绍(bitsandbytes、GPTQ、GGUF、AWQ)
[动手写 Transformer] 手动实现 Transformer Decoder(交叉注意力,encoder-decoder cross attentio)
[pytorch 强化学习] 03 动手写迷宫环境(maze env)状态及动作策略初步(及动画保存)
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
[pytorch optim] pytorch 作为一个通用优化问题求解器(目标函数、决策变量)
[python 多进程、多线程] 03 GIL、threading、多进程,concurrent.futures
Note007-5-广义对数平均广义反调和平均不等式的推广结果
[pytorch] 激活函数,从 ReLU、LeakyRELU 到 GELU 及其梯度(gradient)(BertLayer,FFN,GELU)
[蒙特卡洛方法] 01 从黎曼和式积分(Reimann Sum)到蒙特卡洛估计(monte carlo estimation)求积分求期望
[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程
[调包侠] 使用深度学习模型(paddlehub - humanseg)进行人物提取(前景提取、抠图)
[personal chatgpt] 从 RoPE 到 CoPE(绝对位置编码,相对位置编码,Contextual Position Encoding)
[LLM+RL] 合成数据与model collapse,nature 正刊封面
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像
[动手写神经网络] 04 使用预训练 vgg 提升 cifar10 分类准确率
[优化算法] 梯度下降、共轭梯度、牛顿法、逆牛顿法(BFGS)
[LangChain] 04 LangGraph 构建复杂 RAG workflow(Self-corrective)
[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程(nn.NLLLoss(nn.LogSoftmax))
[bert、t5、gpt] 10 知识蒸馏(knowledge distill)初步,模型结构及损失函数设计