[凸函数] convex 性质与简森不等式（jensen's inequality）与 ELBO、投资组合理论（Porfolio） - 视频下载 Video Downloader

[凸函数] convex 性质与简森不等式（jensen's inequality）与 ELBO、投资组合理论（Porfolio）

发布人

本期 code：https://github.com/chunhuizhang/deeplearning_math/blob/main/tutorials/calculus/convex_function_jensen_inequality.ipynb

打开封面下载高清视频观看高清视频视频下载器

[机器学习理论] 霍夫丁不等式（hoeffding's inequality）到 UCB

[diffusion] 生成模型基础 VAE 原理及实现

[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader（mnist、fashionmnist、cifar10）

[蒙特卡洛方法] 04 重要性采样补充，数学性质及 On-policy vs. Off-policy

[pytorch 强化学习] 11 逐行写代码实现 DQN（ReplayMemory，Transition，DQN as Q function）

[损失函数设计] 为什么多分类问题损失函数用交叉熵损失，而不是 MSE

[pytorch 强化学习] 01 认识环境（environment，gym.Env）以及 CartPole-v0/v1 环境

[pytorch] [求导练习] 01 sigmoid 函数自动求导练习（autograd，单变量，多变量 multivariables 形式）

[Python 机器学习] 深入理解 numpy（ndarray）的 axis（轴/维度）

[personal chatgpt] instructGPT 中的 reward modeling，概率建模与损失函数性质

[数据可视化] 绘制交互式 3d plot（interactive 3d plot, Axes3d） z=f(x, y) （三维空间中的 surface）

[pytorch 强化学习] 10 从 Q Learning 到 DQN（experience replay 与 huber loss / smooth L1）

[pytorch] 激活函数（梯度消失）sigmoid，clamp，relu（sparse representation，dying relu）

[矩阵分析] LoRA 矩阵分析基础之 SVD low rank approximation（低秩逼近）

[动手写神经网络] 02 逐行写代码 CNN pipeline 图像分类（模型结构、训练、评估）

[动手写神经网络] 05 使用预训练 resnet18 提升 cifar10 分类准确率及误分类图像可视化分析

[pytorch distributed] 01 nn.DataParallel 数据并行初步

[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新（forward，loss.backward(), optimizer.step）

[LLM & AIGC] 03 openai embedding （text-embedding-ada-002）基于 embedding 的文本语义匹配

[手推公式] sigmoid 及其导数 softmax 及其导数性质（从 logits 到 probabilities）

[LLMs inference] quantization 量化整体介绍（bitsandbytes、GPTQ、GGUF、AWQ）

[动手写 Transformer] 手动实现 Transformer Decoder（交叉注意力，encoder-decoder cross attentio）

[pytorch 强化学习] 03 动手写迷宫环境（maze env）状态及动作策略初步（及动画保存）

[动手写bert系列] 01 huggingface tokenizer （vocab，encode，decode）原理及细节

[RLHF] 从 PPO rlhf 到 DPO，公式推导与原理分析

[pytorch optim] pytorch 作为一个通用优化问题求解器（目标函数、决策变量）

[python 多进程、多线程] 03 GIL、threading、多进程，concurrent.futures

Note007-5-广义对数平均广义反调和平均不等式的推广结果

[pytorch] 激活函数，从 ReLU、LeakyRELU 到 GELU 及其梯度（gradient）（BertLayer，FFN，GELU）

[蒙特卡洛方法] 01 从黎曼和式积分（Reimann Sum）到蒙特卡洛估计（monte carlo estimation）求积分求期望

[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程

[调包侠] 使用深度学习模型（paddlehub - humanseg）进行人物提取（前景提取、抠图）

[personal chatgpt] 从 RoPE 到 CoPE（绝对位置编码，相对位置编码，Contextual Position Encoding）

[LLM+RL] 合成数据与model collapse，nature 正刊封面

[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像

[动手写神经网络] 04 使用预训练 vgg 提升 cifar10 分类准确率

[优化算法] 梯度下降、共轭梯度、牛顿法、逆牛顿法（BFGS）

[LangChain] 04 LangGraph 构建复杂 RAG workflow（Self-corrective）

[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程（nn.NLLLoss(nn.LogSoftmax))

[bert、t5、gpt] 10 知识蒸馏（knowledge distill）初步，模型结构及损失函数设计