V
主页
[手推公式] sigmoid 及其导数 softmax 及其导数性质(从 logits 到 probabilities)
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
[LLMs tuning] 01 trl SFTTrainer 中的 formatting_func 与 DataCollatorForCompletion
softmax回归原理及损失函数-跟李沐老师动手学深度学习
[AI 核心概念及计算] 优化 01 梯度下降(gradient descent)与梯度上升(gradient ascent)细节及可视化分析
【矩阵分析】从特征值特征向量到矩阵SVD奇异值分解(np.linalg.svd)
[概率 & 统计] KL 散度(KL div)forward vs. reverse
【手推公式】从二分类(二项分布)到多分类(多项分布),最大似然估计与交叉熵损失的等价
[强化学习基础 01] MDP 基础(概率转移,与POMDP、I-POMDP)
【矩阵分析】二维旋转矩阵的推导(极坐标/基变换)
【运筹】运筹决策系统的搭建,从决策变量、中间变量到约束及目标,从求解到无解时约束的放松
[深度学习面试系列] L2-L1正则的 MLE/MAP 概率解释
[Python 机器学习] 深入理解 numpy(ndarray)的 axis(轴/维度)
【手推公式】指数族分布(exponential family distribution),伯努利分布及高斯分布的推导
[矩阵分析] 从向量范数到矩阵范数、torch spectral norm(矩阵的谱范数)
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[动手写神经网络] 如何设计卷积核(conv kernel)实现降2采样,以及初探vggnet/resnet 卷积设计思路(不断降空间尺度,升channel)
[全栈算法工程师系列] python deepcopy(深拷贝,clone,克隆)性能优化(浅拷贝+递归)
[pytorch] [求导练习] 01 sigmoid 函数自动求导练习(autograd,单变量,多变量 multivariables 形式)
[五分钟系列] 01 gensim embedding vectors 距离及可视化分析
[LLMs inference] quantization 量化整体介绍(bitsandbytes、GPTQ、GGUF、AWQ)
[矩阵微分] 标量/矢量关于矢量/矩阵的矩阵微分,深度学习框架反向传播
【手推公式】从 logodds 到 sigmoid 概率化输出,用于 LR、XGBoost 的分类任务
[调包侠] 使用深度学习模型(paddlehub - humanseg)进行人物提取(前景提取、抠图)
[python 多进程、多线程以及协程] 01 关于进程(multiprocessing,pid、ppid)
[leetcode reviews] 01 计算思维与刷题方法
[矩阵分析] 旋转矩阵的计算机与应用(复平面,RoPE)
【手推公式】odds(几率)与对数几率(logodds)在logistics regression及xgboost classification中的应用
[pytorch distributed] 01 nn.DataParallel 数据并行初步
[pytorch optim] 优化器相关 - learning rate scheduler
【手推公式】multi-classification多分类评估(precision/recall,micro averaging与macro averaging
【机器学习】【手推公式】从Hinge loss(合页损失)到 SVM(hard margin/soft margin)
[模型拓扑接口] 经典 RNN 模型(一)模型参数及训练参数的介绍
【数值计算】newton's method 牛顿法求极值点,求函数的零点(求根),图解法
[stable diffusion] 01 本地安装及环境配置(diffusers, StableDiffusionPipeline, text2image)
[pytorch optim] Adam 与 AdamW,L2 reg 与 weight decay,deepseed
[纳什荐书][生成式AI] 01 《GPT图解》导读
[概率 & 统计] Thompson Sampling(随机贝叶斯后验采样)与多臂老虎机
[小白向-深度学习装机指南] 01 双4090 涡轮版开箱启动 vlog(gpu burn,cpu burn)
【数学分析】泰勒级数(Taylor series)展开的本质(多项式逼近)多项式系数的推导
[矩阵分析] LoRA 矩阵分析基础之 SVD low rank approximation(低秩逼近)