V
主页
【统计】箱线图(boxplot)进行异常点检测(outlier detection),为什么定义为 1.5倍的 IQR
发布人
https://towardsdatascience.com/why-1-5-in-iqr-method-of-outlier-detection-5d07fdc82097
打开封面
下载高清视频
观看高清视频
视频下载器
【统计学】p-value(p值) 与 z-score(标准分/z得分/z分数)定义,计算以及适用场景
[QKV attention] flash attention(Tiling与重计算),operation fused,HBM vs. SRAM
【数字图像处理】HoG+SVM+NMS行人检测(pedestrian detection)(python-opencv)
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
【统计】统计检验(从t-distribution(t分布)到t-test(t检验),t-score(t-统计量)以及卡方检验(chi-test),excel计算
[pytorch distributed] 从 DDP、模型并行、流水线并行到 FSDP(NCCL,deepspeed 与 Accelerate)
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[personal chatgpt] 从 RoPE 到 CoPE(绝对位置编码,相对位置编码,Contextual Position Encoding)
[损失函数设计] 为什么多分类问题损失函数用交叉熵损失,而不是 MSE
[leetcode reviews] 207. Course Schedule(图算法,拓扑排序,DAG 环检测)
[DRL] 从策略梯度到 TRPO(Lagrange Duality,拉格朗日对偶性)
[强化学习基础 02] MDP价值迭代算法(value iteration,V(s), Q(s,a), pi(s))
[概率 & 统计] Thompson Sampling(随机贝叶斯后验采样)与多臂老虎机
[蒙特卡洛方法] 04 重要性采样补充,数学性质及 On-policy vs. Off-policy
[优化算法] 梯度下降、共轭梯度、牛顿法、逆牛顿法(BFGS)
[prompt engineering] 从 CoT 到 ToT(Tree of Thoughts)
【矩阵分析】从特征值特征向量到矩阵SVD奇异值分解(np.linalg.svd)
[bert、t5、gpt] 05 构建 TransformerDecoderLayer(FFN 与 Masked MultiHeadAttention)
[gpt2 番外] training vs. inference(generate),PPL 计算,交叉熵损失与 ignore_index
[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程
【回归分析】R2(coefficient of determination)的定义及计算(SSres、SStot)及图形化解释(graphical expla)
[LLMs tuning] 01 trl SFTTrainer 中的 formatting_func 与 DataCollatorForCompletion
【数值计算】牛顿迭代法(Newton's method,Newton-Raphson method,牛顿-拉夫逊(拉弗森))计算二次方根(sqrt)三次方根
[pytorch] [求导练习] 03 计算图(computation graph)及链式法则(chain rule)反向传播过程
【手推公式】从二分类到多分类,从sigmoid到softmax,从最大似然估计到 cross entropy
【python 运筹优化】scipy.optimize.minimize 使用
【RNN、LSTM、Attention、Transformer、预训练、生成模型、强化学习一次学完】——常虹(中国科学院大学)
[调包侠] 04 使用预训练模型进行图像特征向量提取(image feature extractor,img2vec)并进行相似性计算
[蒙特卡洛方法] 01 从黎曼和式积分(Reimann Sum)到蒙特卡洛估计(monte carlo estimation)求积分求期望
[pytorch] 激活函数(梯度消失)sigmoid,clamp,relu(sparse representation,dying relu)
[DRL] 从 TRPO 到 PPO(PPO-penalty,PPO-clip)
[调包侠] 使用 PyTorch Swin Transformer 完成图像分类
【手推公式】logistic regression 为什么不采用 squared loss作为其损失函数,如何从最大似然估计得到交叉熵损失函数
【销量预测】R2(r_squared)与相关系数(correlation)的区别和联系,什么情况下R2=correlation,R2与MAE,RMSE
【手推公式】logistic regression 及其与 linear regression 的区别,对数线性与对数几率
【统计】【excel】从均值(average)、标准差(stdevp)、标准化(standardize)到相关系数(correl)
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
[A100 02] GPU 服务器压力测试,gpu burn,cpu burn,cuda samples
[pytorch 强化学习] 06 迷宫环境(maze environment)SARSA(Q-table,value iteration)求解
[LLMs inference] quantization 量化整体介绍(bitsandbytes、GPTQ、GGUF、AWQ)