V
主页
[蒙特卡洛方法] 01 从黎曼和式积分(Reimann Sum)到蒙特卡洛估计(monte carlo estimation)求积分求期望
发布人
本期code:https://github.com/chunhuizhang/bilibili_vlogs/blob/master/rl/montecarlo/01_monte_carlo_estimation.ipynb 参考:https://en.wikipedia.org/wiki/Monte_Carlo_integration
打开封面
下载高清视频
观看高清视频
视频下载器
【传奇扑克】蒙特卡洛站2024超级豪客赛系列#3 MTT40K买入(2)
尼斯 摩纳哥 戛纳,三天慢生活闲逛体验~
【计算机科学】蒙特卡洛方法计算“一棍砍两刀”构成三角形的概率
这应该是你能找到的讲解最系统全面的【强化学习】教程!北大出身王树森教授从零到一保姆式教学,小白也能很好懂!
神力科莎Mod F1 美國鳳凰城站Phoenix 1989~1991 兩個佈局
【python 运筹优化】scipy.optimize.minimize 使用
奇点对数值积分精度的影响
[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程
【优化控制的数值方法 2017】弗莱堡大学—中英字幕
[LangChain] 03 LangGraph 基本概念(AgentState、StateGraph,nodes,edges)
[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计(MLE)伯努利分布的参数
【数值计算】牛顿迭代法(Newton's method,Newton-Raphson method,牛顿-拉夫逊(拉弗森))计算二次方根(sqrt)三次方根
5 有限元中高斯积分与单元刚度计算——有限元法
[personal chatgpt] peft LoRA merge pipeline(lora inject,svd)
结构方程模型样本量估计:R与Mplus中的蒙特卡洛模拟 lavaan simsem mplus
[调包侠] 04 使用预训练模型进行图像特征向量提取(image feature extractor,img2vec)并进行相似性计算
拉格朗日插值的重心形式(很遗憾,绝大部分教材都不介绍)
攻略黑化女二顾染多年,我终于攒够了回家的积分。我激动极了,当即要用积分兑换回家……
[LLMs 实践] 10 预训练语料,mapping & streaming(load_dataset)
[AI 核心概念及计算] 优化 01 梯度下降(gradient descent)与梯度上升(gradient ascent)细节及可视化分析
[stable diffusion] 01 本地安装及环境配置(diffusers, StableDiffusionPipeline, text2image)
[DRL] 从 TRPO 到 PPO(PPO-penalty,PPO-clip)
【程序员说会计】breakeven | 盈亏平衡点 | 总营收(total revenue)| 总成本(total cost)| 边际贡献
[pytorch optim] 优化器相关 AdaGrad(adaptive gradient) 与 RMSprop,自适应梯度
[python nlp] 01 词频分析与 Zipf law 齐夫定律(log-log plot)
QR算法发明人的故事
[pytorch] Tensor 轴(axis)交换,transpose(转置)、swapaxes、permute
[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置
指数收敛的梯形求积公式(巴比伦人都会的公式)
[LLMs 实践] 19 llama2 源码分析 RoPE apply_rotary_emb 从绝对位置编码到相对位置编码
[数值计算] 快速计算、秒算大数乘除运算,对数变换将乘除变为加减,再通过查表(logarithm table)获得10-99之间的对数值
【基础数学】1.01^365/0.99^365有数量级的变化,为什么1.001^365/0.999^365却没有数量级的变化。它们跟自然常数e关系,复利与年化
[番外] float16 与 bf16 表示和计算细节
【python 运筹优化】scipy.optimize.minimize 接口介绍(method、jacobian、hessian)| 有约束非线性优化
测度与积分,第十一讲(Measures and Integrals, 11th Class, 2022)
[LLMs 实践] 13 gradient checkpointing 显存优化 trick
[pytorch distributed] nccl 集合通信(collective communication)
【抽样】蓄水池抽样(Reservoir sampling),长度为N的流式(streaming)或链表,每个样本被选中的概率为1/N
[pytorch] [求导练习] 01 sigmoid 函数自动求导练习(autograd,单变量,多变量 multivariables 形式)
[强化学习基础 03] 多臂老虎机(Multi-Armed Bandit)与 UCB