V
主页
[蒙特卡洛方法] 02 重要性采样(importance sampling)及 python 实现
发布人
本期 code:https://github.com/chunhuizhang/deeplearning_math/blob/main/tutorials/montecarlo/importance_sampling.ipynb
打开封面
下载高清视频
观看高清视频
视频下载器
[蒙特卡洛方法] 04 重要性采样补充,数学性质及 On-policy vs. Off-policy
[蒙特卡洛方法] 01 从黎曼和式积分(Reimann Sum)到蒙特卡洛估计(monte carlo estimation)求积分求期望
我妈妈非要我教他python去除安卓垃圾广告。
[蒙特卡洛方法] 03 接受/拒绝采样(accept/reject samping)初步 cases 分析
如何使用PID实现电机闭环控制
我教你爬虫,不是开发视频下片神器啊。
我教你python不是让你刷QQ会员改成2099年到期啊
[工具的使用] python jupyter 环境安装配置拓展(nbextension)(ExcecuteTime:执行时间,Table of Content)
我教你python,不是让你开发QQ最高等级修改器比马化腾等级还要高
[pytorch] 多项式分布及采样(torch.multinomial, torch distribution Categorical)
[python 多进程、多线程、协程] 02 用 python 多线程实现生产者消费者流程
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
[概率 & 统计] kl div kl散度的计算及应用(pytorch)
我拿python写爬虫,被360检测是病毒软件。
用Python暴力破解永久白嫖vip付费电影,一键操作无需下载,轻松实现电影自由!!
[pytorch 强化学习] 11 逐行写代码实现 DQN(ReplayMemory,Transition,DQN as Q function)
学员开发视频下片神器啊,别挂我名字啊。
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
【python 运筹优化】scipy.optimize.minimize 使用
[pytorch 强化学习] 07 迷宫环境(maze environment)Q Learning(value iteration)求解(策略关闭 off)
[pytorch 强化学习] 04 迷宫环境(maze environment)封装 MazeEnv、Agent 类
微软官宣「GitHub Spark」 编程进入自然语言时代|Copilot继续变强
【统计学】从置信水平(confidence level,置信区间)、Z值到最小采样数(最小抽样数)
[强化学习基础 01] MDP 基础(概率转移,与POMDP、I-POMDP)
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
【回归分析】最小二乘法的 python 实现以及 excel 回归分析及其可视化
不李姐?为什么很多人都非常反对用中文编程???
[pytorch 强化学习] 06 迷宫环境(maze environment)SARSA(Q-table,value iteration)求解
[pytorch 强化学习] 08 CartPole Q learning 连续状态离散化(digitize 分桶)及 display_frame_as_gif
[pytorch 强化学习] 03 动手写迷宫环境(maze env)状态及动作策略初步(及动画保存)
【python app 开发】01 使用 tkinter 及 pyinstaller 制作一个简单的日期管理软件
加班最严重的5个公务员单位
[动手写神经网络] 02 逐行写代码 CNN pipeline 图像分类(模型结构、训练、评估)
你敢想象这是一个程序员的八年吗
[python 多进程、多线程] 03 GIL、threading、多进程,concurrent.futures
【计算机科学】蒙特卡洛方法计算“一棍砍两刀”构成三角形的概率
[数据可视化] 绘制交互式 3d plot(interactive 3d plot, Axes3d) z=f(x, y) (三维空间中的 surface)
[pytorch 强化学习] 09 (逐行写代码)CartPole Q learning 基于连续状态离散化(digitize 分桶)
[pytorch 强化学习] 13 基于 pytorch 神经网络实现 policy gradient(REINFORCE)求解 CartPole
[python 多进程、多线程以及协程] 01 关于进程(multiprocessing,pid、ppid)