V
主页
【强化学习】策略梯度方法-策略近似
发布人
本节从离散和连续动作空间的角度讨论策略近似的基本思路 =================================================== 参考书籍:13.1, Chapter 13, Reinforcement Learning - An Introduction, Sutton & Barto =================================================== 2018年版本: 网盘链接: https://pan.baidu.com/s/
打开封面
下载高清视频
观看高清视频
视频下载器
【强化学习】策略梯度方法-策略梯度定理
IsaacLab+rsl_rl强化学习
上海交大张伟楠强化学习课程第3讲:马尔可夫决策过程I
【强化学习】规划与学习-蒙特卡洛树搜索 MCTS
【强化学习】蒙特卡洛方法-策略评估
【强化学习】 时序差分-策略评估
【强化学习】 蒙特卡洛方法-离轨策略评估与控制
【强化学习】策略梯度方法-REINFORCE with Baseline & Actor-Critic
【强化学习】策略梯度方法-REINFORCE
上海交大张伟楠强化学习课程第6讲:无模型控制方法II
【强化学习】时序差分-期望SARSA
强推!【全150集】机器学习+强化学习+深度学习,一口气带你全部学完!真的太通俗易懂了!(人工智能、深度学习、神经网络、机器学习算法、计算机视觉)
【强化学习】规划与学习-算力聚焦
【强化学习】动态规划【白板推导系列】
【强化学习】(SARSA) 时序差分-同轨策略TD控制
比啃书爽!周志华机器学习视频全套教程终于找到了!简单易懂!强化学习/神经网络/线性回归/聚类算法/半监督学习
【强化学习】 蒙特卡洛方法-同轨策略MC控制
【强化学习】蒙特卡洛方法-同轨VS离轨
【机器学习】【白板推导系列】【合集 1~33】
【强化学习玩游戏】强化学习轮足机器人控制器,PPO算法原理+公式推导,月球登陆器训练+超级马里奥简单易懂的项目实战!
这绝对是全B站最系统(没有之一)的人工智能基础教学!内含机器学习、深度学习、强化学习、NLP、等多个方向解析,零基础必看!
【强化学习】蒙特卡洛方法-前情回顾
【强化学习】蒙特卡洛方法-离轨策略MC策略评估
机器学习-强化学习详解!这绝对是全网最简单的强化学习基础概念与算法讲解,代码实战!
【强化学习玩游戏】简单易懂的PPO算法及公式推导!强化学习轮足机器人控制器、月球登陆器训练+超级马里奥项目实战!
强化学习+交通信号灯 chapter4 (RL训练单交通信号灯)
【机器学习】白板推导系列(三十二) ~ 变分自编码器(VAE)
上海交大张伟楠强化学习课程第1讲:强化学习简介III
【优化算法】线搜索方法-收敛性证明
【强化学习】(Q-Learning) 时序差分-离轨策略TD控制
【深度强化学习】华盛顿大学Steve Brunton教授精讲《数据驱动的科学与工程:机器学习、动态系统与控制》
【优化算法】线搜索方法-步长-精确搜索
(教材+源码)【动手学深度学习v2】看原著大佬李沐如何通俗易懂的讲解深度学习!真的建议收藏!(人工智能、深度学习、机器学习算法、计算机视觉、Pytorch)
【强化学习】蒙特卡洛方法-基于试探性出发假设的MC控制
【黑神话:悟空】中机器学习算法的奇妙运用,从机器学习到游戏性能优化,一口气学完机器学习经典算法-机器学习/深度学习/强化学习/算法/智能NPC
【机器学习】白板推导系列(三十一) ~ 生成对抗网络(GAN)
【优化算法】梯度下降法-白老爹定理(下)
上海交大张伟楠强化学习课程第16讲:基于扩散模型的强化学习
强推!不愧是李宏毅教授!一口气把机器学习、深度学习、强化学习、神经网络、生成式AI给讲透了!存下吧,真的比啃书好多了!(AI人工智能/ChatGPT)
发论文idea来了!强化学习融合Transformer,全是创新点!