V
主页
京东 11.11 红包
39.DQN算法
发布人
强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题
打开封面
下载高清视频
观看高清视频
视频下载器
35.DQN:使用神经网络求解RL
40.实验:DQN-车杆问题
46.PG算法
47.演员-评论员算法
这可能是我见过强化学习和模型预测控制最好的教程!四大名校教授精讲动态系统和仿真、最优控制、策略梯度方法、MPC
38.目标网络
3.强化学习应用案例—游戏
【MPC+强化学习】四大名校教授精讲强化学习和模型预测控制18讲!Actor Critic模型预测控制、策略梯度方法
41.强化学习的组成部分
1.算力的概念及量纲
11.强化学习MDP四元组S,A,P,R-1
12.强化学习MDP四元组S,A,P,R-2
【2024最新完整版】不愧是李宏毅教授!一口气学完机器学习、深度学习、强化学习、生成式AI等课程!一套全解决!
Transformer+强化学习成为双热点强强联合的发文方向
22.经典控制问题
13.Agent的决策方式:value-based
43.随机策略的实现
25.巴普洛夫的条件反射实验
【强化学习实战】计算机博士花半天带你学会强化学习PPO算法/DQN算法/A3C算法原理及实战!_AI/人工智能/深度学习/强化学习
37.DQN两大创新点
大模型如何增强强化学习?简单粗暴理解大模型训练中的人类反馈强化学习RLHF!PPO算法、ChatGPT背后的数学原理
8.强化学习与其他机器学习的区别
5.强化学习应用案例—股票
12.算力网络的概念解析
18.Model-free:试错探索
MPC+强化学习!Actor Critic模型预测控制,苏黎世大牛教授人类水平性能的自主视觉无人机演讲
【中英字幕】强化学习和模型预测控制18讲!四大名校教授精讲模型预测控制、最优控制、强化学习入门
15.Agent的决策方式:policy-based
4.强化学习应用案例—运动与平衡
26.实验:状态价值迭代
19.RL概览分类
14.价值函数
12.AIGC在元宇宙方向的应用
强化学习四足机器人一
20.RL编程实践:GYM
用AI写文章必看!一条指令彻底去除AI味!轻松写出爆款!【全网独家】深层解析AI底层原理!
14.空洞卷积
一文讲清楚CUDA
25. GPT-2的数据集
6个智能体的编队导航与避障_补充实验