V
主页
京东 11.11 红包
7.强化学习与其他机器学习的关系
发布人
强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题
打开封面
下载高清视频
观看高清视频
视频下载器
3.强化学习应用案例—游戏
2.什么是强化学习-2
12.强化学习MDP四元组S,A,P,R-2
11.强化学习MDP四元组S,A,P,R-1
10.RL怎么办到的:试错探索
17.Model-based:状态转移与序列决策
9.强化学习与监督学习的区别
13.Agent的决策方式:value-based
4.强化学习应用案例—运动与平衡
6.强化学习应用案例—交通治理
14.价值函数
16.模型
41.强化学习的组成部分
5.强化学习应用案例—股票
44.策略梯度
Transformer+强化学习成为双热点强强联合的发文方向
42.随机策略
用7年前的显卡在那跑强化学习 issacgym
入门到成神!三小时可快速上手的【深度强化学习】,不愧是北大王树森博士,讲的是真的通俗易懂!
21.实验:RL agent→environment交互接口
23.Q表格
29.实验:悬崖行走问题
这可能是我见过强化学习和模型预测控制最好的教程!四大名校教授精讲动态系统和仿真、最优控制、策略梯度方法、MPC
强推!北京大学王树森半天就教会了我深度强化学习,原理详解+项目实战,学不会来打我!
【中英字幕】强化学习和模型预测控制18讲!四大名校教授精讲模型预测控制、最优控制、强化学习入门
MPC+强化学习!Actor Critic模型预测控制,苏黎世大牛教授人类水平性能的自主视觉无人机演讲
46.PG算法
27.Temporal Difference 时序差分(TD单步更新)
2. Attention机制
28.SARSA
GPT4O1是强化学习和大模型的一次成功融合
26.实验:状态价值迭代
7. Transformer的基本结构
36.DQN=Q-learning+神经网络
33.为什么需要神经网络
43.随机策略的实现
30.Q-learning之Off-Policy
强化学习四足机器人二
24. GPT-2的核心思想
34.值函数近似