V
主页
京东 11.11 红包
12.强化学习MDP四元组S,A,P,R-2
发布人
强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题
打开封面
下载高清视频
观看高清视频
视频下载器
3.强化学习应用案例—游戏
31.Q-learning VS Sarsa
28.SARSA
36.DQN=Q-learning+神经网络
44.策略梯度
5.强化学习应用案例—股票
35.DQN:使用神经网络求解RL
7.强化学习与其他机器学习的关系
25.巴普洛夫的条件反射实验
29.实验:悬崖行走问题
47.演员-评论员算法
10.RL怎么办到的:试错探索
17.Model-based:状态转移与序列决策
33.为什么需要神经网络
26.实验:状态价值迭代
19.RL概览分类
38.目标网络
24.悬崖行走问题
1.为什么需要RNN
40.实验:DQN-车杆问题
30.Q-learning之Off-Policy
23.Q表格
16. Transformer位置嵌入
14. 自注意力中的残差连接
4. 常用注意力得分的计算方式
1.算力的概念及量纲
12.实战:LSTM股价预测-1
6.强化学习应用案例—交通治理
7. Transformer的基本结构
30. GPT-3综合性能
31. GPT系列模型与ChatGPT
45.PG实现技巧
15. Transformer详解:多头注意力
37.DQN两大创新点
19. GPT介绍
12. Transformer计算示例
17. Transformer详解:解码器
6. Transformer详解:高层Transformer
2. Attention机制
20.RL编程实践:GYM