V
主页
京东 11.11 红包
45.PG实现技巧
发布人
强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题
打开封面
下载高清视频
观看高清视频
视频下载器
49.DDPG
36.DQN=Q-learning+神经网络
50.实验:DDPG倒立摆问题
39.DQN算法
41.强化学习的组成部分
23.Q表格
1.什么是强化学习-1
27.Temporal Difference 时序差分(TD单步更新)
44.策略梯度
02.挖矿的原理
1.算力的概念及量纲
43.随机策略的实现
12.强化学习MDP四元组S,A,P,R-2
14.空洞卷积
07.区块链的特点
3.强化学习应用案例—游戏
19.区块链关键技术-1
15.池化层
37.DQN两大创新点
38.目标网络
10.量子计算
14.价值函数
34.值函数近似
4.算力:人工智能核心底座
强推!北京大学王树森半天就教会了我深度强化学习,原理详解+项目实战,学不会来打我!
3.智能计算
20.区块链关键技术-2
10.卷积层参数-1
15.Agent的决策方式:policy-based
10.AI视频生成-1
7.GPU—前沿技术发展趋势与应用
26.实验:状态价值迭代
13.Agent的决策方式:value-based
7. Transformer的基本结构
33.为什么需要神经网络
48.离散动作VS连续动作
11.AI视频生成-2
31. GPT系列模型与ChatGPT
6.超算产业链与市场格局
11.算效的概念