V
主页
什么是 策略梯度 Policy Gradients (Reinforcement Learning 强化学习)
发布人
今天我们会来说说强化学习家族中另一类型算法, 叫做 Policy Gradients. Code: https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow 更多内容见莫烦Python: https://mofanpy.com 支持莫烦: https://mofanpy.com/support
打开封面
下载高清视频
观看高清视频
视频下载器
什么是 Q Learning (Reinforcement Learning 强化学习)
什么是 DQN (Reinforcement Learning 强化学习)
什么是 L1 L2 正规化 正则化 Regularization (深度学习 deep learning)
什么是 Actor Critic (Reinforcement Learning 强化学习)
什么是强化学习? (Reinforcement Learning)
什么是 Sarsa (Reinforcement Learning 强化学习)
【莫烦Python】进化算法 Evolutionary Algorithms
什么是 Sarsa(lambda) (Reinforcement Learning 强化学习)
什么是循环神经网络 RNN (深度学习)?
【莫烦Python】站在巨人的肩膀上, 迁移学习 Transfer Learning
超全超简单!一口气刷完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM、DBN等八大深度学习神经网络算法!真的比刷剧还爽!
【莫烦Python】Matplotlib Python 画图教程
什么是 LSTM RNN 循环神经网络 (深度学习)?
【莫烦Python】Numpy & Pandas (数据处理教程)
什么是激励函数 (深度学习)? Why need activation functions (deep learning)?
强化学习教父Sutton持续反向传播算法登Nature!证明深度学习还不如浅层网络
什么是 A3C (Asynchronous Advantage Actor-Critic) 强化学习
什么是自编码 Autoencoder (深度学习)?
什么是卷积神经网络 CNN (深度学习)?
【莫烦Python】机械手臂从零开始 (机器学习实战 强化学习)
为什么要特征标准化 (深度学习)?
什么是过拟合 (深度学习)? What is overfitting (deep learning)?
什么是 Batch Normalization 批标准化 (深度学习 deep learning)
处理不均衡数据 (深度学习)!
122集付费!CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络一口气全部学完!
什么叫鞭辟近里?三小时即可快速上手的【强化学习】系统教程,从零到一系统掌握基础原理及代码实战!
强化学习付费教程!强化学习实战系列,最全最完整的强化学习教程从零基础开始教学,学完可实战!
什么是神经网络 (机器学习) what is neural network in machine learning
什么是 GAN 生成对抗网络 (深度学习)?
什么是机器学习? What is machine learning?
科普: 神经网络的黑盒不黑 (深度理解神经网络)
草履虫都能学会!这可能是B站最全的(Python+机器学习+深度学习)系列课程了,快速入门巨简单,还学不会来打爆我!/人工智能/机器学习/深度学习/python
怎样区分好用的特征 (深度学习)?
【西瓜书全网最详尽讲解】计算机博士花费30个小时白话讲解!保证能学会!! -人工智能/机器学习/深度学习
【深度强化学习】作者华盛顿大学Steve Brunton教授精讲《数据驱动的科学与工程:机器学习、动态系统与控制》流体动力学、SVD、神经网络
Unity使用自己的强化学习算法(DQN)训练智能体——学习日记
我愿称之为强化学习天花板课程!台大李宏毅教授亲授强化学习教程,究极通俗易懂!建议收藏!
【莫烦Python】Tkinter 做简单的窗口视窗 Python GUI
从模型预测控制到强化学习-11:确定性策略梯度DPG与随机策略梯度SPG,从控制的角度理解(D)DPG, A2C, QAC, REINFORCE
科普: 人工神经网络 VS 生物神经网络