V
主页
京东 11.11 红包
35.DQN:使用神经网络求解RL
发布人
强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题
打开封面
下载高清视频
观看高清视频
视频下载器
28.SARSA
10.RL怎么办到的:试错探索
21.实验:RL agent→environment交互接口
42.随机策略
43.随机策略的实现
33.为什么需要神经网络
40.实验:DQN-车杆问题
47.演员-评论员算法
41.强化学习的组成部分
32.实验:Q-Learning算法
12.强化学习MDP四元组S,A,P,R-2
11.强化学习MDP四元组S,A,P,R-1
13.Agent的决策方式:value-based
46.PG算法
48.离散动作VS连续动作
27.Temporal Difference 时序差分(TD单步更新)
14.价值函数
31.Q-learning VS Sarsa
5.强化学习应用案例—股票
17.Model-based:状态转移与序列决策
1.什么是强化学习-1
34.值函数近似
01.卷积神经网络的组成层
25.巴普洛夫的条件反射实验
不愧是李宏毅老师讲的【强化学习】简直太详细了!!小白也能信手拈来,建议收藏!(人工智能|机器学习|深度学习|强化学习)
17.使用重复元素的网络(VGG)
一口气学完回归算法、聚类算法、决策树、随机森林、神经网络、贝叶斯算法、支持向量机、神经网络等十二大机器学习算法!通俗易懂
16.模型
8.强化学习与其他机器学习的区别
10.AI视频生成-1
3.应用:基于字符级循环神经网络的语言模型
强推!这绝对是B站最全的(python+机器学习+深度学习)系列教程,草履虫都能学会,学不会你来锤爆我!人工智能/机器学习/深度学习/python/神经网络
Transformer+强化学习成为双热点强强联合的发文方向
6.强化学习应用案例—交通治理
18.Model-free:试错探索
【200集付费】一口气学完回归算法、聚类算法、决策树、随机森林、神经网络、贝叶斯算法、支持向量机、神经网络等十二大机器学习算法一次性学完!
18.含并行连结的网络(GoogLeNet)
15.CLIP模型与AI绘画
简直逆天!李永乐老师深度讲解AI!带你了解电脑如何像人一样思考,带你学习AI前沿技术/人工智能/机器学习/深度学习/神经网络/计算机技术
麻省理工【算法导论】原著大佬带你一起啃书!全23讲!99%的程序员都会学!(人工智能、深度学习、机器学习、神经网络、pytorch、AI)