V
主页
强化学习及其在无人系统中的应用
发布人
中国科学院自动化研究所 2024年4月 第三届智能决策论坛报告
打开封面
下载高清视频
观看高清视频
视频下载器
MPC and RL【模型预测控制与强化学习】-1-Introduction
MPC and RL【模型预测控制与强化学习】- 4-Dynamic Programming and LQR
MPC and RL【模型预测控制与强化学习】- 2-Dynamic Systems and Simulation
MPC and RL【模型预测控制与强化学习】- 3-Numerical Optimization
MPC and RL【模型预测控制与强化学习】- 5-MDPs, PI and VI
【模型预测控制与强化学习】Sebastien Gros- Adaptation of MPC via RL: fundamental principle
MPC and RL【模型预测控制与强化学习】13-Advanced Value-based Methods
强推!2024年最适合初学者入门学习的《机器学习+深度学习+强化学习》上海交大和腾讯强强联合打造!太全面了!
MPC and RL【模型预测控制与强化学习】7-2-Numerical Optimal Control
太完整了!我居然3天时间就掌握了【机器学习+深度学习+强化学习+PyTorch】理论到实战,多亏了这个课程,绝对通俗易懂纯干货分享!
Learning-based Model Predictive Control - Towards Safe Learning in Control
伦敦政治经济学院朱进博士:强化学习的变量选择方法
Stanford CS234 2024 Spring | 强化学习 | Reinforcement Learning
通俗理解大模型从预训练到微调实战!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习
RLChina 2024 | 3小时强化学习入门课程-下
斯坦福大学《强化学习|Stanford CS234 Reinforcement Learning 2024》deepseek翻译
MPC and RL【模型预测控制与强化学习】10.11- On/offpolicy RL with Function Approximation
MPC and RL【模型预测控制与强化学习】15 - Planning and Learning
Solving Game-Theoretic Hamilton-Jacobi Equations in a Model-Free Way
不愧是顶会收割机!迪哥精讲强化学习4大主流算法:PPO、Q-learning、DQN、A3C 50集入门到精通!
210:cyber 无人船优化反步控制 轨迹跟踪 强化学习Actor-critic架构,李雅普诺夫稳定性,优化反布控制,强化学习(RL),水面舰艇
【2024汽车年会】大数据和人工智能:从系统辨识到AI建模 从最优控制到强化学习
这才是小白该学的AI入门教程!上交大教授系统解读【机器学习】+【深度学习】+【强化学习】入门及实战,绝对通俗易懂!
MPC and RL【模型预测控制与强化学习】12 - Policy Gradient Methods
Diffusion Policy 结合 PPO 模仿+强化 (下)
这应该是你能找到的讲解最系统全面的【强化学习】教程!北大出身王树森教授从零到一保姆式教学,小白也能很好懂!
人工智能这样学!同济大佬三小时带你轻松掌握【强化学习】入门及实战,全程大白话讲解,主打一个通俗易懂!
动画讲解深度强化学习(RL、Q-网络、策略优化、大模型算法入门教程)
Lec9: 强化学习的概率论基础Review(世界是确定的,条件概率,条件期望,towering property)
我居然半天就学会了强化学习!华理计算机博士45集精讲,带你一次吃透PPO、Q-learning、DQN、A3C算法原理与实战
Lec8-1: Mujoco Tutorial- 仿真原理,核心模块,与机器人仿真器
MPC and RL【模型预测控制与强化学习】6 Monte Carlo RL, Temporal Difference and Q-Learning
强推!这可能是B站最系统的(Python+机器学习+深度学习)系列课程了,上海交大和腾讯联合出品!人工智能|神经网络|AI
Nonlinear Control_ Hamilton Jacobi Bellman (HJB) and Dynamic Programming
强化学习魅力时刻
CV强化论文分享20241025-01
强推!这绝对是B站最全的(python+机器学习+深度学习)系列教程,草履虫都能学会,学不会你来锤爆我!人工智能/机器学习/深度学习/python/神经网络
RLHF基于人类反馈的强化学习动画讲解(LLM)
【共享LLM前沿】直观理解大模型预训练和微调!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习微调,代码讲解
不愧是李宏毅老师讲的【强化学习】简直太详细了!全程干货,通俗易懂,看完就跑通!(人工智能|机器学习|深度学习|强化学习)