V
主页
京东 11.11 红包
意大利 IIT 讲座 —— 结合学习和模型预测控制的机器人安全控制
发布人
摘要 近年来,基于模型和数据驱动的先进控制方法正在释放复杂机器人系统的潜能,我们可以预见,在不久的将来,这一趋势将以指数级的速度继续发展。然而,如何确保这些先进控制方法的安全性仍然是一个挑战。使控制器(模型预测控制器或强化学习策略)安全的一个著名工具是所谓的控制不变集(又称安全集)。遗憾的是,对于非线性系统,这样的集合一般无法精确计算。计算近似控制不变集的数值算法是存在的,但如果控制不变集不精确,经典的理论控制方法就会失效。 在本演讲中,我将讨论我们最近为解决这一问题所做的努力。首先,我们设计了一种新型算法,用于计算机器人操纵器最大控制不变集的数值近似值。这种方法利用了全动多体系统动力学的某些特性,因此比其他最先进的方法更有效。 其次,我将介绍一种新颖的模型预测控制方案,它能在比传统方法更弱的假设条件下保证递归可行性和/或安全性。具体来说,保证递归可行性的方法是让安全集约束在水平线上向后移动,并假设安全集满足比控制不变性更弱的条件。而安全性则是通过对安全集的一个更弱的假设来保证的,只要检测到违反约束的风险,就会触发安全任务中止策略。我们在一个模拟机器人操纵器上对我们的方法进行了评估,经验表明,与最先进的方法相比,这种方法导致的违反约束条件的情况更少,同时在跟踪成本、完成任务数量和计算时间方面保持了良好的性能。
打开封面
下载高清视频
观看高清视频
视频下载器
【中英字幕】强化学习和模型预测控制18讲!四大名校教授精讲模型预测控制、最优控制、强化学习入门
MPC-VSG模型预测控制和虚拟同步机控制并网逆变器
这可能是我见过强化学习和模型预测控制最好的教程!四大名校教授精讲动态系统和仿真、最优控制、策略梯度方法、MPC
CoRL 讲座 —— 用于机器人的预训练模型
【人工智能基础】第49讲:DDPG-随机高斯策略-总结
斯坦福大学开源 - 机器人技能学习 通用操作接口 UMI (Universal Manipulation Interface) Demo
「精校熟肉」欠驱动机器人学(MIT 6.8210) 2023春-L2-非线性动力学
UCSD 机器人讲座 —— 人形机器人的关键技术 + 基于模型 VS 学习的控制
如何直观理解PPO算法?博士详解近端策略优化算法原理+公式推导+训练实例!强化学习、深度强化学习、李宏毅
[复现]基于MPC模型预测控制水下机器人AUV路径规划及轨迹跟踪仿真
CoRL 讲座 Scott Kuindersma - 基于模型的控制有助于学习
CoRL 讲座 —— 用于模仿学习的人在回路(HITL)任务和运动规划(TAMP)
DIY杂耍机器人,很高兴终于实现了
四足机器人足臂协同 ocs2 qm_control 开源项目学习
慕尼黑工大机器人研究 —— 人工神经假肢控制系统
【李宏毅】强化学习课程完整版千万不要错过!简单明了的PPO算法讲解!深度强化学习、人工智能、机器学习、大模型
【强推】李宏毅深度强化学习完整版教程!简单易懂的PPO算法强化学习入门课程!近端策略优化、Transformer
【论文代码复现122】基于强化学习的路径规划问题||强化学习和群智能优化算法有什么区别
CoRL 讲座 —— 可泛化几何机器人学习
CMU 最优控制 2024 第 7 讲 线性二次调节器的三种方法
实时最优控制讲座 —— 从航空航天的角度
【大模型+强化学习】怎么理解大模型训练中的RLHF(人类反馈强化学习)?ChatGPT背后的数学原理
CoRL 讲座 - 基于仿真学习的具身智能
【中英字幕】 10月2日,OpenAI的Noam Brown及其团队谈论了o1以及如何教大语言模型更好地推理|红杉|深度强化学习|2024.10.02
为什么使用 C++ 编写机器人程序?
斯坦福大学 Khatib 讲座 —— 深海机器人探索
斯坦福机器人讲座 —— 推动机器人技术在现实世界中的应用
宾大机器人讲座 —— 多接触操作中的学习与控制
论文复现:MPC-D-CBF (基于动态屏障函数的移动机器人balabala的模型预测控制)
CMU 最优控制 2024 助教补充 第6讲 轨迹优化
西北大学机器人讲座 —— 机器人学习的控制原理
终章,暂告一段
CMU 最优控制 2024 助教补充 第 1 讲 ODE 与线性化
《强化学习》第6章 TD时序差分算法
CoRL 讲座 - 从演示到自主操作的机器人操作数据
CoRL —— 开幕词
USC 2024 机器人基础 第 17 讲 基于采样的运动规划 I
「精校熟肉」欠驱动机器人学(MIT 6.8210) 2024春-L1-机器人动力学与基于模型的控制
MATLAB - 模型预测控制(Model Predictive Control)
CMU 最优控制 2024 第 18 讲 随机最优控制和 LQG