V
主页
IROS 2024 | NAVINACT:结合导航和模仿学习进行增强强化学习
发布人
论文链接:https://arxiv.org/abs/2408.04054 强化学习(RL)在仿真环境中取得了显著进展,但由于探索和泛化方面的挑战,它在现实世界机器人任务中的应用仍然有限。为了解决这些问题,我们引入了NAVINACT,这是一个框架,可以选择机器人何时应该使用基于经典运动规划的导航,何时应该学习策略。为了进一步提高探索效率,我们使用模拟数据来引导探索。NAVINACT在两种操作模式之间动态切换:当远离物体时,使用经典技术导航到航路点;当即将与物体交互时,使用强化学习进行细粒度操纵控制。NAVINACT由一个多头架构组成,该架构由用于模式分类的ModeNet、用于航路点预测的NavNet和用于精确操纵的InteractionNet组成。通过结合RL和模仿学习(IL)的优势,NAVINACT提高了样本效率,减轻了分布偏移,确保了任务的稳健执行。我们在多个具有挑战性的模拟环境和现实世界任务中评估我们的方法,与现有方法相比,在适应性、效率和泛化方面表现出卓越的性能。在模拟和现实环境中,NAVINACT都表现出了强大的性能。在模拟中,NAVINACT在30000个样本的训练成功率方面比基线方法高出10-15%,在评估阶段高出30-40%。在实际场景中,与基线相比,它在更简单的任务上的成功率高出30-40%,并且在复杂的两阶段操作任务中取得了独特的成功。
打开封面
下载高清视频
观看高清视频
视频下载器
性能提升近40%!ViPlanner:室内外局部导航全搞定(ICRA 2024)
【CoRL2022】路径规划新SOTA!PlanT:通过目标级表示的可解释的规划Transformers
牛津大学最新!室内室外SOTA | 用于视觉重定位的地图相对姿态回归(CVPR'24 HighLight)
具身智能Astribot S1?下一代人工智能机器人~AI赋能万物!
登顶Nature!带事件摄像机的低延迟自动驾驶视觉新方案!
ETH最新!CVPR2024 | GoMVS:多视图几何重建新SOTA
太亮眼!CVPR 2024 自动驾驶方向中稿论文POSTER大全!
又快又准!一种基于图像表示的快速精确的LiDAR地面分割算法
SuperFusion:高精地图新基线
决策规划都有哪些框架?PNC今年的香饽饽!近10种规控算法与代码实现你都知道吗?
端到端基础!绕不开的感知模块
上交&诺亚最新 | 大幅提升!OccGen:面向自动驾驶的生成式多模态3D占用预测
EM Planner is all u need?
牛津大学IROS2023最新!激光雷达相机外参标定新算法(大幅降低误差)
英伟达提出EmerNeRF:大规模动态自动驾驶场景重建
最近有哪些自动驾驶方向的github仓库值得star?
计算效率提升20% | 直接LiDAR-惯性里程计:具有连续时间运动校正的轻量级LiDAR-惯性里程计
点云地图中的重定位
ICCV 2023 | NeO 360: 用于户外场景稀疏视图合成的神经场
看看顶级大佬如何梳理L2++决策算法的演进-上
【IROS2022】Voxfield:用于在线规划和三维重建的非投影符号距离场
上海AI Lab最新!Depth any Video:提升深度估计的一致性以及合成更多真实带有标注的数据
为什么说自动驾驶离不开模型量化?
端到端趋势下,传统规控还有未来么?
ICCV 2023 | CLNeRF:持续学习遇到NeRF
将SLAM推向全天候环境!CVPR'24:SubT-MRS Dataset
自动驾驶汽车是如何在高精地图中建立精确位置的?
自动驾驶缺少数据怎么办?ChatSim助你生成高度真实的驾驶数据!
太强了!RenderOcc:仅使用2D标签和Nerf监督视觉Occupancy
自动驾驶多传感器数据融合(2):IMU和GPS的融合定位
世界模型!特斯拉CVPR2023 Workshop!
面试必备!自动驾驶中BEV常考知识点大串讲
你敢信,自动驾驶最大的隐患不是路况,而是人为干预!
MonoPLFlowNet:用于单目图像的现实尺度 3D 场景流估计(ECCV2022)
清华大学&英伟达 | DriveEnv-NeRF:基于NeRF实现高逼真自动驾驶场景,离线测试!
轨迹规划新方案!基于差分平坦度的自动驾驶车辆轨迹规划
速度提高60倍!重建你的自动驾驶场景 | GaussianCity:无边界三维城市场景重建(南洋理工大学)
看到了这个视频,彻底搞懂了PETR算法!
聊一聊4D成像雷达在辅助驾驶领域的应用
南洋理工大学博士分享!规模化可学习与交互式的自动驾驶决策系统如何构建?