V
主页
Waabi最新!UnO:用于感知和预测的SOTA模型(超越监督方式)
发布人
Waabi最新!UnO:用于感知和预测的SOTA模型(超越监督方式),论文链接:https://arxiv.org/pdf/2406.08691。感知世界并预测其未来状态是自动驾驶的一项关键任务。监督方法利用带注释的目标标签来学习世界模型:传统上使用目标检测和轨迹预测,或时间鸟瞰图(BEV)占用字段。然而,这些注释成本高昂,通常仅限于一组预定义的类别,这些类别并不能涵盖我们在路上可能遇到的所有内容。相反,我们从激光雷达数据中学会了通过自监督来感知和预测连续的4D(时空)占用场。这种无监督的世界模型可以轻松有效地转移到下游任务中。我们通过添加轻量级学习渲染器来解决点云预测问题,并在Argoverse 2、nuScenes和KITTI中实现了最先进的性能。为了进一步展示其可转移性,我们对BEV语义占用预测模型进行了微调,并表明它优于完全监督的最新技术,尤其是在标记数据稀缺的情况下。最后,与先前最先进的时空几何占用预测相比,我们的4D世界模型实现了对与自动驾驶相关的类中对象的更高回忆。
打开封面
下载高清视频
观看高清视频
视频下载器
比赛冠军方案!英伟达最新 | Hydra MDP:端到端多模态规划
【地平线×自动驾驶之心】在线高精矢量化地图构建SOTA方案MapTR v1/v2、LaneGAP
自动驾驶规控工程师必备技能点!Coupling Trajectory Planning是个啥?
端到端模型上车了!GraphAD:国内首个可实车量产部署的端到端建模范式
CVPR2023 | 利用多样性3D感知数据!3DTrans解决当前感知任务局限性part1
毫米波雷达视觉算法CRAFT,这次彻底理解了!
大火的BEVFusion算法详解
闭环驾驶SOTA!CarLLaVA: CARLA自动驾驶挑战赛2.0第一名方案!
Nuscenes、KITTI等多个BEV开源数据集介绍!
英伟达最新 | OmniDrive:用于3D感知、推理和规划功能的自动驾驶大语言模型
冠军分享!QCNeXt:面向下一代多智能体联合轨迹预测新框架(CVPRW2023)
清华大学&英伟达 | DriveEnv-NeRF:基于NeRF实现高逼真自动驾驶场景,离线测试!
看到了这个视频,彻底搞懂了PETR算法!
高精地图制作关键技术及领域主流方案分享-part1
地平线最新!DynStatF:用于激光雷达点云 3D 目标检测的高效特征融合策略
相关2D和3D感知基础知识
分类突破!自动驾驶中的Occupancy感知方法分类
CUDA cuDNN TRT版本如何选择?基于TensorRT的CNN/Transformer/检测/BEV模型四大部署代码+CUDA加速!
港科大最新!Vista:高保真度、通用可控性的自动驾驶世界模型
LLM+自动驾驶还有什么搞头?LLM驱动的智能体应用探析!
为什么说规划控制仍然是端到端自动驾驶的核心?全面复盘规划控制基础及决策规划框架
多模态3D检测相关2D和3D感知基础知识
ICLR'24无图新思路!LaneSegNet:基于车道分段感知的地图学习(实时推理+三项SOTA)
量产基石!MapTR:在线高精地图经典开山之作
【ICCV 2023】 Robust Depth:多种天气条件下的自监督单目深度估计新SOTA
自动驾驶仿真框架CARLA教程(1):用Carla和Python编程自动驾驶汽车
自动驾驶仿真框架CARLA教程(6):Longer-term model results
毫米波雷达视觉到底是怎么融合的?CenterFusion你搞懂了吗?
超详细!BEV感知算法的应用介绍
国内首门自动驾驶轨迹预测课程讲了哪些内容?
Corner Case不可怕!自动驾驶Corner Case可控生成系统性解决方案来优化!
一文尽览:自动驾驶大语言模型应用综述分享
World Model!世界模型,迈向自主机器智能时代!城市场景下的世界模型算法—MILE
清华大学最新!GaussianFormer:Gaussians进军视觉Occupancy任务!
重磅开源!MARS:基于隐式场的场景感自动驾驶仿真
【CVPR 2024】刷爆榜单!SAFDNet:纯稀疏点云检测问鼎Waymo
搞懂了!原来激光雷达和相机的内外参是这样标定的
太详细了!多传感器融合的策略和方法
【ICCV 2023】RegFormer:点云配准新方案!
端到端趋势下,传统规控还有未来么?