V
主页
京东 11.11 红包
超越BEVFusion!DifFUSER:扩散模型杀入自动驾驶多任务(BEV分割+检测双SOTA)
发布人
超越BEVFusion!来自澳大利亚莫纳什大学IT信息技术学院的研究团队推出了Dif FUSER,这是一种利用扩散模型在3D对象检测和BEV地图分割中进行多模态融合的新颖方法,使得扩散模型杀入自动驾驶多任务。该团队对Nuscenes数据集的广泛评估表明,Dif FUSER不仅在BEV地图分割任务中实现了最先进的性能,而且还可以在3D对象检测中,与领先的基于Transformer的融合技术进行有效竞争。 标题:DifFUSER: Diffusion Model for Robust Multi-Sensor Fusion in 3D Object Detection and BEV Segmentation 链接:https://arxiv.org/abs/2404.04629v1
打开封面
下载高清视频
观看高清视频
视频下载器
超越BEVFusion!GraphBEV:解决多模态特征不对齐和噪声问题,助力量产
CVPR2024 | 利用任务分解改进BEV分割任务!
ECCV'24 最新Oral已开源 ! | 用于 3D大场景生成的金字塔扩散模型,实现无限场景生成与高效数据迁移
ECCV'24 oral | DVLO,首个基于深度聚类的多模态融合,双向结构对齐的融合网络新SOTA
ECCV'24 | "突破传统",通过直接BEV特征注意力加速在线建图和行为预测
HybriMap:结合PV和BEV特征的高清地图构建技术,实现nuScenes数据集性能提升4%
CVPR 2024 | LiDAR Diffusion 首个可以根据多模态条件生成逼真 的激光雷达场景方法,加速107倍
ECCV'24 | Gaussian Grouping解决3DGS的对象级场景理解问题,实现3D场景任意分割和编辑
ECCV'2024 北航、极氪领衔 | FSD-BEV:大幅度提升基于视觉的3D目标检测算法性能,实现感知新SOTA!
ECCV'24 | 无图定位新突破!从低精地图到使用全景-BEV联合检索网络进行跨视图图像地理定位。
SA-GS:在3D高斯抛雪球中实现SAM任意物体分割,无需任何训练过程和学习参数,通过交互式过程实现3D高斯抛雪球物体分割
【李宏毅】2024年公认最好的扩散模型【Diffusion Model】教程!全程干货,通俗易懂,看完就跑通!-附带课件
扩散模型+医学|中科院推出残差去噪扩散模型(RDDM),磁共振扩散成像(MRI)去噪扩散模型
华为诺亚发布!MagicDrive3D适用于街景中的任意视图渲染的可控制的3D生成技术
ICRA 2024 | 探索基于语义地图 的自动驾驶汽车单目定位技术
国内智驾老兵百度开源BEVWorld:通过统一BEV潜在空间实现自动驾驶的多模态世界模型
【AI知识分享】扩散模型入门学习看这一个系列的视频就够了!EDM论文讲解之扩散模型通用框架超详细解读第六回:通用随机微分方程,如懂可不行,要真懂!
重新定义自动驾驶的动态视觉?谷歌提出几何优先的动态场景方法MonST3R
多伦多大学等发布!面向LiDAR点云的无监督目标检测
【李宏毅】2024年公认最好的扩散模型【Diffusion Model】教程!!!从入门到进阶,一套全解决!-附带课件!!!
浙大、上海人工智能实验室等即将开源PGSR: 平面3DGS提升表面几何,超越 2DGS、GOF,实现渲染新高度
Dimba模型:融合Transformer与Mamba技术,灵活地平衡吞吐量和内存需求,并生成更高质量的图像
闭环 SOTA | 首个基于MLLM的自动驾驶规划系统,性能高,Token少!
CVPR'24 | NeRF新突破,启发式引导分割解决瞬态干扰
基于三维点云场景的语义及实例分割
自动驾驶规划控制概况
极速高效的生成4K图像的文生图模型Sana,强于超大型扩散模型,可在16GB笔记本上部署
全面评估BEV感知算法: RoboBEV基准测试与 鲁棒性增强策略探索,
深蓝自动驾驶套件测试Apollo 6.0
清华叉院、理想提出DriveVLM,视觉大语言模型与自动驾驶融合,以提升自动驾驶能力
CVPR'24 满分Oral | EscherNet 实现任意视角灵活扩散生成 解锁3D视觉无限可能!
YOLO版本再升级 !YOLOv10:优化架构与无NMS训练提升实时目标检测效率
ACM SIGGRAPH Asia 2024 | RobotMDM:机器人运动扩散模型:机器人角色的运动生成
视觉SLAMVIO开源代码解析-DSO
一个视频浅谈EDM到底对扩散模型做了哪些优化
CenterNet+ deepsort多目标跟踪!提高检测精度和速度!
超越所有SOTA!3DGS结合NeRF到4DGF 重塑动态城市场景新视图合成
一窥大神们与中国智驾的这些年,入局智能驾驶汽车领域的12大企业的技术灵魂人物#端到端#人工智能#自动驾驶#智能驾驶#BEV感知#车载
3D Gaussian Splatting在自动驾驶中的应用——建模动态城市场景
告别3DGS算法,开源SUNDAE,实现内存效率与图像质量的双赢