V
主页
Pyramid Diffusion:精细生成3D大场景,自动驾驶高质量数据来了
发布人
论文链接:https://arxiv.org/pdf/2311.12085 项目链接:https://yuheng.ink/project-page/pyramid-discrete-diffusion/ 代码链接:https://github.com/yuhengliu02/pyramid-discrete-diffusion 扩散模型在生成2D图像和小规模3D物体方面表现出了显著的成果。然而,它们在大规模3D场景合成中的应用却很少被探索。这主要是由于3D场景数据,特别是户外场景数据,本身的复杂性和庞大体积,以及全面的真实世界数据集的有限性,使得训练一个稳定的场景扩散模型具有挑战性。在这项工作中,本文探索了如何使用由粗到细的范式来有效生成大规模3D场景。本文引入了一个框架,即Pyramid Discrete Diffusion模型(PDD),该模型采用不同尺度的扩散模型逐步生成高质量的户外场景。PDD的实验结果展示了本文在无条件和有条件生成3D场景方面的成功探索。由于其多尺度架构,本文进一步展示了PDD模型的数据兼容性:在一个数据集上训练的PDD模型可以很容易地通过另一个数据集进行微调。
打开封面
下载高清视频
观看高清视频
视频下载器
特斯拉的World Model是什么?怎么做端到端训练?
端到端算法是什么?自动驾驶领域是怎么做的?
端到端模型上车了!GraphAD:国内首个可实车量产部署的端到端建模范式
端到端数据格式是什么样的?快来看看吧
Tesla FSD 12.5出门炸街了!压力测试表现如何?
大火的BEVFusion算法详解
端到端基础!绕不开的感知模块
EM Planner is all u need?
浙江大学最新 | BEVPlace++:激光雷达全局定位方法,超越当前SOTA!泛化性能极佳
fast_planner实车测试
端到端自动驾驶:SparseDrive 算法详解
端到端算法有哪些优势?完爆传统感知规控?
自动驾驶假数据效果逆天了!Panacea:如何生成全景可控BEV感知数据?
自动驾驶汽车是如何在高精地图中建立精确位置的?
自动驾驶面试一百问!秋招社招全搞定
数据为王!自动驾驶开源数据体系现状与未来
多障碍物联合预测!理论全搞定~
UZH最新博士论文!事件摄像机的数据驱动方法
重磅开源!MARS:基于隐式场的场景感自动驾驶仿真
ICRA2023 | 激光雷达相机内外参联合标定方案!
在线高精地图与城市NOA是什么关系?为什么如此重要?
自动驾驶如何学好C++?
数据为王!车道线数据高效生成策略有哪些?
端到端趋势下,传统规控还有未来么?
轨迹预测到底预测个啥???轨迹预测入门必备!
特斯拉的4D自动标注详解!为什么无标注数据work?
登顶Nature!带事件摄像机的低延迟自动驾驶视觉新方案!
【CVPR 2024】鉴智机器人算法大佬揭秘3D场景流估计的最新工作——3DSFlabelling
CVPR 2023 面向自动驾驶场景的纯视觉三维语义占有预测
为什么说规划控制仍然是端到端自动驾驶的核心?全面复盘规划控制基础及决策规划框架
透彻!特斯拉occupancy network详解
超逼真的数据!实时高质量渲染,用于动态城市场景建模的Street Gaussians
自动驾驶规控工程师必备技能点!Coupling Trajectory Planning是个啥?
VastGaussian:首个基于3D Gaussian Splatting的大场景高质量重建和实时渲染方法
分类突破!自动驾驶中的Occupancy感知方法分类
端到端基础!从原始传感器数据到控制策略
毫米波雷达视觉算法CRAFT,这次彻底理解了!
面向下一代自动驾驶:全栈里程碑综述汇总
比赛冠军方案!英伟达最新 | Hydra MDP:端到端多模态规划
落地之殇 | 联合预测是端到端正确的道路么?