V
主页
Pyramid Diffusion:精细生成3D大场景,自动驾驶高质量数据来了
发布人
论文链接:https://arxiv.org/pdf/2311.12085 项目链接:https://yuheng.ink/project-page/pyramid-discrete-diffusion/ 代码链接:https://github.com/yuhengliu02/pyramid-discrete-diffusion 扩散模型在生成2D图像和小规模3D物体方面表现出了显著的成果。然而,它们在大规模3D场景合成中的应用却很少被探索。这主要是由于3D场景数据,特别是户外场景数据,本身的复杂性和庞大体积,以及全面的真实世界数据集的有限性,使得训练一个稳定的场景扩散模型具有挑战性。在这项工作中,本文探索了如何使用由粗到细的范式来有效生成大规模3D场景。本文引入了一个框架,即Pyramid Discrete Diffusion模型(PDD),该模型采用不同尺度的扩散模型逐步生成高质量的户外场景。PDD的实验结果展示了本文在无条件和有条件生成3D场景方面的成功探索。由于其多尺度架构,本文进一步展示了PDD模型的数据兼容性:在一个数据集上训练的PDD模型可以很容易地通过另一个数据集进行微调。
打开封面
下载高清视频
观看高清视频
视频下载器
几可乱真!面向真实场景的世界模型居然被用得这么六!
自动驾驶缺少数据怎么办?ChatSim助你生成高度真实的驾驶数据!
透彻!特斯拉occupancy network详解
灵境OASim:仿真照进现实,生成更近一步
自动驾驶主流的数据集有哪些?详解Argoverse数据集!
毫米波雷达-视觉融合感知方法(前融合/特征级融合/数据级融合)
为什么说规划控制仍然是端到端自动驾驶的核心?全面复盘规划控制基础及决策规划框架
数据为王!车道线数据高效生成策略有哪些?
爽翻了!用ai一键生成小说投到平台成功签约单日稿费五六百!
自动驾驶多传感器数据融合(2):IMU和GPS的融合定位
校招和社招转行人必看!2023年如何入局自动驾驶?
BFS是个啥?为什么规划控制需要它?
香港科技大学最新!MARC:自动驾驶的多极和风险意识应急计划
EM Planner is all u need?
端到端算法有哪些优势?完爆传统感知规控?
还在为数据集发愁?!带你了解自动驾驶常见数据集哪里找!
清华大学&英伟达 | DriveEnv-NeRF:基于NeRF实现高逼真自动驾驶场景,离线测试!
特斯拉的4D自动标注详解!为什么无标注数据work?
ICRA2023 | 激光雷达相机内外参联合标定方案!
浙江大学最新 | BEVPlace++:激光雷达全局定位方法,超越当前SOTA!泛化性能极佳
自动驾驶规控工程师必备技能点!Coupling Trajectory Planning是个啥?
一文尽览:自动驾驶大语言模型应用综述分享
逆天了!NeLF-Pro | 一个方法解决多种规模场景的快速渲染重建(CVPR'24)
轨迹预测真正重要的什么?又或者说实际落地的难点在哪里?
英伟达最新 | OmniDrive:用于3D感知、推理和规划功能的自动驾驶大语言模型
面向下一代自动驾驶:全栈里程碑综述汇总
面试必备!自动驾驶中BEV常考知识点大串讲
自动驾驶假数据效果逆天了!Panacea:如何生成全景可控BEV感知数据?
端到端自动驾驶:SparseDrive 算法详解
轨迹预测到底预测个啥???轨迹预测入门必备!
又快又准!一种基于图像表示的快速精确的LiDAR地面分割算法
【全100集】花2w买的SD教程!我付费,你白嫖,全程干货无废话!全网最详细的Stable Diffusion教程,存下吧,比盲目自学好多了!
自动驾驶的规划控制究竟在做什么?我们为什么需要规划控制
自动驾驶中的多传感器融合状态估计如何建模?
YOLOv7 + Strong Sort在高速场景视频上表现超赞
ICCV 2023 | NeO 360: 用于户外场景稀疏视图合成的神经场
CVPR 2023 | 协同感知在真实世界就不能打了?V2V4Real告诉你很能打!世界首款V2V协同感知数据集
地平线VAD又又又上新了!VADv2比v1强在哪里?一起来听
【ICRA 2023 | 首篇研究LiDAR基础设施部署的工作!作者亲自带你玩转传感器部署策略】第3节:车路协同场景激光雷达部署策略优化方法
从0到1!彻底搞懂BEVFormer算法原理