Pyramid Diffusion：精细生成3D大场景，自动驾驶高质量数据来了

发布人

论文链接：https://arxiv.org/pdf/2311.12085
项目链接：https://yuheng.ink/project-page/pyramid-discrete-diffusion/
代码链接：https://github.com/yuhengliu02/pyramid-discrete-diffusion
扩散模型在生成2D图像和小规模3D物体方面表现出了显著的成果。然而，它们在大规模3D场景合成中的应用却很少被探索。这主要是由于3D场景数据，特别是户外场景数据，本身的复杂性和庞大体积，以及全面的真实世界数据集的有限性，使得训练一个稳定的场景扩散模型具有挑战性。在这项工作中，本文探索了如何使用由粗到细的范式来有效生成大规模3D场景。本文引入了一个框架，即Pyramid Discrete Diffusion模型（PDD），该模型采用不同尺度的扩散模型逐步生成高质量的户外场景。PDD的实验结果展示了本文在无条件和有条件生成3D场景方面的成功探索。由于其多尺度架构，本文进一步展示了PDD模型的数据兼容性：在一个数据集上训练的PDD模型可以很容易地通过另一个数据集进行微调。

打开封面下载高清视频观看高清视频视频下载器

Pyramid Diffusion：精细生成3D大场景，自动驾驶高质量数据来了

几可乱真！面向真实场景的世界模型居然被用得这么六！

自动驾驶缺少数据怎么办？ChatSim助你生成高度真实的驾驶数据！

透彻！特斯拉occupancy network详解

灵境OASim：仿真照进现实，生成更近一步

自动驾驶主流的数据集有哪些？详解Argoverse数据集！

毫米波雷达-视觉融合感知方法（前融合/特征级融合/数据级融合）

为什么说规划控制仍然是端到端自动驾驶的核心？全面复盘规划控制基础及决策规划框架

数据为王！车道线数据高效生成策略有哪些？

爽翻了！用ai一键生成小说投到平台成功签约单日稿费五六百！

自动驾驶多传感器数据融合（2）：IMU和GPS的融合定位

校招和社招转行人必看！2023年如何入局自动驾驶？

BFS是个啥？为什么规划控制需要它？

香港科技大学最新！MARC：自动驾驶的多极和风险意识应急计划

EM Planner is all u need？

端到端算法有哪些优势？完爆传统感知规控？

还在为数据集发愁？！带你了解自动驾驶常见数据集哪里找！

清华大学&英伟达 | DriveEnv-NeRF：基于NeRF实现高逼真自动驾驶场景，离线测试！

特斯拉的4D自动标注详解！为什么无标注数据work？

ICRA2023 | 激光雷达相机内外参联合标定方案！

浙江大学最新 | BEVPlace++：激光雷达全局定位方法，超越当前SOTA！泛化性能极佳

自动驾驶规控工程师必备技能点！Coupling Trajectory Planning是个啥？

一文尽览：自动驾驶大语言模型应用综述分享

逆天了！NeLF-Pro | 一个方法解决多种规模场景的快速渲染重建（CVPR'24）

轨迹预测真正重要的什么？又或者说实际落地的难点在哪里？

英伟达最新 | OmniDrive：用于3D感知、推理和规划功能的自动驾驶大语言模型

面向下一代自动驾驶：全栈里程碑综述汇总

面试必备！自动驾驶中BEV常考知识点大串讲

自动驾驶假数据效果逆天了！Panacea：如何生成全景可控BEV感知数据？

端到端自动驾驶：SparseDrive 算法详解

轨迹预测到底预测个啥？？？轨迹预测入门必备！

又快又准！一种基于图像表示的快速精确的LiDAR地面分割算法

【全100集】花2w买的SD教程！我付费，你白嫖，全程干货无废话！全网最详细的Stable Diffusion教程，存下吧，比盲目自学好多了！

自动驾驶的规划控制究竟在做什么？我们为什么需要规划控制

自动驾驶中的多传感器融合状态估计如何建模？

YOLOv7 + Strong Sort在高速场景视频上表现超赞

ICCV 2023 | NeO 360: 用于户外场景稀疏视图合成的神经场

CVPR 2023 | 协同感知在真实世界就不能打了？V2V4Real告诉你很能打！世界首款V2V协同感知数据集

地平线VAD又又又上新了！VADv2比v1强在哪里？一起来听

【ICRA 2023 | 首篇研究LiDAR基础设施部署的工作！作者亲自带你玩转传感器部署策略】第3节：车路协同场景激光雷达部署策略优化方法

从0到1！彻底搞懂BEVFormer算法原理