TPVFormer：特斯拉occupany network的学术替代方案！清华大学工作

发布人

论文链接：https://arxiv.org/pdf/2302.07817
以视觉为中心的现代自动驾驶感知方法广泛采用鸟瞰图(BEV)来描述3D场景。尽管它比体素表示效率更高，但是在描述一个单一平面的场景的细粒度3D结构方面存在困难。为了解决这个问题，作者提出了一种三透视视图(TPV)表示方法，它伴随着 BEV 和两个额外的垂直平面。通过总结三个平面上的投影特征来模拟3D空间中的每个点。将图像特征提升到3D TPV 空间，进一步提出了一种基于transformer的 TPV 编码器，有效地获取了 TPV 特征。使用注意机制来聚合每个 TPV 平面上对应于每个查询的图像特征。实验表明，稀疏监督训练后的模型能够有效地预测所有体素的语义占有率。首次在 nuScenes 上演示了在 LiDAR 分割任务中，仅使用相机输入就可以获得与基于 LiDAR 的方法相当的性能。

打开封面下载高清视频观看高清视频视频下载器

TPVFormer：特斯拉occupany network的学术替代方案！清华大学工作

特斯拉的World Model是什么？怎么做端到端训练？

端到端算法是什么？自动驾驶领域是怎么做的？

LeTS-Drive：自动驾驶中不确定场景下的实时路径规划算法

清华大学&英伟达 | DriveEnv-NeRF：基于NeRF实现高逼真自动驾驶场景，离线测试！

ICRA2023 | 激光雷达相机内外参联合标定方案！

UC伯克利最新！S3Gaussian：全球首个开源的自动驾驶场景3D GS工作

最新！如何使用深度强化学习在未知环境中进行导航？

什么是端到端自动驾驶？什么是基础world model？

Depth Anything V2 | 速度提升10倍以上！更稳健、精细的单目深度估计（HKU&TikTok）

以特斯拉为案例：自动驾驶仿真框架分析（下，仿真应用/2D检测/3D检测/车道线）

来听大牛说！赵行老师在CVPR 2023年自动驾驶研讨会上发表的演讲

从0到1！彻底搞懂BEVFormer算法原理

毫米波雷达视觉算法CRAFT，这次彻底理解了！

自动驾驶中的多传感器融合都有哪些方法？基本流程都是什么？

CVPR2023 Nuplan自动驾驶轨迹规划比赛第二名方案详解

视觉3D检测如何做自动标注？

在线高精地图与城市NOA是什么关系？为什么如此重要？

校招和社招转行人必看！2023年如何入局自动驾驶？

英伟达冠军方案！Hydra-MDP：多模态端到端自动驾驶详解

闭环驾驶SOTA！CarLLaVA: CARLA自动驾驶挑战赛2.0第一名方案！

实时3D激光SLAM | 基于广义ICP和位姿图优化的实时无里程计方案（超赞！）

【地平线×自动驾驶之心】ICCV 2023最新中稿的端到端自动驾驶框架—VAD！

【地平线×自动驾驶之心】在线高精矢量化地图构建SOTA方案MapTR v1/v2、LaneGAP

端到端数据格式是什么样的？快来看看吧

IROS2022 | 毫米波雷达和相机融合在高分辨率和远距离深度成像中的探索

端到端趋势下，传统规控还有未来么？

毫米波雷达视觉到底是怎么融合的？CenterFusion你搞懂了吗？

如何转行自动驾驶算法？后端开发转行到自动驾驶算法工程师

看到了这个视频，彻底搞懂了PETR算法！

自动驾驶中的多传感器融合状态估计如何建模？

ETH最新！CVPR2024 | GoMVS：多视图几何重建新SOTA

ICLR 2023 ｜VA-DepthNet：单目图像深度预测的变分方法

还在为数据集发愁？！带你了解自动驾驶常见数据集哪里找！

【ECCV 2022】显著减少自动驾驶碰撞率！可微分光线投射应用于自监督占位预测

如何从零搭建自己的自动驾驶C++功能模块？

冠军分享！QCNeXt：面向下一代多智能体联合轨迹预测新框架（CVPRW2023）

大纲一览 | 规划控制算法都在这里了！PNC今年的香饽饽！近10种规控算法与代码实现你都知道吗？

重磅开源！MARS：基于隐式场的场景感自动驾驶仿真

自动驾驶规控工程师必备技能点！Coupling Trajectory Planning是个啥？

基于交互感知的自动驾驶车辆轨迹规划——神经网络与模型预估计控制的集成