大量减少GPU内存需求，从2D图像生成完整3D体素语义！纽约大学&英伟达等开源， CVPR2023！ - 视频下载 Video Downloader

大量减少GPU内存需求，从2D图像生成完整3D体素语义！纽约大学&英伟达等开源， CVPR2023！

发布人

我们提出了VoxFormer，这是一个基于Transformer的语义场景补全框架，可以从2D图像中输出完整的三维体素语义。我们的框架采用了一个两阶段设计：首先，我们从深度估计中获得一组稀疏的可见和占用体素查询，然后进行致密化阶段，从稀疏体素生成稠密的3D体素。这个设计的一个关键思想是，2D图像上的视觉特征仅对应于可见的场景结构，而不是被遮挡或空白的空间。因此，从可见结构的特征化和预测开始更加可靠。一旦我们获取了稀疏查询集合，我们采用掩码自编码器设计，通过自注意力将信息传播到所有体素。
论文地址：https://arxiv.org/abs/2302.12251
代码地址：https://github.com/NVlabs/VoxFormer

打开封面下载高清视频观看高清视频视频下载器

法国团队最新开源！3D高斯溅射可以生成三维网格啦！

【开源】CVPR 2022|帅哥变美女,二哈变萌宠？南洋理工新发布无监督图像迁移，纵享丝滑！

港中大最新开源|2D秒变3D，基于2D场景风格化的光线配准！CVPR2023

【黄仁勋】展示英伟达全套“军火”：Blackwell只是前菜，电气机械奇迹NVLink压轴！

【开源】一键擦除图片中的对象！可试玩！三星提出新的图像修复网络

两分钟内教会你删除NVIDIA app并重新安装GeForce Experience

最新开源|支持惯性、激光雷达、双目和RGB-D传感器的系统！

【即将开源】换头技术，它又双叒叕来了！比比哪家强？华南理工&百度最新研究HeSer实现动态换头！CVPR2022

三维感知图像生成丨清华&微软&中科大提出GRAM方法

StreamingT2V 最长2分钟视频生成，开源了！

用文字、涂鸦等生成图片！英伟达提出PoE-GAN方法

强！秒变高清，视频纹理去除！港大等新开源，CVPR2022

VR、外骨骼、脑机接口的完美结合丨虚拟现实中用于运动图像脑-机接口的手外骨骼

无需额外数据，输入文本即可合成高清一致的图像！首尔大学，即将开源！

武汉大学开源！集成惯性系统的统一无标定板时空标定

显卡日报9月1日｜AMD RX8600系列参数曝光

华科、华为联合开源！实时动态场景4D高斯泼溅，最高 82fps！

1.2 如何快速学习开源代码？

超有用！三维重建让起重机实现无人装卸！佐治亚理工！

[科技周报] 用代码设计复杂架构图；serverless 结合 AI 生成代码；纸张的未来已来

黑神话悟空更新后卡顿掉帧？一分钟解决着色器编译

基于SVD首尾帧进行关键帧插值，进行视频生成

显卡日报8月24日｜摩尔线程内测版驱动可稳定运行黑神话悟空

ICRA2022|浙大&商汤等发布紧耦合RGB-D视觉惯性VIP-SLAM，速度快2倍！

【黄仁勋】我俩小孩一个想当厨师，一个想搞艺术，我花了十年时间说服他们来英伟达上班

手把手教你学习标定基础知识

牛津大学|这个IMU+四个相机的视觉惯性里程计真不错！漂移率降低80%、相对位姿误差降低39%！

【硬核解析】从GPGPU到CUDA，看完秒懂GPU为何主宰AI ！（GPU渲染管线工作原理大揭秘）！！

中科大新发布|轻量级神经路径规划，高效、低成本的机器人导航方法！

ControlNeXt: 参数量减少90%，却比ControlNet更强大且高效的AI生成控制工具

奥运戒断中？看纽约大学篮球队热力对阵上海高校

索尼下狠手《星鸣特攻》已从玩家账户中被彻底删除

CVPR2022|亚马逊和UB即将开源EfficientVIS：端到端高效视频实例分割，无需任何数据关联！训练时间减少了15倍！

绝望式暴跌60%+，半导体迎来最惨烈崩盘！

GitHub Copliot 实用技巧分享，这样写代码真的能快很多！｜录屏精简版

【最新开源】ECCV 2022|基于事件的光流估计，无监督法排名第一！庆应大学&柏林工大新研究

中国芯崛起，性能将处于世界领先行列

学术大佬答疑解惑！关于语义激光SLAM，说不定有你想知道的！

北航小姐姐带你精读SLAM综述论文

浙大&西交大等开源|使用贝叶斯核推理和优化的机器人自主探索！