V
主页
大量减少GPU内存需求,从2D图像生成完整3D体素语义!纽约大学&英伟达等开源, CVPR2023!
发布人
我们提出了VoxFormer,这是一个基于Transformer的语义场景补全框架,可以从2D图像中输出完整的三维体素语义。我们的框架采用了一个两阶段设计:首先,我们从深度估计中获得一组稀疏的可见和占用体素查询,然后进行致密化阶段,从稀疏体素生成稠密的3D体素。这个设计的一个关键思想是,2D图像上的视觉特征仅对应于可见的场景结构,而不是被遮挡或空白的空间。因此,从可见结构的特征化和预测开始更加可靠。一旦我们获取了稀疏查询集合,我们采用掩码自编码器设计,通过自注意力将信息传播到所有体素。 论文地址:https://arxiv.org/abs/2302.12251 代码地址:https://github.com/NVlabs/VoxFormer
打开封面
下载高清视频
观看高清视频
视频下载器
法国团队最新开源!3D高斯溅射可以生成三维网格啦!
【开源】CVPR 2022|帅哥变美女,二哈变萌宠?南洋理工新发布无监督图像迁移,纵享丝滑!
港中大最新开源|2D秒变3D,基于2D场景风格化的光线配准!CVPR2023
【黄仁勋】展示英伟达全套“军火”:Blackwell只是前菜,电气机械奇迹NVLink压轴!
【开源】一键擦除图片中的对象!可试玩!三星提出新的图像修复网络
两分钟内教会你删除NVIDIA app并重新安装GeForce Experience
最新开源|支持惯性、激光雷达、双目和RGB-D传感器的系统!
【即将开源】换头技术,它又双叒叕来了!比比哪家强?华南理工&百度最新研究HeSer实现动态换头!CVPR2022
三维感知图像生成丨清华&微软&中科大提出GRAM方法
StreamingT2V 最长2分钟视频生成,开源了!
用文字、涂鸦等生成图片!英伟达提出PoE-GAN方法
强!秒变高清,视频纹理去除!港大等新开源,CVPR2022
VR、外骨骼、脑机接口的完美结合丨虚拟现实中用于运动图像脑-机接口的手外骨骼
无需额外数据,输入文本即可合成高清一致的图像!首尔大学,即将开源!
武汉大学开源! 集成惯性系统的统一无标定板时空标定
显卡日报9月1日|AMD RX8600系列参数曝光
华科、华为联合开源!实时动态场景4D高斯泼溅,最高 82fps!
1.2 如何快速学习开源代码?
超有用!三维重建让起重机实现无人装卸!佐治亚理工!
[科技周报] 用代码设计复杂架构图;serverless 结合 AI 生成代码;纸张的未来已来
黑神话悟空更新后卡顿掉帧?一分钟解决着色器编译
基于SVD首尾帧进行关键帧插值,进行视频生成
显卡日报8月24日|摩尔线程内测版驱动可稳定运行黑神话悟空
ICRA2022|浙大&商汤等发布紧耦合RGB-D视觉惯性VIP-SLAM,速度快2倍!
【黄仁勋】我俩小孩一个想当厨师,一个想搞艺术,我花了十年时间说服他们来英伟达上班
手把手教你学习标定基础知识
牛津大学|这个IMU+四个相机的视觉惯性里程计真不错!漂移率降低80%、相对位姿误差降低39%!
【硬核解析】从GPGPU到CUDA,看完秒懂GPU为何主宰AI !(GPU渲染管线工作原理大揭秘)!!
中科大新发布|轻量级神经路径规划,高效、低成本的机器人导航方法!
ControlNeXt: 参数量减少90%,却比ControlNet更强大且高效的AI生成控制工具
奥运戒断中?看纽约大学篮球队热力对阵上海高校
索尼下狠手 《星鸣特攻》已从玩家账户中被彻底删除
CVPR2022|亚马逊和UB即将开源EfficientVIS:端到端高效视频实例分割,无需任何数据关联!训练时间减少了15倍!
绝望式暴跌60%+,半导体迎来最惨烈崩盘!
GitHub Copliot 实用技巧分享,这样写代码真的能快很多!|录屏精简版
【最新开源】ECCV 2022|基于事件的光流估计,无监督法排名第一!庆应大学&柏林工大新研究
中国芯崛起,性能将处于世界领先行列
学术大佬答疑解惑!关于语义激光SLAM,说不定有你想知道的!
北航小姐姐带你精读SLAM综述论文
浙大&西交大等开源|使用贝叶斯核推理和优化的机器人自主探索!