速度提升10倍以上！Depth Anything V2更稳健、精细的单目深度估计

发布人

速度提升10倍以上！Depth Anything V2：更稳健、精细的单目深度估计（HKU&amp;TikTok）#人工智能 #计算机 #科技 #算法 #自动驾驶 #深度估计 #顶会论文 

在微信公众号「3DCV」回复：「原论文」,获取论文代码和链接，赶快学起来! 

本文介绍了Depth Anything V2。不追求花哨的技术，而是旨在揭示关键发现，为构建强大的单目深度估计模型铺平道路。值得注意的是，与V1相比，本版本通过三项关键实践产生了更精细、更稳健的深度预测：1) 将所有带标签的真实图像替换为合成图像；2) 扩大教师模型的容量；3) 通过大规模伪标签真实图像的桥梁来教授学生模型。与基于Stable Diffusion的最新模型相比，我们的模型在效率（速度快10倍以上）和准确性上都显著提高。我们提供了不同规模（参数范围从25M到1.3B）的模型，以支持广泛的场景。得益于它们强大的泛化能力，我们使用度量深度标签对其进行微调，以获得我们的度量深度模型。除了我们的模型外，考虑到当前测试集的有限多样性和频繁噪声，我们还构建了一个具有精确注释和多样化场景的多功能评估基准，以促进未来的研究。

打开封面下载高清视频观看高清视频视频下载器

速度提升10倍以上！Depth Anything V2更稳健、精细的单目深度估计

Depth Anything!最强开源单目深度估计SOTA！

ECCV'24开源 | 又快又好！6DGS重新定义6D物体位姿估计！

[3DGS进展] ETH等DepthSplat证明3DGS与深度估计任务是可相互促进提升的，并在多个数据集上同时取得深度估计和NVS任务的SOTA

3DGS进化，高效高质量的GaussianPro来袭！

极快跟踪一切！DOT：无惧遮挡！

【全368集】清华大佬终于把Python做成了动画片！2024最新版，草履虫都能学会的Python零基础入门教程！拿走不谢，学不会我退出IT圈！

三维重建大一统！LSM：无需先验位姿，首次实现实时语义3D重建！

【MATLAB速成】这可能是全网最适合初学者入门的MATLAB教程了！花3小时就能从入门到精通，草履虫都能听懂！

无需 GPS：语义地图引领多机器人室内外探索

14岁少年自杀，责任是否在人工智能，明星AI公司面临诉讼

【全289集】这才是科研人该学的，目标检测六大算法R-CNN、Fast R-CNN、YOLO、SSD等等一口气学完，全程通俗易懂！-人工智能/目标检测/YOLO

ECCV'24开源 完虐COLMAP！百倍加速！ACEZero：全新SfM革新三维重建！

B站【最全YOLO系列】教程，全套36集付费内容，公认最适合新手入门YOLOv11目标检测实战系列，绝对通俗易懂好上手！深度学习_物体检测-人工智能/计算机技术

重磅开源！连你的微表情都可以轻松还原！SMIRK超强3D面部重建技术!

顶会风向变了：小波变换+GNN发文量暴涨！新SOTA准确率近平100%！13篇必读文献

审核下架66次，终于上传成功的暗网黑客技术教程！整整500集，从入门到精通，手把手教你零基础入门网络安全/渗透测试/内网渗透/黑客技术

HeadCraft-超逼真头部细微特征生成！3DMM的革命！

太全了！从入门到精通YOLOv8、YOLOv7、YOLOv6、YOLOv5、YOLOv4、YOLOv3等YOLO目标检测算法！这不啃书爽十倍！

可以说知道这五个网站就没有找不到的数据集！特别是最后一个简直就是学术利器！-人工智能/深度学习/机器学习/数据集

ECCV'24开源 ！无惧遮挡、动态、光照变化！最鲁棒的3DGS震撼来袭！

无所不能！OASim基于3D GS的自动驾驶开源和自适应模拟器！

[CVPR2022] 阿里巴巴: 用于单目深度估计的神经窗口全连接CRF

单目深度估|动态物体处理方法

图宾根大学最新提出 | 基于3D高斯的高效紧凑的三维场景表面重建技术

11款神经网络科研绘图可视化工具，高效绘图太省事了！原来神经网络图这么简单就能画出来!

CVPR'24最佳学生论文亚军！新赛道！SpiderMatch：3D形状匹配

ECCV'24 | 更快更准！Meta最新FPV-NeRF：将NeRF完美应用FPV！

手把手教你破解各种密码（网站密码/压缩包密码/WiFi密码），谨慎点开，网络安全 | web安全 | 渗透测试 | SQL注入 | 信息安全

不会还有人没听，这可能是B站最全的（八大深度学习）系列课程了，零基础入门草履虫都能学会！-神经网络/人工智能/Transformer /深度学习

B站强推！【PyTorch深度学习实战案例】70个练手项目合集，B站最通俗易懂的pytorch深度学习，还不拿下！！-PyTorch/PyTorch安装

相机标定的基本原理与经验分享

Nature子刊！MARS实验室最新开源：基于LiDAR点流的运动事件检测！

3DGS进化？2DGS颠覆3D场景重建！

NVIDIA再斩CVPR冠军方案！Hydra-MDP：突破端到端多模态自动驾驶！

3.9k star！2张图片重建稠密3D场景！竟然还不需要相机内参！

2.4倍加速！PRAM最新开源的视觉定位模型！解锁以地图为中心的学习！

苏黎世联邦理工：利用事件相机进行单目稠密深度估计

Nature正刊开源！突破低延迟自动驾驶视觉感知！

20+FPS！最新开源！加上回环检测的NeRF SLAM竟是如此精确！

炸裂！超快超高精度！普通手机也能运行的实时NeRF！

ECCV'24开源完虐COLMAP！百倍加速！ACEZero：全新SfM革新三维重建！

ECCV'24开源！无惧遮挡、动态、光照变化！最鲁棒的3DGS震撼来袭！