V
主页
京东 11.11 红包
速度提升10倍以上!Depth Anything V2更稳健、精细的单目深度估计
发布人
速度提升10倍以上!Depth Anything V2:更稳健、精细的单目深度估计(HKU&TikTok)#人工智能 #计算机 #科技 #算法 #自动驾驶 #深度估计 #顶会论文 在微信公众号「3DCV」回复:「原论文」,获取论文代码和链接,赶快学起来! 本文介绍了Depth Anything V2。不追求花哨的技术,而是旨在揭示关键发现,为构建强大的单目深度估计模型铺平道路。值得注意的是,与V1相比,本版本通过三项关键实践产生了更精细、更稳健的深度预测:1) 将所有带标签的真实图像替换为合成图像;2) 扩大教师模型的容量;3) 通过大规模伪标签真实图像的桥梁来教授学生模型。与基于Stable Diffusion的最新模型相比,我们的模型在效率(速度快10倍以上)和准确性上都显著提高。我们提供了不同规模(参数范围从25M到1.3B)的模型,以支持广泛的场景。得益于它们强大的泛化能力,我们使用度量深度标签对其进行微调,以获得我们的度量深度模型。除了我们的模型外,考虑到当前测试集的有限多样性和频繁噪声,我们还构建了一个具有精确注释和多样化场景的多功能评估基准,以促进未来的研究。
打开封面
下载高清视频
观看高清视频
视频下载器
Depth Anything!最强开源单目深度估计SOTA!
ECCV'24开源 | 又快又好!6DGS重新定义6D物体位姿估计!
[3DGS进展] ETH等DepthSplat证明3DGS与深度估计任务是可相互促进提升的,并在多个数据集上同时取得深度估计和NVS任务的SOTA
3DGS进化,高效高质量的GaussianPro来袭!
极快跟踪一切!DOT:无惧遮挡!
【全368集】清华大佬终于把Python做成了动画片!2024最新版,草履虫都能学会的Python零基础入门教程!拿走不谢,学不会我退出IT圈!
三维重建大一统!LSM:无需先验位姿,首次实现实时语义3D重建!
【MATLAB速成】这可能是全网最适合初学者入门的MATLAB教程了!花3小时就能从入门到精通,草履虫都能听懂!
无需 GPS:语义地图引领多机器人室内外探索
14岁少年自杀,责任是否在人工智能,明星AI公司面临诉讼
【全289集】这才是科研人该学的,目标检测六大算法R-CNN、Fast R-CNN、YOLO、SSD等等一口气学完,全程通俗易懂!-人工智能/目标检测/YOLO
ECCV'24开源 完虐COLMAP!百倍加速!ACEZero:全新SfM革新三维重建!
B站【最全YOLO系列】教程,全套36集付费内容,公认最适合新手入门YOLOv11目标检测实战系列,绝对通俗易懂好上手!深度学习_物体检测-人工智能/计算机技术
重磅开源!连你的微表情都可以轻松还原!SMIRK超强3D面部重建技术!
顶会风向变了:小波变换+GNN发文量暴涨!新SOTA准确率近平100%!13篇必读文献
审核下架66次,终于上传成功的暗网黑客技术教程!整整500集,从入门到精通,手把手教你零基础入门网络安全/渗透测试/内网渗透/黑客技术
HeadCraft-超逼真头部细微特征生成!3DMM的革命!
太全了!从入门到精通YOLOv8、YOLOv7、YOLOv6、YOLOv5、YOLOv4、YOLOv3等YOLO目标检测算法!这不啃书爽十倍!
可以说知道这五个网站就没有找不到的数据集!特别是最后一个简直就是学术利器!-人工智能/深度学习/机器学习/数据集
ECCV'24开源 !无惧遮挡、动态、光照变化!最鲁棒的3DGS震撼来袭!
无所不能!OASim基于3D GS的自动驾驶开源和自适应模拟器!
[CVPR2022] 阿里巴巴: 用于单目深度估计的神经窗口全连接CRF
单目深度估|动态物体处理方法
图宾根大学最新提出 | 基于3D高斯的高效紧凑的三维场景表面重建技术
11款神经网络科研绘图可视化工具,高效绘图太省事了!原来神经网络图这么简单就能画出来!
CVPR'24最佳学生论文亚军!新赛道!SpiderMatch:3D形状匹配
ECCV'24 | 更快更准!Meta最新FPV-NeRF:将NeRF完美应用FPV!
手把手教你破解各种密码(网站密码/压缩包密码/WiFi密码),谨慎点开,网络安全 | web安全 | 渗透测试 | SQL注入 | 信息安全
不会还有人没听,这可能是B站最全的(八大深度学习)系列课程了,零基础入门草履虫都能学会!-神经网络/人工智能/Transformer /深度学习
B站强推!【PyTorch深度学习实战案例】70个练手项目合集,B站最通俗易懂的pytorch深度学习,还不拿下!!-PyTorch/PyTorch安装
相机标定的基本原理与经验分享
Nature子刊!MARS实验室最新开源:基于LiDAR点流的运动事件检测!
3DGS进化?2DGS颠覆3D场景重建!
NVIDIA再斩CVPR冠军方案!Hydra-MDP:突破端到端多模态自动驾驶!
3.9k star!2张图片重建稠密3D场景!竟然还不需要相机内参!
2.4倍加速!PRAM最新开源的视觉定位模型!解锁以地图为中心的学习!
苏黎世联邦理工:利用事件相机进行单目稠密深度估计
Nature正刊开源!突破低延迟自动驾驶视觉感知!
20+FPS!最新开源!加上回环检测的NeRF SLAM竟是如此精确!
炸裂!超快超高精度!普通手机也能运行的实时NeRF!