ECCV 2022 | InvPT：用于密集场景理解的倒金字塔多任务Transformer - 视频下载 Video Downloader

ECCV 2022 | InvPT：用于密集场景理解的倒金字塔多任务Transformer

发布人

Inverted Pyramid Multi-task Transformer for Dense Scene Understanding
本文提出一种新的Transformer框架：倒金字塔多任务Transformer（InvPT），用于视觉场景理解的多任务密集预测（如语义分割、人体解析、显著性检测、边缘检测、表面法线估计等任务），代码即将开源！
单位：香港科技大学(徐旦团队)
- 代码：https://github.com/prismformore/InvPT
- 论文：https://arxiv.org/abs/2203.07997
- Demo：https://youtu.be/XxSZUkknHII

打开封面下载高清视频观看高清视频视频下载器

ECCV 2024 AI涨点神器！超越DINOv2！显著提升语义分割、深度估计性能！

ECCV 2022 物理攻击单目深度估计！这个图案可以降低你的模型性能！

当Transformer遇见光流估计！FlowFormer收录ECCV 2022！

当Transformer遇见语义分割！SegFormer：性能更强的语义分割网络！

何恺明首个具身智能工作！HPT：异构预训练Transformer！收录顶会NeurIPS 2024！

ECCV 2024 超越3DGS！3D场景重建新方法！WildGaussians：不惧遮挡和外观变化！

ECCV 2024 最佳论文候选！Meta提出人体视觉基础模型Sapiens！性能炸裂！

为自动驾驶而生！汇集六大视觉任务！OmniDet：基于环视摄像头的多任务视觉感知网络 | ICRA 2021

超越GPT-4o！Allen AI重磅发布Molmo：最强多模态AI模型！碾压Llama 3.2！

视频PS神器！人物隐身消失！视频修复新工作！代码开源！ICCV 2021

CVPR 2024 清华和阿里提出3D重建新工作！XScale-NVS：大规模场景新视图合成，把滕王阁都重建渲染了！

跟踪一切！收录顶会ECCV 2024！DINO-Tracker：遮挡也不怕！太疯狂！

太逼真！数字人全新工作！神经参数高斯Avatars：你的第一个数字化身！

检测一切新模型！刷新记录！Grounding DINO 1.5：最强开集目标检测模型

AI新突破！数字人全新工作GGHead：3D头部生成新框架！这质感太逼真了！

ICCV 2023 | 360°三维场景重建！NeO 360：用于室外场景稀疏视图合成的神经场

ECCV 2024 Oral PDD：无限3D场景生成新工作！代码重磅开源！

4K 1000 FPS！极致视频插帧网络：XVFI-Net来了！数据集和代码已开源！ICCV 2021 Oral

CVPR 2024 深度估计最强开源工作！Depth Anything刷新多个SOTA！

屠榜的Swin Transformer做目标检测和实例分割！效果太惊艳！

性能炸裂！Meta提出Sapiens：人体视觉基础模型！收录ECCV 2024 Oral

精细到发丝！这个抠图网络连动物图像都能抠！

CVPR 2024 超高分论文！GenN2N：全新的NeRF编辑框架！港科大&清华大学出品

【2024最新】AI大模型入门教程（65集精讲）真正的保姆级零基础入门教程！深度学习基础+大模型相关算法+神经网络，大模型入门必学！

CVPR 2024 奔驰自动驾驶新方法DualAD：端到端自动驾驶！性能表现SOTA！

西安交大提出无需训练的开放词汇遥感语义分割方法（今日Arxiv 10月3日）2024年10月3日Arxiv cs.CV发文量约105余篇，减论Agent

ECCV 2024 图像修复神器！这是魔法吗？！BrushNet：即插即用的图像修复模型

北大提出金字塔流匹配算法用于高效视频生成（今日Arxiv 10月10日）2024年10月10日Arxiv cs.CV发文量约226余篇，减论Agent

AI新突破！阿里巴巴提出第一个基于扩散模型的视频虚拟试衣框架Tunnel Try-on，也是商业级应用的首次尝试！

会游泳的无人机！ETH发布Dipper：水空两栖无人机，轻松上天入海！

CVPR 2024 最佳论文候选！谷歌新作：让万物动起来！看这花、这树叶、这火焰都动起来了！

ECCV 2024 医学标注神器！ScriblePrompt：交互式医学图像分割框架

CVPR 2024 满分论文！浙大&字节提出单目动态场景重建新方法

ECCV 2024 数字人全新工作！PhysAvatar：虚拟形象的高质量新视图渲染

华为AI顶会新工作！半监督3D分割的贝叶斯自训练！中稿ECCV 2024！

当人体姿态估计遇见【肌肉金轮】

CVPR 2024 MotionEditor：首个面向动作编辑的视频扩散模型！厉不厉害你坤哥！

【多模态+大模型+知识图谱】2024完整版：这绝对是B站最全的教程，论文创新点终于解决了！——人工智能/深度学习/aigc/计算机视觉

CVPR 2024最佳论文候选！全景场景补全新任务和首个城市3D全景场景补全框架！

我将用20秒夺走你的卧槽！这就是AI的魅力