V
主页
ECCV 2022 | InvPT:用于密集场景理解的倒金字塔多任务Transformer
发布人
Inverted Pyramid Multi-task Transformer for Dense Scene Understanding 本文提出一种新的Transformer框架:倒金字塔多任务Transformer(InvPT),用于视觉场景理解的多任务密集预测(如语义分割、人体解析、显著性检测、边缘检测、表面法线估计等任务),代码即将开源! 单位:香港科技大学(徐旦团队) - 代码:https://github.com/prismformore/InvPT - 论文:https://arxiv.org/abs/2203.07997 - Demo:https://youtu.be/XxSZUkknHII
打开封面
下载高清视频
观看高清视频
视频下载器
ECCV 2024 AI涨点神器!超越DINOv2!显著提升语义分割、深度估计性能!
ECCV 2022 物理攻击单目深度估计!这个图案可以降低你的模型性能!
当Transformer遇见光流估计!FlowFormer收录ECCV 2022!
当Transformer遇见语义分割!SegFormer:性能更强的语义分割网络!
何恺明首个具身智能工作!HPT:异构预训练Transformer!收录顶会NeurIPS 2024!
ECCV 2024 超越3DGS!3D场景重建新方法!WildGaussians:不惧遮挡和外观变化!
ECCV 2024 最佳论文候选!Meta提出人体视觉基础模型Sapiens!性能炸裂!
为自动驾驶而生!汇集六大视觉任务!OmniDet:基于环视摄像头的多任务视觉感知网络 | ICRA 2021
超越GPT-4o!Allen AI重磅发布Molmo:最强多模态AI模型!碾压Llama 3.2!
视频PS神器!人物隐身消失!视频修复新工作!代码开源!ICCV 2021
CVPR 2024 清华和阿里提出3D重建新工作!XScale-NVS:大规模场景新视图合成,把滕王阁都重建渲染了!
跟踪一切!收录顶会ECCV 2024!DINO-Tracker:遮挡也不怕!太疯狂!
太逼真!数字人全新工作!神经参数高斯Avatars:你的第一个数字化身!
检测一切新模型!刷新记录!Grounding DINO 1.5:最强开集目标检测模型
AI新突破!数字人全新工作GGHead:3D头部生成新框架!这质感太逼真了!
ICCV 2023 | 360°三维场景重建!NeO 360:用于室外场景稀疏视图合成的神经场
ECCV 2024 Oral PDD:无限3D场景生成新工作!代码重磅开源!
4K 1000 FPS!极致视频插帧网络:XVFI-Net来了!数据集和代码已开源!ICCV 2021 Oral
CVPR 2024 深度估计最强开源工作!Depth Anything刷新多个SOTA!
屠榜的Swin Transformer做目标检测和实例分割!效果太惊艳!
性能炸裂!Meta提出Sapiens:人体视觉基础模型!收录ECCV 2024 Oral
精细到发丝!这个抠图网络连动物图像都能抠!
CVPR 2024 超高分论文!GenN2N:全新的NeRF编辑框架!港科大&清华大学出品
【2024最新】AI大模型入门教程(65集精讲)真正的保姆级零基础入门教程!深度学习基础+大模型相关算法+神经网络,大模型入门必学!
CVPR 2024 奔驰自动驾驶新方法DualAD:端到端自动驾驶!性能表现SOTA!
西安交大提出无需训练的开放词汇遥感语义分割方法(今日Arxiv 10月3日)2024年10月3日Arxiv cs.CV发文量约105余篇,减论Agent
ECCV 2024 图像修复神器!这是魔法吗?!BrushNet:即插即用的图像修复模型
北大提出金字塔流匹配算法用于高效视频生成(今日Arxiv 10月10日)2024年10月10日Arxiv cs.CV发文量约226余篇,减论Agent
AI新突破!阿里巴巴提出第一个基于扩散模型的视频虚拟试衣框架Tunnel Try-on,也是商业级应用的首次尝试!
会游泳的无人机!ETH发布Dipper:水空两栖无人机,轻松上天入海!
CVPR 2024 最佳论文候选!谷歌新作:让万物动起来!看这花、这树叶、这火焰都动起来了!
ECCV 2024 医学标注神器!ScriblePrompt:交互式医学图像分割框架
CVPR 2024 满分论文!浙大&字节提出单目动态场景重建新方法
ECCV 2024 数字人全新工作!PhysAvatar:虚拟形象的高质量新视图渲染
华为AI顶会新工作!半监督3D分割的贝叶斯自训练!中稿ECCV 2024!
当人体姿态估计遇见【肌肉金轮】
CVPR 2024 MotionEditor:首个面向动作编辑的视频扩散模型!厉不厉害你坤哥!
【多模态+大模型+知识图谱】2024完整版:这绝对是B站最全的教程,论文创新点终于解决了!——人工智能/深度学习/aigc/计算机视觉
CVPR 2024最佳论文候选!全景场景补全新任务和首个城市3D全景场景补全框架!
我将用20秒夺走你的卧槽!这就是AI的魅力