V
主页
京东 11.11 红包
iccv2023 | Tracking Anything with Decoupled Video Segmentation
发布人
https://www.youtube.com/watch?v=Z8Gld-kbs-c https://hkchengrex.com/Tracking-Anything-with-DEVA/ https://arxiv.org/abs/2309.03903 https://github.com/hkchengrex/Tracking-Anything-with-DEVA 视频分割训练数据的注释成本很高。 这阻碍了端到端算法扩展到新的视频分割任务,特别是在大词汇量设置中。 为了在无需对每个任务的视频数据进行训练的情况下“跟踪任何内容”,我们开发了一种解耦视频分割方法(DEVA),该方法由特定于任务的图像级分割和与类/任务无关的双向时间传播组成。 由于这种设计,我们只需要目标任务的图像级模型(训练成本更低)和通用时间传播模型,该模型只需训练一次即可跨任务泛化。 为了有效地结合这两个模块,我们使用双向传播对来自不同帧的分割假设进行(半)在线融合,以生成连贯的分割。 我们表明,在一些数据稀缺任务中,这种解耦的公式优于端到端方法,包括大词汇量视频全景分割、开放世界视频分割、参考视频分割和无监督视频对象分割。
打开封面
下载高清视频
观看高清视频
视频下载器
在家作AI接单,昨天780,一台电脑,操作简单,分享我的接单平台,接单技巧和资源分享,悄悄努力,惊艳所有人!!
CVPR2022 | EfficientVIS 高效的视频实例分割
CVPR2022 | 谷歌出品!逼真的单目 3D 人体重建
【AI视频生成】丝滑!视频版ControlNet来了! ControlVideo!
CVPR2022 | 基于Transformer进行高质量实例分割的Mask Transfiner
《山海经》第一集 东次一经,一部上古奇书,神秘莫测。带你穿越时空,领略古老神话的奇幻魅力
港大&浙大提出Gen6D:从 RGB 图像估计 6 自由度物体姿势
BlunF:NeRF+2D 蓝图应用于室内设计!支持 3D 操作,例如遮罩、外观修改和对象删除
SAM2真的很容易出创新!无需微调既能小样本医疗图像分割
ECCV 2022 | 深度图分解用于单目深度估计
CVPR 2021|BCNet:双图层实例分割新思路
图解何恺明最新一作论文 Masked Autoencoders(MAE)
CVPR2022 | Abandoning the Bayer-Filter to See in the Dark
CVPR2023 | SeaThru-NeRF:散射介质中的神经辐射场
CVPR2022 | 它会魔法吧?基于光流的端到端视频补全框架 (E2FGVI)
TraDes:跟踪目标检测和分割:在线多对象跟踪器| CVPR2021
SeamlessGAN,GAN生成连贯的纹理贴图!
ECCV2022| 3D 人体模型拟合新方向:学习顶点下降
「AI绘画」ControlNet强的离谱!支持草图/姿态/边缘/分割等多种输入控制结果!
NVIDIA 的新 AI:即时神经图形!(中英)
CVPR2022 | 清华&腾讯&港中大提出StyleHEAT:预训练StyleGAN生成高分辨率可编辑talking face
哎呦我去,这个AI像妖怪!AI根据音乐生成视频music2video
交通灯数据集
ECCV2022 | 倒金字塔多任务Transfomer用于密集场景理解
CVPR 2022 | 卡通化神器,可渲染夸张的动漫面孔和逼真的卡通场景
当AI把物理教材可视化,哪里不会点哪里,小滑块直接动起来
基于可靠注意图的交互式视频目标分割 | CVPR2021
SceneHGN:层次图网络用于细粒度几何的 3D 室内场景生成
Google Research提出StylEx:训练GAN可视化解释每个属性如何影响分类模型 | ICCV2021
AI自动踢足球!能攻能守!在GFootball中成功学习五名玩家策略!
CVPR2022 三维目标跟踪 | 融合区域和深度以实现无纹理对象的高效 3D 跟踪
X-NeRF!一种基于神经辐射场公式的学习交叉光谱场景表示的新方法
大数据时代的利器!密集场景下的人群跟踪替代算法,头部跟踪算法 | CVPR 2021
【AI绘画】最强三款AI绘图软件最全测评,StableDiffusion | Midjourney | comfyui,谁才是AI绘图天花板?你会选择哪一款?
ECCV 2022 | 开放集半监督目标检测
一分钟感受计算机视觉的魅力!CVPR 2021 最具创造力的工作!
[自动驾驶]Omniverse Replicator附能NVIDIA DRIVE Sim合成数据生成
CVPR2022 | 基于Transformer的视频插帧算法!支持对视频 8倍插帧
南洋理工大学提出VideoBooth:基于扩散的图像提示视频生成
南洋理工&南开提出CuDi:曲线蒸馏用于高效可控曝光调整