V
主页
CVPR2022|Blended Diffusion,mask+prompt编辑自然图像,这背景很真实!支持删除/替换/更改现有对象、背景替换和图像外推
发布人
https://omriavrahami.com/blended-diffusion-page/ https://github.com/omriav/blended-diffusion 福利:2000核时免费领,立刻开启云上高性能计算 ☞,注册即送200元计算资源,https://www.bkunyun.com/wap/console?source=bkykolaistudy 在本文中,我们介绍了第一个基于自然语言描述和 ROI 掩码在通用自然图像中执行局部(基于区域)编辑的解决方案。 我们通过利用和组合预训练的语言图像模型 (CLIP) 来实现我们的目标,将编辑转向用户提供的文本提示,并使用去噪扩散概率模型 (DDPM) 来生成看起来自然的结果。 展示了几个文本驱动的编辑应用程序,包括向图像添加新对象、删除/替换/更改现有对象、背景替换和图像外推。
打开封面
下载高清视频
观看高清视频
视频下载器
字节最新成果SemanticStyleGAN:更细粒度控制图像合成和编辑
CVPR2022 | 通过视频插帧优化视频预测!逐帧对比预测效果!
CVPR2022|输入二维图像,AI 重建几何结构平面图
CVPR2022 | 清华提出OcclusionFusion:实时动态 3D 重建的遮挡感知运动估计
CVPR2022|谷歌 实时3D人体关键点检测&姿态估计,已加入mediapipe!
【整整200集】不愧是李飞飞,一口把深度学习、计算机视觉、神经网络、图像处理、图像分割、目标检测、物体识别给讲透了,新手小白秒上手!-人工智能/计算机视觉
人工智能助力足球比赛!姿态估计、球员检测、跟踪、位置分析全都可行!
Barbershop:使用分割mask的GAN图像合成 | SIGGRAPH Asia 2021
CVPR2022 | EfficientVIS 高效的视频实例分割
CVPR2022 | 可控人物图像合成的神经纹理提取和分布!开源
CVPR2022 | Deblur-NeRF 运动模糊输入也能恢复清晰结果
CVPR2021最具创造力的工作!发型编辑、人脸风格化、视频合成、人脸重演、动作迁移等!
SIGGRAPH 2022 | Text2Human:文本驱动的可控人体图像生成
CVPR2022 | 基于Transformer进行高质量实例分割的Mask Transfiner
CVPR2022 三维目标跟踪 | 融合区域和深度以实现无纹理对象的高效 3D 跟踪
「AAAI2022」图像恢复操作符 ,可用于恢复人脸修饰和高光保留曝光调整
CVPR2022 | BasicVSR++:通过增强传播和对齐提高视频超分辨率
CVPR2022 | AI视频修复!基于惯性引导光流补全和样式融合的视频修复
CVPR2022 | UCSD&英伟达提出CoordGAN:GAN中涌现的自监督稠密对应
Stable Diffusion 权重公布!
AnimeInterp 动画插帧框架!开放场景中的动画表现出良好的感知质量和稳健性 | CVPR2021
CVPR 2022| Bailando:生成 3D 舞蹈,DNA动了!
港科大:“内外兼修”的图像修复算法,有效去除颜色突变等伪影 | CVPR2021
StyleMC:基于多通道的快速文本引导图像生成和处理 | WACV2022
[CVPR 2021] NeX:基于多平面图像增强(MPI)的新颖视图合成的新方法 | 代码即将开源
CVPR2021最新视频抠图框架,港科大&快手提出新的时空特征聚合模块ST-FAM:对快速移动或复杂背景有更好的预测结果!
IJCAI2022 | 最近很火哭脸特效,这个算法可以做到
CoNeRF:可控神经辐射场
CVPR 2022 | Pop-Out Motion 2D 图实现 3D 重建!效果太强辣
ECCV 2022!CAIR:用于Instagram滤镜移除的快速轻量级多尺度色彩注意力网络
CVPR2022 | 清华提出IntagHand,引入新的基于注意力模块解决双手重建的遮挡和交互挑战
CVPR2021 基于单幅图像隐式表征的整体三维场景
CVPR2022 | 多模态Transformer用于视频分割效果惊艳
给背景替换加“亿”点真实感,变换背景依然保留真实感的光照效果 | siggraph 2021
ECCV2022 | CCPL:通用的风格迁移方法,艺术化、逼真的视频风格迁移!开源
CVPR2022 Oral | 消除图像拼接后的不规则边界!已开源
CVPR2023 | 扩散模型协作实现多模态人脸生成和编辑
Pathdreamer:一个可以实现室内导航的模型!效果更高清!ICCV 2021
CVPR2022 | NAN - 噪声感知 NeRF 用于去噪
从单个RGB图像重建三维非长方体房间布局 | WACV2022