V
主页
CVPR2022 | SemanticStyleGAN:学习生成先验用于控制图像合成和编辑
发布人
生成先验 https://semanticstylegan.github.io/ https://arxiv.org/abs/2112.02236 最近的研究表明,StyleGAN 为图像合成和编辑的下游任务提供了有前途的先验模型。然而,由于 StyleGAN 的潜在代码旨在控制全局样式,因此很难实现对合成图像的细粒度控制。我们提出了 SemanticStyleGAN,其中一个生成器被训练来分别对局部语义部分进行建模,并以组合的方式合成图像。不同局部部分的结构和纹理由相应的潜在代码控制。实验结果表明,我们的模型在不同的空间区域之间提供了强大的解耦。当与为 StyleGAN 设计的编辑方法相结合时,它可以实现更细粒度的控制来编辑合成或真实图像。该模型还可以通过迁移学习扩展到其他领域。因此,作为具有内置解缠结的通用先验模型,它可以促进基于 GAN 的应用程序的开发并实现更多潜在的下游任务。
打开封面
下载高清视频
观看高清视频
视频下载器
CVPR2022 | 秃头生成算法 & 可合成新发型 HairMapper
字节最新成果SemanticStyleGAN:更细粒度控制图像合成和编辑
AI控制光照效果!ControlNet 新作 IC-Light 被网友玩出花!
CVPR2022 | NAN - 噪声感知 NeRF 用于去噪
Barbershop:使用分割mask的GAN图像合成 | SIGGRAPH Asia 2021
CVPR2022|输入二维图像,AI 重建几何结构平面图
CVPR2022 | 基于Transformer的视频插帧算法!支持对视频 8倍插帧
CVPR2022 | 通过视频插帧优化视频预测!逐帧对比预测效果!
人工智能助力足球比赛!姿态估计、球员检测、跟踪、位置分析全都可行!
CVPR2022 | Deblur-NeRF 运动模糊输入也能恢复清晰结果
CVPR2022 Oral | ViT 特征用于语义外观迁移
CVPR2023|SINE:基于先验引导的语义驱动 NeRF 编辑
南洋理工大学提出StableSR! 开源! 利用扩散先验实现真实世界图像的超分辨率
CVPR2022|Blended Diffusion,mask+prompt编辑自然图像,这背景很真实!支持删除/替换/更改现有对象、背景替换和图像外推
基于深度学习模型的解决图片过曝和曝光不足问题,数据集已开源!CVPR2021
HyperHuman:基于隐式结构扩散的超逼真人像生成
AI视频生成!NC-SDEdit :提升视频合成质量和内容一致性新方案 | ECCV2024
CVPR2022 | Playable Environments:在空间和时间进行视频操控
SIGGRAPH 2022 | Text2Human:文本驱动的可控人体图像生成
「IJCAI 2022」 AI 生成高分辨率、任意尺寸中国山水画
ICCV2023 | 特征扩散——StyleGAN 中的“致命伤”及其解决方案
facebook最新成果! 用于稳健的视图合成
CVPR2022 | Abandoning the Bayer-Filter to See in the Dark
ECCV2022 | SimpleRecon 无需 3D 卷积的高质量三维重建方案
CVPR2022 | DiffusionCLIP:用于鲁棒图像处理的文本引导扩散模型
ECCV2022 | AI让合成图像更真实,可用于增强图片/视频色彩!Harmonizer,已开源!
Talk3D:个性化 3D 生成先验进行高保真说话肖像合成【数字人】
CVPR2022 XMP-Font | AI字体生成
「自动驾驶」优步提出:集地图、感知、预测和规划的统一模型 | CVPR2021
CVPR2022 三维目标跟踪 | 融合区域和深度以实现无纹理对象的高效 3D 跟踪
MaskSplit:用于少样本语义分割的自监督元学习 | WACV2022
CVPR2022 | EfficientVIS 高效的视频实例分割
港大&浙大提出Gen6D:从 RGB 图像估计 6 自由度物体姿势
IJCAI2022 | 最近很火哭脸特效,这个算法可以做到
CVPR2022 | 谷歌最新多对象多部分解析的分解标签空间框架 FLOAT
CVPR2021最具创造力的工作!发型编辑、人脸风格化、视频合成、人脸重演、动作迁移等!
StyleMC:基于多通道的快速文本引导图像生成和处理 | WACV2022
SeamlessGAN,GAN生成连贯的纹理贴图!
3D照片风格化:从单个图像学习生成风格化的新视图
FactorMatte:最新视频抠图算法,更适合于视频合成任务