CondFoleyGen：从视频生成声音 - 视频下载 Video Downloader

京东 11.11 红包

CondFoleyGen：从视频生成声音

发布人

CondFoleyGen：从视频生成声音
论文：Conditional Generation of Audio from Video via Foley Analogies
代码：github.com/XYPB/CondFoleyGen

打开封面下载高清视频观看高清视频视频下载器

CatVersion：定制化可控生成的新扩散方法

Refusion：基于扩散模型去做图像恢复任务

CVPR23_LFDM：条件图像式视频生成扩散模型

FastSAM：更快的万物分割模型

MM_Diffusion：音视频多模态生成

UPR_Net：视频帧插值

video_physics_sound_diffusion：扩散模型的声音生成

Kandinsky：带图像先验的扩散模型

Adobe视频编辑新方法：使用扩散模型的Pix2Video

Adversarial_Diffusion_Distillation：对抗式扩散

【每天1分钟AIGC】DreamEdit：目标驱动、个性化定制的图像编辑

U_ViT：改进扩散模型的网络骨干

GSS：生成式语义分割

MaskedDenoising：图像去噪方法_CVPR_2023

ControlVideo：扩散模型在视频可控生成中的应用

InST：风格迁移之扩散模型inversion方法

识别AI伪造_deepfake无处遁形CVPR_2023

Street_TryOn：街景虚拟换装的扩散模型

Brush_Your_Text：扩散模型生成指定文字的场景图像

LayoutDiffusion：可控的布局到图像输出

ODISE：开放标签的生成扩散式全景分割

VTON_IT：虚拟试衣的两阶段方法

NeuralPreset：颜色风格迁移方法

Asymmetric_VQGAN：提升Stable_Diffusion效果

Imagic：基于扩散模型的可控文生图

StyleGAN_Salon：虚拟发型迁移

LOVECon：无需训练的文本驱动视频编辑

图像去雨_Image_Deraining__CVPR_2023_

DiffusionRig：基于扩散模型的人脸编辑

SpaText：一种CVPR2023可控文生图方法 (1)

FOCUS：弱监督异常分割提高人脸重建质量

CVPR2023_低光图像增强方法

CF_Font：内容融合的少样本字体生成

TagCLIP：提升CLIP的多标签分类能力

MetaPortrait：说话人生成的快速定制

MagicBrush：指令引导的图像编辑

GALIP：基于GAN的文生图

StableVITON：虚拟换衣_用扩散模型学习语义对应

DeltaEdit：文本驱动编辑方法_无需文本数据训练

GenConViT：用于甄别AIGC内容的模型