Brush_Your_Text：扩散模型生成指定文字的场景图像

发布人

Brush_Your_Text：扩散模型生成指定文字的场景图像
论文：Brush Your Text: Synthesize Any Scene Text on Images via Diffusion Model
代码：github.com/ecnuljzhang/brush-your-text

打开封面下载高清视频观看高清视频视频下载器

AIGCDetect：识别AI生成

Refusion：基于扩散模型去做图像恢复任务

Adversarial_Diffusion_Distillation：对抗式扩散

LayoutDiffusion：可控的布局到图像输出

CatVersion：定制化可控生成的新扩散方法

千人千图，AI实时生成游戏画面，CS:GO也被攻略了

Video_LLaMA：赋予大模型音视觉感知能力

Street_TryOn：街景虚拟换装的扩散模型

从噪声到图像生成

【每天1分钟AIGC】DreamEdit：目标驱动、个性化定制的图像编辑

InST：风格迁移之扩散模型inversion方法

直观理解Vision Transformer（ViT）及Diffusion Models使用扩散模型进行图像合成，

Imagic：基于扩散模型的可控文生图

极速高效的生成4K图像的文生图模型Sana，强于超大型扩散模型，可在16GB笔记本上部署

NeuralPreset：颜色风格迁移方法

ControlVideo：扩散模型在视频可控生成中的应用

Lift3D：生成模型来扩充3D训练数据

Kandinsky：带图像先验的扩散模型

CVPR23_LFDM：条件图像式视频生成扩散模型

MOSO：分解运动、场景和物体的视频预测生成

NeurlPS'24 开源 | 使用VoxSplats 进行即时大规模场景重建,仅用3张图像就可在20秒内重建百米大场景

FastSAM：更快的万物分割模型

图像去雨_Image_Deraining__CVPR_2023_

力作！切入点太好啦，何恺明谢赛宁解剖扩散模型，新作刚刚出！！

StableVITON：虚拟换衣_用扩散模型学习语义对应

ODISE：开放标签的生成扩散式全景分割

NoMaD是一种新颖的导航策略，它利用了扩散模型来生成导航轨迹

关于我只用两个月就结合AI发了SCI1区论文——经验分享和本人案例

DCFace：扩散模型提升人脸识别精度

CVPR2023_低光图像增强方法

解决自动驾驶长尾问题，DOME模型结合扩散和OCC技术打造超真实世界模型

2025时间序列必将迎来新一轮爆发！52种创新思路汇总

【睡前小分享】扩散模型流匹配（Flow Matching）真实面目揭秘

HRN：CVPR_2023的3D人脸重建方法

大模型被实习生投毒如何防？

DiffusionRig：基于扩散模型的人脸编辑

零延迟实时生成游戏拿到2100万美元融资模型代码完整开源

【AI知识分享】历时一个半月，全网最用心EDM论文核心知识点串讲，EDM论文讲解之扩散模型通用框架超详细解读第八回：最终一战

CondFoleyGen：从视频生成声音

U_ViT：改进扩散模型的网络骨干

Brush_Your_Text：扩散模型生成指定文字的场景图像

AIGCDetect：识别AI生成

Refusion：基于扩散模型去做图像恢复任务

Adversarial_Diffusion_Distillation：对抗式扩散

LayoutDiffusion：可控的布局到图像输出

CatVersion：定制化可控生成的新扩散方法

千人千图，AI实时生成游戏画面，CS:GO也被攻略了

Video_LLaMA：赋予大模型音视觉感知能力

Street_TryOn：街景虚拟换装的扩散模型

从噪声到图像生成

【每天1分钟AIGC】DreamEdit：目标驱动、个性化定制的图像编辑

InST：风格迁移之扩散模型inversion方法

直观理解Vision Transformer（ViT）及Diffusion Models使用扩散模型进行图像合成，

Imagic：基于扩散模型的可控文生图

极速高效的生成4K图像的文生图模型Sana，强于超大型扩散模型，可在16GB笔记本上部署

NeuralPreset：颜色风格迁移方法

ControlVideo：扩散模型在视频可控生成中的应用

Lift3D：生成模型来扩充3D训练数据

Kandinsky：带图像先验的扩散模型

CVPR23_LFDM：条件图像式视频生成扩散模型

MOSO：分解运动、场景和物体的视频预测生成

NeurlPS'24 开源 | 使用VoxSplats 进行即时大规模场景重建,仅用3张 图像就可在20秒内重建百米大场景

FastSAM：更快的万物分割模型

图像去雨_Image_Deraining__CVPR_2023_

力作！切入点太好啦，何恺明谢赛宁解剖扩散模型，新作刚刚出！！

StableVITON：虚拟换衣_用扩散模型学习语义对应

ODISE：开放标签的生成扩散式全景分割

NoMaD是一种新颖的导航策略，它利用了扩散模型来生成导航轨迹

关于我只用两个月就结合AI发了SCI1区论文——经验分享和本人案例

DCFace：扩散模型提升人脸识别精度

CVPR2023_低光图像增强方法

解决自动驾驶长尾问题，DOME模型结合扩散和OCC技术打造超真实世界模型

2025时间序列必将迎来新一轮爆发！52种创新思路汇总

【睡前小分享】扩散模型流匹配（Flow Matching）真实面目揭秘

HRN：CVPR_2023的3D人脸重建方法

大模型被实习生投毒如何防？

DiffusionRig：基于扩散模型的人脸编辑

零延迟实时生成游戏拿到2100万美元融资模型代码完整开源

【AI知识分享】历时一个半月，全网最用心EDM论文核心知识点串讲，EDM论文讲解之扩散模型通用框架超详细解读第八回：最终一战

CondFoleyGen：从视频生成声音

U_ViT：改进扩散模型的网络骨干

NeurlPS'24 开源 | 使用VoxSplats 进行即时大规模场景重建,仅用3张图像就可在20秒内重建百米大场景