V
主页
京东 11.11 红包
Brush_Your_Text:扩散模型生成指定文字的场景图像
发布人
Brush_Your_Text:扩散模型生成指定文字的场景图像 论文:Brush Your Text: Synthesize Any Scene Text on Images via Diffusion Model 代码:github.com/ecnuljzhang/brush-your-text
打开封面
下载高清视频
观看高清视频
视频下载器
AIGCDetect:识别AI生成
Refusion:基于扩散模型去做图像恢复任务
Adversarial_Diffusion_Distillation:对抗式扩散
LayoutDiffusion:可控的布局到图像输出
CatVersion:定制化可控生成的新扩散方法
千人千图,AI实时生成游戏画面,CS:GO也被攻略了
Video_LLaMA:赋予大模型音视觉感知能力
Street_TryOn:街景虚拟换装的扩散模型
从噪声到图像生成
【每天1分钟AIGC】DreamEdit:目标驱动、个性化定制的图像编辑
InST:风格迁移之扩散模型inversion方法
直观理解Vision Transformer(ViT)及Diffusion Models使用扩散模型进行图像合成,
Imagic:基于扩散模型的可控文生图
极速高效的生成4K图像的文生图模型Sana,强于超大型扩散模型,可在16GB笔记本上部署
NeuralPreset:颜色风格迁移方法
ControlVideo:扩散模型在视频可控生成中的应用
Lift3D:生成模型来扩充3D训练数据
Kandinsky:带图像先验的扩散模型
CVPR23_LFDM:条件图像式视频生成扩散模型
MOSO:分解运动、场景和物体的视频预测生成
NeurlPS'24 开源 | 使用VoxSplats 进行即时大规模场景重建,仅用3张 图像就可在20秒内重建百米大场景
FastSAM:更快的万物分割模型
图像去雨_Image_Deraining__CVPR_2023_
力作!切入点太好啦,何恺明谢赛宁解剖扩散模型,新作刚刚出!!
StableVITON:虚拟换衣_用扩散模型学习语义对应
ODISE:开放标签的生成扩散式全景分割
NoMaD是一种新颖的导航策略,它利用了扩散模型来生成导航轨迹
关于我只用两个月就结合AI发了SCI1区论文——经验分享和本人案例
DCFace:扩散模型提升人脸识别精度
CVPR2023_低光图像增强方法
解决自动驾驶长尾问题,DOME模型结合扩散和OCC技术打造超真实世界模型
2025时间序列必将迎来新一轮爆发!52种创新思路汇总
【睡前小分享】扩散模型流匹配(Flow Matching)真实面目揭秘
HRN:CVPR_2023的3D人脸重建方法
大模型被实习生投毒如何防?
DiffusionRig:基于扩散模型的人脸编辑
零延迟实时生成游戏拿到2100万美元融资模型代码完整开源
【AI知识分享】历时一个半月,全网最用心EDM论文核心知识点串讲,EDM论文讲解之扩散模型通用框架超详细解读第八回:最终一战
CondFoleyGen:从视频生成声音
U_ViT:改进扩散模型的网络骨干