V
主页
DiffiT:基于扩散视觉Transformer的图像生成
发布人
【加群】 一起来刷arxiv,请加vx: pwbot02(请备注:b站arxiv) 【论文标题】 DiffiT:基于扩散视觉Transformer的图像生成 【论文简述】 DiffiT是一种基于扩散视觉Transformer的图像生成方法,通过将Transformer结构引入扩散模型,实现了高分辨率、高质量的图像生成。DiffiT采用一种新颖的时间依赖自注意力模块,使注意力层能够在去噪过程的不同阶段自适应地调整行为。实验结果表明,DiffiT在多种数据集上实现了最先进的性能,包括在ImageNet-256数据集上取得了1.73的FID分数。DiffiT为图像生成任务提供了一种高效、可扩展的解决方案,展示了Transformer在扩散模型中的潜力。 【论文链接】 https://arxiv.org/abs/2312.02139
打开封面
下载高清视频
观看高清视频
视频下载器
基于扩散模型的360度全景图像生成任务
HiFi Tuner:基于扩散模型的高保真度个性化图像生成
FineControlNet:基于空间对齐文本控制注入的图像生成细粒度文本控制
大规模3D场景生成全新工作!LT3SD:扩散模型杀疯了!
讲座 | 文生图扩散模型中的精确颜色生成——巴塞罗那自治大学LAMP组博士后王凯
FastDiT-3D:高效生成高质量三维点云的扩散变换器
基于共享注意力的风格一致图像生成方法
基于文本到图像扩散模型的文本到视频生成架构研究
融合像素与潜在扩散模型的文本到视频生成方法
多模态指令图像生成:Instruct-Imagen模型的创新与应用
基于扩散模型的文本到图像合成
DeepCache:无需训练加速扩散模型的创新方法
ECCV'24 最新Oral已开源 ! | 用于 3D大场景生成的金字塔扩散模型,实现无限场景生成与高效数据迁移
动态3D高斯分布与合成扩散模型:实现文本到4D动画的生成
一种基于物理信息纠正的交互扩散模型
文本到图像一致性模型的有条件控制策略研究
【论文精讲】精讲Diffusion Policy扩散策略:基于扩散模型的机器人动作生成策略
基于注意力调整的局部图像编辑方法:MAG-Edit
基于连续动力系统的扩散模型降噪网络设计
SPiC·E: 为3D扩散模型注入结构先验以实现高级3D编辑
生成高质量的长视频:SEINE视频扩散模型
Alchemist:基于扩散模型的材质属性参数化控制
强推!!【完整版Diffusion模型】简单的训练Diffusion扩散模型,由浅入深了解Diffusion,感受它带给我们的无限震撼!真的通俗易懂!
快速高效文本到图像生成模型
GPT4Motion: 一种基于GPT和Blender的文本到视频生成框架
稳定分数蒸馏:高质量三维生成新方法
【李宏毅】不愧是B站公认最好的扩散模型【Diffusion Model】教程!深入浅出看完你就学懂!(附课件)
腾讯提出精准实例定位与细节生成方法IFAdapter(今日Arxiv 9月13日)2024年9月13日Arxiv cs.CV发文量约107余篇,减论Agent
基于扩散模型的可控4D引导视频生成
CreativeSynth: Creative Blending and Synthesis of Visual Arts based on Multimoda
CVPR'24 满分Oral | EscherNet 实现任意视角灵活扩散生成 解锁3D视觉无限可能!
强烈推荐!台大李宏毅自注意力机制和Transformer详解!从入门到入神,小白看完也能轻松学会!!
基于上下文调整的检索增强生成方法
GAMES Webinar 336-视觉专题-朱智宇-NVS-Solver以及扩散模型与新视点渲染相融合的一些理解
Neural Network Diffusion
轻松搞定论文创新点!【Diffusion扩散模型+对比学习】源码复现+模型精讲+论文解读!迪哥带你轻松写论文!真的通俗易懂!(人工智能、深度学习、机器学习算法)
强推!GAN生成对抗网络原理解读+论文讲解+代码复现被同济大佬由浅入深讲明白了!—人工智能_深度学习
基于ChatGPT的模板生成方法用于图像分类
【大模型入门教程】AIGC与大模型核心知识与应用案例(大模型训练/微调)
AI人工智能前沿(互关互赞) LinFusion的新方法,旨在解决现有扩散模型在生成高分辨率视觉内容时面临的时间和内存复杂性问题 线性注意机制 知识蒸馏