V
主页
京东 11.11 红包
爆火!一块RTX 3090就能跑!北邮&清华提出DemoFusion:轻松实现高分辨率图像生成!
发布人
在CVer微信公众号后台回复:DemoFusion,即可下载论文和代码! 爆火!免微调!DemoFusion:轻松实现高分辨率图像生成!一块RTX 3090就能跑!引入渐进式Upscaling、跳跃残差和空洞采样机制,DemoFusion可以与开源生成式AI模型集成在一起,以实现更高分辨率的图像生成,比如将SDXL生成的图像放大4倍到16倍!代码刚刚开源!单位:北邮, 清华, Edin, 萨里大学
打开封面
下载高清视频
观看高清视频
视频下载器
AI新突破!Meta提出URHand:手部重建和渲染!用手机即可实现快速定制化
实时人体动作捕捉!清华大学提出:融合单目图像和稀疏IMU信号以进行人体动作捕捉
LeCun点赞!腾讯重磅开源AIGC神器PhotoMaker:图像生成新方法
医学标注神器!ScriblePrompt:交互式医学图像分割框架,任用于任何医学图像!
爆火!牛津大学提出:超快速单视图3D重建新工作!3DGS再助力,一块GPU就能训练!
CVPR 2021 最佳论文提名!实时高分辨率图像抠图网络!4K 30FPS!太惊艳
爆火!高效4D生成新框架开源了!动作丝滑可控,极致加速渲染!
颠覆AI视频生成!这个AI神器史诗级更新!秒出4K高清大片,逼真到可怕!
SAM 2杀入医学图像分割!拿下2D/3D医学图像分割和医学视频分割!
超逼真3D城市生成!南洋理工提出CityDreamer:无限3D城市的组合生成模型
最新SOTA!MoMask:用于3D人体运动生成的掩码建模框架!太丝滑了!
3D生成一切!谷歌新作CAT3D:多视图扩散生成3D一切内容!收录顶会NeurIPS 2024!
爆火!字节跳动提出MagicAvatar:多模态Avatar生成和动画
YOLOv9杀疯了!最新的实时目标检测模型!代码已开源!
文本秒变3D!英伟达重磅提出LATTE3D:3D生成又快又好!
AI神器发布!谷歌重磅提出最强视频生成工作Lumiere:全能型视频生成神器
ICLR 2024 同步多视图扩散模型发布!SyncDreamer:从单视图图像生成多视图一致的图像
最大!第一个百万级3D视觉语言数据集SceneVerse发布!实现最先进的水平!
AI新突破!数字人全新工作GGHead:3D头部生成新框架!这质感太逼真了!
性能炸裂!让人脸动起来!微软新作VASA-1:实时生成逼真的音频驱动的说话人脸!
CVPR 2024 图像匹配新工作!浙大提出:无检测器SfM,斩获图像匹配挑战赛第一名!
AI绘画和ChatGPT强强联合!OpenAI重磅发布DALL·E 3多模态产品,文字生成图像细节爆炸!
新突破!大规模3D城市场景生成新工作!Urban Architect 代码刚刚开源!
特征匹配新范式!ICCV 2023 GlueStick:将点和线粘在一起实现稳健的图像匹配
超越3DGS!2DGS来了!收录顶会SIGGRAPH 2024!
ECCV 2024 太逼真!TexGen:3D纹理生成新框架!
英伟达4D生成新工作!使用爆火3D Gaussians和扩散进行文本转4D
Mini-DALLE3来了!交互式文本到图像生成真丝滑!
AI视频生成杀疯了!Gen-2:输入文字,直接生成视频!效果好到离谱!
爆火!谷歌提出InseRF:可插入万物的3D场景编辑,“无中生有”实现了!
讲座 | HiDiffusion:高效、无需训练的更高分辨率图像生成框架——旷视研究院高级研究员张慎
CVPR 2024 深度估计最强开源工作!Depth Anything刷新多个SOTA!
CVPR 2023 | 3D生成模型新工作!DATID-3D:用文本到图像扩散量身定制,代码刚刚开源!
数字人全新工作!3DGS杀入人脸渲染和重建!
AI视频生成新工作!腾讯放大招!点哪里,动哪里!
朱俊彦团队和Adobe新作:可控相机视角的图像生成模型!切换视点真丝滑啊!
NeurIPS 2023 手机上两秒生成图像!SnapFusion:最快的在移动设备上的文本到图像生成模型
AI可以生成3D主题乐园啦!3D角色和建筑批量生成!顶会SIGGRAPH 2024
傻逼星野图像生成
炸场!李飞飞联合谷歌提出视频生成新作W.A.L.T:使用扩散模型进行逼真视频生成