V
主页
京东 11.11 红包
太逼真了!Media2Face:多模态指导下的说话人脸动画生成
发布人
在CVer微信公众号后台回复:说话人脸,即可下载论文pdf和资料! Media2Face:多模态指导下的说话人脸动画生成,一种基于扩散的生成器,集成了各种媒体输入(音频、图像和文本),以驱动包括头部姿势在内的生动3D人脸动画,并提出GNPFA:一种高效的变分自编码器,还创建了 M2F-D 新数据集。单位:上科大, Deemos, 港大, DGene Digital
打开封面
下载高清视频
观看高清视频
视频下载器
快速跟踪一切!FastOmniTrack来了!不惧遮挡,彻底疯狂!
发型生成AI神器!细致到头发丝!HAAR:第一个逼真3D人体发型生成的文本条件扩散模型
阿里巴巴最新虚拟人来了!在几分钟内进行高质量文本到3D角色生成!
Gen-2最新AI功能发布!多运动笔刷:让你的图片动起来!太逼真!
AI再次进化!让人物开口说话!动漫里的角色都“活过来了”!
一键让你的头像说话、唱歌!清华&阿里提出DreamTalk:基于扩散模型的AIGC新工作
超越Pika!阿里提出AtomoVideo:视频生成新工作,看起来更丝滑了!
LeCun点赞!腾讯重磅开源AIGC神器PhotoMaker:图像生成新方法
AI杀疯了!谷歌刚刚发布视频生成的大语言模型VideoPoet!网友:这是魔法吧?
爆火!让人脸动起来!复旦和百度提出Hallo:人像动画化的视频生成新框架
AI视频生成杀疯了!Gen-2:输入文字,直接生成视频!效果好到离谱!
CVPR 2024 MotionEditor:首个面向动作编辑的视频扩散模型!厉不厉害你坤哥!
腾讯AI视频生成新工作!VideoCrafter2:手把手教你训练高质量视频生成模型
ECCV 2024 AI涨点神器!超越DINOv2!显著提升语义分割、深度估计性能!
YOLOv9杀疯了!最新的实时目标检测模型!代码已开源!
ECCV 2024 超越3DGS!3D场景重建新方法!WildGaussians:不惧遮挡和外观变化!
AI神器发布!超强的风格迁移工具!支持变换任何图像,过于丝滑!
AI可以生成3D主题乐园啦!3D角色和建筑批量生成!顶会SIGGRAPH 2024
AI再次进化!让人脸动起来!看坤坤唱Rap God很丝滑啊!
李宏毅:扩散模型原理解读
CVPR 2024 最佳论文候选!PlatoNeRF:三维重建新工作!发顶会好机会!
爆火!高效4D生成新框架开源了!动作丝滑可控,极致加速渲染!
OpenAI最新Sora视频生成作品合集!太疯狂了!
跟踪一切新工作!Meta和牛津大学提出CoTracker3:全新的跟踪一切模型!性能炸裂!
自动玩手机!新一代移动设备操作助手来了!Mobile-Agent-v2:全自动操纵你的App!
太逼真!数字人全新工作!神经参数高斯Avatars:你的第一个数字化身!
OpenAI发布最强模型:GPT-4o多模态大模型!又聪明速度又快,还免费用!人机交互新突破!
TripoSR:最强3D生成模型!3D重建速度真丝滑,代码还开源了!
CVPR 2024 最佳论文候选!谷歌新作:让万物动起来!看这花、这树叶、这火焰都动起来了!
无人机目标跟踪全新工作!AVTrack:实时高效性能表现SOTA!拿下ICML 2024!
新突破!一张图重建3D人体!Human-SGD收录顶会SIGGRAPH Asia 2023!
【李宏毅】2024年公认最好的扩散模型【Diffusion Model】教程!全程干货,通俗易懂,看完就跑通!-附带课件
YOLOP:你只需看一次全景驾驶感知!目标检测/可行驶区域分割和车道线检测三大视觉任务同时搞定
谷歌拿下ICML 2024 最佳论文!VideoPoet:视频生成的大语言模型
跟踪一切!密集光流跟踪(DOT):同时跟踪所有像素!又快又好!
这个AI杀疯了!NVIDIA提出FoundationPose:6D姿态估计和跟踪的统一基础模型
大规模3D场景生成全新工作!LT3SD:扩散模型杀疯了!
ECCV 2024 Meta数字人新工作!照片般逼真、均匀照明、完整的Avatars!
精细到发丝!这个抠图网络连动物图像都能抠!
苏黎世联邦理工学院提出文本驱动运动控制扩散模型DART(今日Arxiv 10月8日)2024年10月8日Arxiv cs.CV发文量约186余篇