太逼真了！Media2Face：多模态指导下的说话人脸动画生成 - 视频下载 Video Downloader

京东 11.11 红包

太逼真了！Media2Face：多模态指导下的说话人脸动画生成

发布人

在CVer微信公众号后台回复：说话人脸，即可下载论文pdf和资料！

Media2Face：多模态指导下的说话人脸动画生成，一种基于扩散的生成器，集成了各种媒体输入(音频、图像和文本)，以驱动包括头部姿势在内的生动3D人脸动画，并提出GNPFA：一种高效的变分自编码器，还创建了 M2F-D 新数据集。单位：上科大, Deemos, 港大, DGene Digital

打开封面下载高清视频观看高清视频视频下载器

快速跟踪一切！FastOmniTrack来了！不惧遮挡，彻底疯狂！

发型生成AI神器！细致到头发丝！HAAR：第一个逼真3D人体发型生成的文本条件扩散模型

阿里巴巴最新虚拟人来了！在几分钟内进行高质量文本到3D角色生成！

Gen-2最新AI功能发布！多运动笔刷：让你的图片动起来！太逼真！

AI再次进化！让人物开口说话！动漫里的角色都“活过来了”！

一键让你的头像说话、唱歌！清华&阿里提出DreamTalk：基于扩散模型的AIGC新工作

超越Pika！阿里提出AtomoVideo：视频生成新工作，看起来更丝滑了！

LeCun点赞！腾讯重磅开源AIGC神器PhotoMaker：图像生成新方法

AI杀疯了！谷歌刚刚发布视频生成的大语言模型VideoPoet！网友：这是魔法吧？

爆火！让人脸动起来！复旦和百度提出Hallo：人像动画化的视频生成新框架

AI视频生成杀疯了！Gen-2：输入文字，直接生成视频！效果好到离谱！

CVPR 2024 MotionEditor：首个面向动作编辑的视频扩散模型！厉不厉害你坤哥！

腾讯AI视频生成新工作！VideoCrafter2：手把手教你训练高质量视频生成模型

ECCV 2024 AI涨点神器！超越DINOv2！显著提升语义分割、深度估计性能！

YOLOv9杀疯了！最新的实时目标检测模型！代码已开源！

ECCV 2024 超越3DGS！3D场景重建新方法！WildGaussians：不惧遮挡和外观变化！

AI神器发布！超强的风格迁移工具！支持变换任何图像，过于丝滑！

AI可以生成3D主题乐园啦！3D角色和建筑批量生成！顶会SIGGRAPH 2024

AI再次进化！让人脸动起来！看坤坤唱Rap God很丝滑啊！

李宏毅：扩散模型原理解读

CVPR 2024 最佳论文候选！PlatoNeRF：三维重建新工作！发顶会好机会！

爆火！高效4D生成新框架开源了！动作丝滑可控，极致加速渲染！

OpenAI最新Sora视频生成作品合集！太疯狂了！

跟踪一切新工作！Meta和牛津大学提出CoTracker3：全新的跟踪一切模型！性能炸裂！

自动玩手机！新一代移动设备操作助手来了！Mobile-Agent-v2：全自动操纵你的App！

太逼真！数字人全新工作！神经参数高斯Avatars：你的第一个数字化身！

OpenAI发布最强模型：GPT-4o多模态大模型！又聪明速度又快，还免费用！人机交互新突破！

TripoSR：最强3D生成模型！3D重建速度真丝滑，代码还开源了！

CVPR 2024 最佳论文候选！谷歌新作：让万物动起来！看这花、这树叶、这火焰都动起来了！

无人机目标跟踪全新工作！AVTrack：实时高效性能表现SOTA！拿下ICML 2024！

新突破！一张图重建3D人体！Human-SGD收录顶会SIGGRAPH Asia 2023！

【李宏毅】2024年公认最好的扩散模型【Diffusion Model】教程！全程干货，通俗易懂，看完就跑通！-附带课件

YOLOP：你只需看一次全景驾驶感知！目标检测/可行驶区域分割和车道线检测三大视觉任务同时搞定

谷歌拿下ICML 2024 最佳论文！VideoPoet：视频生成的大语言模型

跟踪一切！密集光流跟踪(DOT)：同时跟踪所有像素！又快又好！

这个AI杀疯了！NVIDIA提出FoundationPose：6D姿态估计和跟踪的统一基础模型

大规模3D场景生成全新工作！LT3SD：扩散模型杀疯了！

ECCV 2024 Meta数字人新工作！照片般逼真、均匀照明、完整的Avatars！

精细到发丝！这个抠图网络连动物图像都能抠！

苏黎世联邦理工学院提出文本驱动运动控制扩散模型DART（今日Arxiv 10月8日）2024年10月8日Arxiv cs.CV发文量约186余篇