20240403【以人为中心的生成、感知与决策】晏轶超：三维数字人的重建、编辑与驱动研究

发布人

报告嘉宾：晏轶超 (上海交通大学)
报告时间：2024年4月3日 (星期三)晚上20:00 (北京时间)
报告题目：三维数字人的重建、编辑与驱动研究

报告人简介：
晏轶超，上海交通大学人工智能研究院助理教授，博士生导师。获上海交通大学电子工程系学士、博士学位，法国里昂中央理工学院硕士学位，曾担任阿联酋起源人工智能研究院研究科学家。主要研究方向为计算机视觉、图形学技术及其在虚拟现实、数字多媒体中的应用，发表包括TPAMI、CVPR、NeurIPS在内的国际高水平论文20余篇，Google Scholar 引用超过1800次，担任TPAMI、IJCV、CVPR、ICCV等十余个国际顶级会议与期刊审稿专家。先后主持国家自然科学基金青年项目、CCF-阿里巴巴青年科学家基金等项目5项。曾入选上海市海外高层次人才计划，获2020年度中国图象图形学学会优秀博士论文奖。

个人主页：
https://daodaofr.github.io/

报告摘要：
面对大规模三维数字人的生产需求， 基于传统图形学的建模过程繁琐、周期冗长，阻碍了虚拟数字人的普及和应用，而利用生成式人工智能技术产生高拟真，规模化的虚拟数字人正逐渐成为研究热点。预计到2025年，人工智能产生的数据将占所有新生数据的10%。如何利用生成式人工智能技术生成虚拟数字人，存在哪些技术难点，本次报告将介绍课题组在数字人建模领域的最近进展。

参考文献：
[1] Xingyu Ren, Jiankang Deng, Chao Ma, Yichao Yan, Xiaokang Yang, &quot;Improving Fairness in Facial Albedo Estimation via Visual-Textual Cues&quot;, CVPR 2023.
[2] Yuhao Cheng, Zhuo Chen, Xingyu Ren, Wenhan Zhu, Zhengqin Xu, Di Xu, Changpeng Yang, Yichao Yan, &quot;3D-Aware Face Editing via Warping-Guided Latent Direction Learning&quot;, CVPR 2024
[3] Liang Xu, Yizhou Zhou, Yichao Yan， Xin Jin, Wenhan Zhu, Fengyun Rao, Xiaokang Yang, Wenjun Zeng, &quot;ReGenNet: Towards Human Action-Reaction Synthesis&quot;, CVPR 2024
[4] Liang Xu, Xintao Lv, Yichao Yan, Xin Jin, Shuwen Wu, Congsheng Xu, Yifan Liu, Yizhou Zhou, Fengyun Rao, Xingdong Sheng, Yunhui Liu, Wenjun Zeng, Xiaokang Yang, &quot;Inter-X: Towards Versatile Human-Human Interaction Analysis&quot;, CVPR 2024

打开封面下载高清视频观看高清视频视频下载器

20240403【以人为中心的生成、感知与决策】晏轶超：三维数字人的重建、编辑与驱动研究

20210414【元学习研究的进展与未来】孟德宇：应对高光谱复杂噪声的加权模型：一种数据驱动的显式加权机制

20230607【开放世界的感知：探索可迁移与可持续学习之路】巩东：Continual Learning and Memory Augmentation……

20230329【多模态预训练的研究进展与未来】朱霖潮：多模态分析中的迁移与对齐技术

数字人故事

【VALSE2024】0505 李鸿升《特邀报告：图像生成和视频生成若干前沿技术探索》

20230906【多模态行人重识别的研究进展与未来】叶茫：多模态行人重识别进展与挑战

20230531【大模型时代下的三维视觉：路在何方？】阳行意：Anything-3D-基于模型重用的任意物体的3D重建

20240417【视频生成与理解】罗平：Efficient Diffusion Transformer for Image and Video Generat…

本地智能数字人制作方法，无需联网，永久使用

20210811【知其所以然：因果推理与学习】张含望：真正的无偏模型

MusePose 数字人跳舞，骨骼姿势模仿，只需一张图，轻松生成完美视频！

20230816【数字虚拟人的研究进展与未来】韩晓光：基于图像的三维毛发重建

20200527 图像质量评价：感知建模VS机器学习

20230913【图神经网络理论与算法】石川：自监督图神经网络

20211222【自动驾驶中的机器视觉与学习问题】赵行：环视自动驾驶感知

惊人创新！EchoMimic 让照片变出声视频，AI数字人视频一键生成，可用于AI数字人生成，EchoMimic 本地一键整合包下载

20210106 【视频技术理解】 王利民 视频人体动作识别与检测：方法与数据

【VALSE2024】0505 杨易《特邀报告：混合模型驱动的内容生成与具身智能》

20211124【标记高效的视觉学习】张鼎文：弱监督目标检测理论与方法初探

20220113 VALSE Student Webinar【论文写作那些事儿】王玫：科研路上的心得与体会

免费制作能唱歌的数字人 一张图片就能生成数字人 静态图片口型驱动 每次可生成30秒音频 口型自然 会动眼睛

20200610 图像复原-去伪存真

20210714【弱监督视觉学习：定位、分割及其他】Panel

ai数字人视频免费生成？

20210421【无师自通：自监督学习】山世光：利用解耦-验算思想的自监督学习

20200429 深度目标检测

【VALSE论文速览-10期】GraspNet-1Billion：机器人通用物体抓取的新方法论

20210609【领域自适应方法与进展】Dengxin Dai：Domain Adaptation for Real-world Domain Changes

20210128 VALSE Student Webinar【医学影像：大规模数据的机遇与挑战】周纵苇 视觉的目的是什么？

20231206【三维大模型探索】白磊：风乌 - 人工智能驱动的3D大气数据建模及应用

20200401 数据不完美，算法显神威——弱监督机器学习专题论坛

20200916 源头活水：自监督与无监督学习探讨

【VALSE2024】0506《Workshop ：具身智能的视觉与学习》

20220615【AI for Science之物理信息驱动的深度学习】Panel

【VALSE2024】0507《Workshop ：多模态大模型》

20200624 点云深度学习：多一维看世界

20210414【元学习研究的进展与未来】王宇雄：Learning to Learn More with Less

20210925【我AI的offer——大厂求职篇】Panel

20220914【视频理解研究进展与未来】Panel

【VALSE2024】0505 吴小俊《特邀报告：多模态视觉融合方法：是否存在性能极限？》

20210106 【视频技术理解】王利民视频人体动作识别与检测：方法与数据

免费制作能唱歌的数字人一张图片就能生成数字人静态图片口型驱动每次可生成30秒音频口型自然会动眼睛

20210128 VALSE Student Webinar【医学影像：大规模数据的机遇与挑战】周纵苇视觉的目的是什么？