V
主页
20240403【以人为中心的生成、感知与决策】晏轶超:三维数字人的重建、编辑与驱动研究
发布人
报告嘉宾:晏轶超 (上海交通大学) 报告时间:2024年4月3日 (星期三)晚上20:00 (北京时间) 报告题目:三维数字人的重建、编辑与驱动研究 报告人简介: 晏轶超,上海交通大学人工智能研究院助理教授,博士生导师。获上海交通大学电子工程系学士、博士学位,法国里昂中央理工学院硕士学位,曾担任阿联酋起源人工智能研究院研究科学家。主要研究方向为计算机视觉、图形学技术及其在虚拟现实、数字多媒体中的应用,发表包括TPAMI、CVPR、NeurIPS在内的国际高水平论文20余篇,Google Scholar 引用超过1800次,担任TPAMI、IJCV、CVPR、ICCV等十余个国际顶级会议与期刊审稿专家。先后主持国家自然科学基金青年项目、CCF-阿里巴巴青年科学家基金等项目5项。曾入选上海市海外高层次人才计划,获2020年度中国图象图形学学会优秀博士论文奖。 个人主页: https://daodaofr.github.io/ 报告摘要: 面对大规模三维数字人的生产需求, 基于传统图形学的建模过程繁琐、周期冗长,阻碍了虚拟数字人的普及和应用,而利用生成式人工智能技术产生高拟真,规模化的虚拟数字人正逐渐成为研究热点。预计到2025年,人工智能产生的数据将占所有新生数据的10%。如何利用生成式人工智能技术生成虚拟数字人,存在哪些技术难点,本次报告将介绍课题组在数字人建模领域的最近进展。 参考文献: [1] Xingyu Ren, Jiankang Deng, Chao Ma, Yichao Yan, Xiaokang Yang, "Improving Fairness in Facial Albedo Estimation via Visual-Textual Cues", CVPR 2023. [2] Yuhao Cheng, Zhuo Chen, Xingyu Ren, Wenhan Zhu, Zhengqin Xu, Di Xu, Changpeng Yang, Yichao Yan, "3D-Aware Face Editing via Warping-Guided Latent Direction Learning", CVPR 2024 [3] Liang Xu, Yizhou Zhou, Yichao Yan, Xin Jin, Wenhan Zhu, Fengyun Rao, Xiaokang Yang, Wenjun Zeng, "ReGenNet: Towards Human Action-Reaction Synthesis", CVPR 2024 [4] Liang Xu, Xintao Lv, Yichao Yan, Xin Jin, Shuwen Wu, Congsheng Xu, Yifan Liu, Yizhou Zhou, Fengyun Rao, Xingdong Sheng, Yunhui Liu, Wenjun Zeng, Xiaokang Yang, "Inter-X: Towards Versatile Human-Human Interaction Analysis", CVPR 2024
打开封面
下载高清视频
观看高清视频
视频下载器
20210414【元学习研究的进展与未来】孟德宇:应对高光谱复杂噪声的加权模型:一种数据驱动的显式加权机制
20230607【开放世界的感知:探索可迁移与可持续学习之路】巩东:Continual Learning and Memory Augmentation……
20230329【多模态预训练的研究进展与未来】朱霖潮:多模态分析中的迁移与对齐技术
数字人故事
【VALSE2024】0505 李鸿升《特邀报告:图像生成和视频生成若干前沿技术探索》
20230906【多模态行人重识别的研究进展与未来】叶茫:多模态行人重识别进展与挑战
20230531【大模型时代下的三维视觉:路在何方?】阳行意:Anything-3D-基于模型重用的任意物体的3D重建
20240417【视频生成与理解】罗平:Efficient Diffusion Transformer for Image and Video Generat…
本地智能数字人制作方法,无需联网,永久使用
20210811【知其所以然:因果推理与学习】张含望:真正的无偏模型
MusePose 数字人跳舞,骨骼姿势模仿,只需一张图,轻松生成完美视频!
20230816【数字虚拟人的研究进展与未来】韩晓光:基于图像的三维毛发重建
20200527 图像质量评价:感知建模VS机器学习
20230913【图神经网络理论与算法】石川:自监督图神经网络
20211222【自动驾驶中的机器视觉与学习问题】赵行:环视自动驾驶感知
惊人创新!EchoMimic 让照片变出声视频,AI数字人视频一键生成,可用于AI数字人生成,EchoMimic 本地一键整合包下载
20210106 【视频技术理解】 王利民 视频人体动作识别与检测:方法与数据
【VALSE2024】0505 杨易《特邀报告:混合模型驱动的内容生成与具身智能》
20211124【标记高效的视觉学习】张鼎文:弱监督目标检测理论与方法初探
20220113 VALSE Student Webinar【论文写作那些事儿】王玫:科研路上的心得与体会
免费制作能唱歌的数字人 一张图片就能生成数字人 静态图片口型驱动 每次可生成30秒音频 口型自然 会动眼睛
20200610 图像复原-去伪存真
20210714【弱监督视觉学习:定位、分割及其他】Panel
ai数字人视频免费生成?
20210421【无师自通:自监督学习】山世光:利用解耦-验算思想的自监督学习
20200429 深度目标检测
【VALSE论文速览-10期】GraspNet-1Billion:机器人通用物体抓取的新方法论
20210609【领域自适应方法与进展】Dengxin Dai:Domain Adaptation for Real-world Domain Changes
20210128 VALSE Student Webinar【医学影像:大规模数据的机遇与挑战】周纵苇 视觉的目的是什么?
20231206【三维大模型探索】白磊:风乌 - 人工智能驱动的3D大气数据建模及应用
20200401 数据不完美,算法显神威——弱监督机器学习专题论坛
20200916 源头活水:自监督与无监督学习探讨
【VALSE2024】0506《Workshop :具身智能的视觉与学习》
20220615【AI for Science之物理信息驱动的深度学习】Panel
【VALSE2024】0507《Workshop :多模态大模型》
20200624 点云深度学习:多一维看世界
20210414【元学习研究的进展与未来】王宇雄:Learning to Learn More with Less
20210925【我AI的offer——大厂求职篇】Panel
20220914【视频理解研究进展与未来】Panel
【VALSE2024】0505 吴小俊《特邀报告:多模态视觉融合方法:是否存在性能极限?》