20220420【点云场景理解】弋力：面向交互的四维动态场景理解

发布人

报告嘉宾：弋力 (清华大学)
报告时间：2022年04月20日 (星期三)晚上20:00 (北京时间)
报告题目：面向交互的四维动态场景理解
报告人简介：
弋力博士，现任清华大学交叉信息研究院助理教授，兼职上海期智研究院杰出科学家。他在斯坦福大学取得博士学位，导师为Leonidas J.Guibas教授，毕业后在谷歌研究院任研究科学家。在此之前，他在清华大学电子工程系取得了学士学位。他的研究兴趣涵盖三维感知、计算机图形学和形状分析，他的研究目标是使机器人代理具备理解三维世界并与之互动的能力。他在CVPR/ ICCV/ ECCV/ NeurIPS/ SIGGRAPH/ SIGGRAPH Asia等顶级会议发表三十余篇论文，并担任CVPR 2022领域主席。他的工作在领域内得到广泛关注，引用数达9000+，代表作品包括ShapeNet, SyncSpecCNN, PointNet++等。
个人主页：
https://ericyi.github.io/
报告摘要：
三维计算机视觉近年来快速发展，在诸如三维检测、三维分割等静态场景理解任务中取得了巨大的进步。然而静态场景理解只是场景感知中很有限的一部分，越来越多诸如家用机器人、增强现实等重大应用需要从第一人称视角对于与场景的动态交互进行感知，亦或是感知可以支持与场景交互的有效信息，这给现如今的三维感知系统带来了新的挑战。为了应对这些挑战，我们从数据集、骨干网络设计、感知应用三个层面聚焦面向交互的四维动态场景理解。数据层面，考虑到现有数据集的局限性，我的团队构建了第一个大规模4D类别级人-物交互数据集HOI4D，从第一人称视角对真实场景中人-物的动态交互过程进行了采集捕捉，并提供了4D场景全景分割、手势、物体类别级位姿、视频分割等详细标注信息，用以支持面向交互的动态场景感知。骨干网络设计层面，为了更好的支持基于4D点云序列的深度学习，我们设计了新型网络架构用以有效的对高维数据中的长程信息进行建模。感知应用层面，我将展示我们如何以可泛化的方式对动态场景中的部件信息进行感知，以便更好的支持和物体的操作交互。
参考文献：
[1] Yunze Liu*, Yun Liu*, Che Jiang, Kangbo Lyu, Weikang Wan, Hao Shen, Boqiang Liang, Zhoujie Fu, He Wang, Li Yi. HOI4D: A 4D Egocentric Dataset for Category-Level Human-Object Interaction. CVPR 2022.
[2] Xueyi Liu, Xiaomeng Xu, Anyi Rao, Chuang Gan, Li Yi. AutoGPart: Intermediate Supervision Search for Generalizable 3D Part Segmentation. CVPR 2022.

打开封面下载高清视频观看高清视频视频下载器

20220420【点云场景理解】弋力：面向交互的四维动态场景理解

20220420【点云场景理解】Panel

【VALSE2024】0505 林倞《APR：面向具身智能的多模态感知与交互》

20220413【脑启发视觉】余肇飞：面向类脑视觉的生物视觉编解码机制和模型

20220413【脑启发视觉】Panel

20220105【标签噪声学习专题论坛】冯磊：噪声标记学习的鲁棒损失与算法框架

【VALSE2024】0505 吴小俊《特邀报告：多模态视觉融合方法：是否存在性能极限？》

20220105【标签噪声学习专题论坛】Panel

【VALSE2024】0505 王兴刚《APR：面向大模型的新型高效率网络架构》

【VALSE论文速览-19期】基于Transformer的视觉目标跟踪

20210428【可解释机器学习-知其所以然】周博磊：生成模型的可解释性与交互内容创作

20211229【基于神经表示的三维建模与渲染】许岚：基于神经网络的人体动态捕捉与渲染

20201223 深度模型架构设计与优化

20220323【我要找到你：2D/3D物体检测和定位】陈挺：Pix2seq: A Language Modeling Framework for……

20240605【Prompt Learning in Vision】陈广义:Prompt Learning Meets Dense Context for …

20210714【弱监督视觉学习：定位、分割及其他】万方：Weakly Supervised Object Localization：From CNN to…

【VALSE论文速览-80期】Exploring Cross-Image Pixel Contrast for Semantic Segmentation

20220323【我要找到你：2D/3D物体检测和定位】贺通：3D instance segmentation with dynamic convolution

20220608特邀报告【如何更好地理解对比学习】田渊栋 (Meta AI Research (FAIR))

20211021【Transformer在医学图像处理的应用】Panel

20211021【Transformer在医学图像处理的应用】付华柱：Transformers 在多模态 MR 成像中的应用

20220316【基于领域知识的机器学习在医学影像分析中的应用】秦璟：Rethink Deep Learning Models for Medical……

20210331【物体检测与视觉定位】李文：领域自适应的目标检测

20220112【脉络分明：脉冲神经网络及其应用】余肇飞：脉冲神经网络学习理论与方法

【VLASE论文速览-79期】Rethinking Semantic Segmentation: A Prototype View

20230906【多模态行人重识别的研究进展与未来】叶茫：多模态行人重识别进展与挑战

20220123 VALSE Student Webinar【坐而论道or绝地反击：如何进行一次成功的Rebuttal】陶仁帅：如何写好一个 Rebuttal

【VALSE论文速览-75期】联合分布很重要：深度布朗距离协方差用于少样本识别

20211215【学无止境：深度连续学习】李玺：基于深度神经网络的持续性学习理论与方法

【VALSE2024】0506《Workshop ：具身智能的视觉与学习》

20210818【心中的象牙塔：怎样才能拿到理想的教职offer？】刘希慧：博士阶段的经历和感悟分享

20210811【知其所以然：因果推理与学习】张含望：真正的无偏模型

【VALSE论文速览-40期】类别解耦及其在对抗样本的检测和防御中的应用

20240731【多模态研究进展】张晓堃：浅谈多模态会话推荐系统

20230329【多模态预训练的研究进展与未来】宋睿华：多模态预训练模型及在智能创作领域的应用

【VALSE论文速览-38期】面向损坏不变性的行人重识别基准

20200801-目标检测、跟踪和分割 王瑞平《视觉场景图―表示、生成与应用》

20240814【多模态医学图像处理及医学大模型的发展近况】王连生：病理数据的多模态分析

20210915【兼听则明：多源异构数据协同技术】朱磊：Multi-modal Hash Representation Learning

【VALSE论文速览-54期】Learngene：从开放世界到目标学习任务

20220706【联邦学习在医学图像处理的应用】李霄霄：Federated learning for healthcare: from theory to……

20200801-目标检测、跟踪和分割王瑞平《视觉场景图―表示、生成与应用》