20220914【视频理解研究进展与未来】寿政：大规模视频-语言预训练

发布人

报告嘉宾：寿政 (新加坡国立大学)
报告时间：2022年09月14日 (星期三)晚上20:30 (北京时间)
报告题目：大规模视频-语言预训练
报告人简介：
Mike寿政，是新加坡国立大学 (NUS)助理教授、博导，Show Lab负责人。他在哥伦比亚大学获得博士学位，曾在Meta/ Facebook AI任研究科学家。他的主要研究方向为，视频理解和生成，多模态。他受邀担任一流学术会议如CVPR，ECCV，ACM Multimedia等的领域主席，曾获best paper finalist at CVPR&#39;22, best student paper nomination at CVPR&#39;17. 他带领团队在国际比赛中获得第一名，包括ActivityNet 2017, Ego4D 2022, EPIC-Kitchens 2022. 他当选新加坡国家科研基金委Fellow，入选福布斯30 Under 30亚洲区精英榜。
个人主页：
https://sites.google.com/view/showlab
报告摘要：
多模态、大规模预训练模型，如OpenAI的CLIP，效果非常惊艳。Show Lab团队，聚焦在视频多模态上，最近开发了一系列的，大规模预训练模型，比如 (1) all-in-one，一个独立模型统一处理多种视频-语言任务，包括9个数据集4类任务；(2) EgoVLP，第一个第一视角的视频-语言预训练模型。这些预训练模型，在多类任务 (文本-视频检索，视频问答，动作识别，常识推理，时序定位等等)，十几个数据集上取得了很好的进展。

打开封面下载高清视频观看高清视频视频下载器

20220914【视频理解研究进展与未来】寿政：大规模视频-语言预训练

20220831【就正有道：物理机理驱动的图像恢复与增强】任文琦：融合先验知识的图像视频复原方法研究

20240731【多模态研究进展】徐偲：面向低质多模态数据的深度学习

20230329【多模态预训练的研究进展与未来】朱霖潮：多模态分析中的迁移与对齐技术

20230906【多模态行人重识别的研究进展与未来】丁长兴：细粒度、可泛化的行人重识别方法：从单模态到多模态

20231220【遥感数据处理的研究进展和未来展望】张洪艳：SinoLC-1：中国首幅1米分辨率土地覆盖图

20240925【大模型机理分析】邹荻凡：Transfomer 架构的运行机制研究：模型深度和多头注意力的作用

20240918【医学视觉语言大模型：进展与展望】周洪宇：Learning to diagnose whispers of the human body

20240424【空天智能感知】程塨：光学图像小目标检测

20210414【元学习研究的进展与未来】孟德宇：应对高光谱复杂噪声的加权模型：一种数据驱动的显式加权机制

20220615【AI for Science之物理信息驱动的深度学习】Panel

20210811【知其所以然：因果推理与学习】张含望：真正的无偏模型

20220413【脑启发视觉】张铁林：基于类脑脉冲神经网络的视听觉信息处理

【VALSE2024】0505 马月昕《特邀报告：三维场景理解的前世、今生与未来》

20210609【领域自适应方法与进展】Dengxin Dai：Domain Adaptation for Real-world Domain Changes

20220907【自动驾驶感知】李鸿升：MPPNet: Multi-Frame Feature Intertwining with Proxy Points……

20220629【比物连类：对比表示学习】宫明明：CRIS: CLIP-Driven Referring Image Segmentation

20210106 【视频技术理解】 王利民 视频人体动作识别与检测：方法与数据

20210811【知其所以然：因果推理与学习】Panel

20210414【元学习研究的进展与未来】王宇雄：Learning to Learn More with Less

20220316【基于领域知识的机器学习在医学影像分析中的应用】Panel

20200803-机器学习前沿进展 王立威《深度学习：从理论到算法》

20240717【面向事件相机的物体检测与跟踪】王逍：Visual Object Tracking using an Event Camera

20241009【视觉计算中的跨域和跨任务学习问题】赵知临：外分布机器学习理论与算法

20210804【图像复原研究进展与挑战】Panel

【VALSE2024】0507《Workshop ：多模态大模型》

20210609【领域自适应方法与进展】Panel

20240417【视频生成与理解】罗平：Efficient Diffusion Transformer for Image and Video Generat…

20210714【弱监督视觉学习：定位、分割及其他】万方：Weakly Supervised Object Localization：From CNN to…

20220113 VALSE Student Webinar【论文写作那些事儿】王玫：科研路上的心得与体会

20200520 大规模医学图像中的计算与学习问题

【VALSE2024】0505 杨耀东《APR：从偏好对齐到价值对齐与超对齐》

20210826 特邀报告【自动深度学习的隐含因素—搜索空间】欧阳万里：自动深度学习的隐含因素—搜索空间

20200731-Valse Student Seminar 谢雨彤《A Mutual Bootstrapping Model for Automated……》

20220706【联邦学习在医学图像处理的应用】李霄霄：Federated learning for healthcare: from theory to……

20220907【自动驾驶感知】Panel

20220316【基于领域知识的机器学习在医学影像分析中的应用】秦璟：Rethink Deep Learning Models for Medical……

20230721 VALSE Student Webinar【开放视觉感知】刘世隆：From Detection to Grounding: A Path……

【推荐系统算法实战】通俗易懂！基于用户的协同过滤推荐算法实现简单在线电影、音乐、图书等推荐系统实战！（AI/人工智能/计算机视觉/深度学习/神经网络）

【VALSE2024】0505 杨易《特邀报告：混合模型驱动的内容生成与具身智能》

【VALSE论文速览-30期】基于并行解码的端到端密集视频描述

20210106 【视频技术理解】王利民视频人体动作识别与检测：方法与数据

20200803-机器学习前沿进展王立威《深度学习：从理论到算法》