V
主页
京东 11.11 红包
20220914【视频理解研究进展与未来】寿政:大规模视频-语言预训练
发布人
报告嘉宾:寿政 (新加坡国立大学) 报告时间:2022年09月14日 (星期三)晚上20:30 (北京时间) 报告题目:大规模视频-语言预训练 报告人简介: Mike寿政,是新加坡国立大学 (NUS)助理教授、博导,Show Lab负责人。他在哥伦比亚大学获得博士学位,曾在Meta/ Facebook AI任研究科学家。他的主要研究方向为,视频理解和生成,多模态。他受邀担任一流学术会议如CVPR,ECCV,ACM Multimedia等的领域主席,曾获best paper finalist at CVPR'22, best student paper nomination at CVPR'17. 他带领团队在国际比赛中获得第一名,包括ActivityNet 2017, Ego4D 2022, EPIC-Kitchens 2022. 他当选新加坡国家科研基金委Fellow,入选福布斯30 Under 30亚洲区精英榜。 个人主页: https://sites.google.com/view/showlab 报告摘要: 多模态、大规模预训练模型,如OpenAI的CLIP,效果非常惊艳。Show Lab团队,聚焦在视频多模态上,最近开发了一系列的,大规模预训练模型,比如 (1) all-in-one,一个独立模型统一处理多种视频-语言任务,包括9个数据集4类任务;(2) EgoVLP,第一个第一视角的视频-语言预训练模型。这些预训练模型,在多类任务 (文本-视频检索,视频问答,动作识别,常识推理,时序定位等等),十几个数据集上取得了很好的进展。
打开封面
下载高清视频
观看高清视频
视频下载器
20220831【就正有道:物理机理驱动的图像恢复与增强】任文琦:融合先验知识的图像视频复原方法研究
20240731【多模态研究进展】徐偲:面向低质多模态数据的深度学习
20230329【多模态预训练的研究进展与未来】朱霖潮:多模态分析中的迁移与对齐技术
20230906【多模态行人重识别的研究进展与未来】丁长兴:细粒度、可泛化的行人重识别方法:从单模态到多模态
20231220【遥感数据处理的研究进展和未来展望】张洪艳:SinoLC-1:中国首幅1米分辨率土地覆盖图
20240925【大模型机理分析】邹荻凡:Transfomer 架构的运行机制研究:模型深度和多头注意力的作用
20240918【医学视觉语言大模型:进展与展望】周洪宇:Learning to diagnose whispers of the human body
20240424【空天智能感知】程塨:光学图像小目标检测
20210414【元学习研究的进展与未来】孟德宇:应对高光谱复杂噪声的加权模型:一种数据驱动的显式加权机制
20220615【AI for Science之物理信息驱动的深度学习】Panel
20210811【知其所以然:因果推理与学习】张含望:真正的无偏模型
20220413【脑启发视觉】张铁林:基于类脑脉冲神经网络的视听觉信息处理
【VALSE2024】0505 马月昕《特邀报告:三维场景理解的前世、今生与未来》
20210609【领域自适应方法与进展】Dengxin Dai:Domain Adaptation for Real-world Domain Changes
20220907【自动驾驶感知】李鸿升:MPPNet: Multi-Frame Feature Intertwining with Proxy Points……
20220629【比物连类:对比表示学习】宫明明:CRIS: CLIP-Driven Referring Image Segmentation
20210106 【视频技术理解】 王利民 视频人体动作识别与检测:方法与数据
20210811【知其所以然:因果推理与学习】Panel
20210414【元学习研究的进展与未来】王宇雄:Learning to Learn More with Less
20220316【基于领域知识的机器学习在医学影像分析中的应用】Panel
20200803-机器学习前沿进展 王立威《深度学习:从理论到算法》
20240717【面向事件相机的物体检测与跟踪】王逍:Visual Object Tracking using an Event Camera
20241009【视觉计算中的跨域和跨任务学习问题】赵知临:外分布机器学习理论与算法
20210804【图像复原研究进展与挑战】Panel
【VALSE2024】0507《Workshop :多模态大模型》
20210609【领域自适应方法与进展】Panel
20240417【视频生成与理解】罗平:Efficient Diffusion Transformer for Image and Video Generat…
20210714【弱监督视觉学习:定位、分割及其他】万方:Weakly Supervised Object Localization:From CNN to…
20220113 VALSE Student Webinar【论文写作那些事儿】王玫:科研路上的心得与体会
20200520 大规模医学图像中的计算与学习问题
【VALSE2024】0505 杨耀东《APR:从偏好对齐到价值对齐与超对齐》
20210826 特邀报告【自动深度学习的隐含因素—搜索空间】欧阳万里:自动深度学习的隐含因素—搜索空间
20200731-Valse Student Seminar 谢雨彤《A Mutual Bootstrapping Model for Automated……》
20220706【联邦学习在医学图像处理的应用】李霄霄:Federated learning for healthcare: from theory to……
20220907【自动驾驶感知】Panel
20220316【基于领域知识的机器学习在医学影像分析中的应用】秦璟:Rethink Deep Learning Models for Medical……
20230721 VALSE Student Webinar【开放视觉感知】刘世隆:From Detection to Grounding: A Path……
【推荐系统算法实战】通俗易懂!基于用户的协同过滤推荐算法实现简单在线电影、音乐、图书等推荐系统实战!(AI/人工智能/计算机视觉/深度学习/神经网络)
【VALSE2024】0505 杨易《特邀报告:混合模型驱动的内容生成与具身智能》
【VALSE论文速览-30期】基于并行解码的端到端密集视频描述