V
主页
20230419【知识嵌入的跨模态学习】王文冠:Knowledge-Driven Perception
发布人
报告嘉宾:王文冠 (浙江大学) 报告时间:2023年04月19日 (星期三)晚上20:00 (北京时间) 报告题目:Knowledge-Driven Perception 报告人简介: 王文冠,浙江大学计算机学院百人计划研究员,博士生导师,国家优秀青年基金 (海外)获得者。2022∼2023年, 任悉尼科技大学 (University of Technology Sydney)讲师。2020∼2022 年, 任苏黎世联邦理工学院 (ETH Zurich)博后研究员。2018∼2019年,先后任起源人工智能研究院 (IIAI)研究员和资深研究员。2016∼2018年在加州大学洛杉矶分校 (UCLA)访学。2018年博士毕业于北京理工大学。主要研究方向为计算机视觉和人工智能。在顶级期刊和会议 (如TPAMI、IJCV、ICLR、NeurIPS、CVPR、ICCV、ECCV、AAAI、Siggraph sia)发表学术论文80多篇。谷歌学术引用12, 300余次,H指数56。曾获澳大利亚研究理事会 (Australian Research Council,ARC)优秀青年基金 (Discovery Early Career Researcher Award,DECRA) (2022年)、Elsevier高被引中国学者 (2020∼2022年),世界人工智能大会优秀青年论文奖 (2020年)、中国人工智能学会优博奖 (2019年),ACM中国优博奖 (2018年)。 个人主页: https://sites.google.com/view/wenguanwang/ 报告摘要: Studies in cognition suggest that our perception works at multiple levels of abstraction, intertwined with effective reasoning through manipulation of symbolic knowledge/concepts. In contrast, our current visual recognition models are typically blind to the structured nature of the visual world and purely data-driven parametric classifiers. Filling the gaps identified above calls for a fundamental paradigm shift: i) moving away from `flat' label classification towards class structure-aware semantic parsing; and ii) moving away from the extreme of fully parametric learning towards an ambitious hybrid of distributed representation learning and visual knowledge/concept based reasoning. In this talk, I will represent our latest research along the two dimensions of such paradigm shift. This talk will be concluded by examining the topic with an open and enquiring flavor, teasing apart open challenges in the journey of building knowledge-driven perception. 参考文献: [1] Deep Hierarchical Semantic Segmentation, CVPR, 2022 [2] Visual Recognition with Deep Nearest Centroids, ICLR, 2023 (Spotlight)
打开封面
下载高清视频
观看高清视频
视频下载器
20240731【多模态研究进展】张晓堃:浅谈多模态会话推荐系统
【VALSE2024】0507《Workshop :多模态大模型》
20230329【多模态预训练的研究进展与未来】宋睿华:多模态预训练模型及在智能创作领域的应用
【VALSE2024】0505 吴小俊《特邀报告:多模态视觉融合方法:是否存在性能极限?》
20230607【开放世界的感知:探索可迁移与可持续学习之路】巩东:Continual Learning and Memory Augmentation……
20230906【多模态行人重识别的研究进展与未来】叶茫:多模态行人重识别进展与挑战
我竟然半天学会了六大深度神经网络:CNN、RNN、GAN、GNN、LSTM、Transformer,计算机博士一次带你吃透入门到实战!
【Agent2024最新】Agent零基础入门到实战精通,手把手教你搭建企业级Agent智能体,底层原理技术讲解+项目案例解析+附上源码
还得看吴恩达!一口气讲透CNN、RNN、GAN、LSTM、YOLO、transformer等六大深度学习神经网路算法!真的不要太爽~(AI人工智能丨机器学习)
2024年超好用的九大AI工具!免费且强大!(下集)
20240828【医学多模态分析与研究:从传统模型到大模型的演变】刘明霞:多中心多模态脑影像智能分析及应用研究
20240605【Prompt Learning in Vision】陈广义:Prompt Learning Meets Dense Context for …
20230531【大模型时代下的三维视觉:路在何方?】杨波:3D Semantic and Instance Segmentation without 3D……
20210421【无师自通:自监督学习】田渊栋:Understanding representation learning without negative……
20240814【多模态医学图像处理及医学大模型的发展近况】王连生:病理数据的多模态分析
20210714【弱监督视觉学习:定位、分割及其他】万方:Weakly Supervised Object Localization:From CNN to…
20240814【多模态医学图像处理及医学大模型的发展近况】沈为:基于辐射场的内窥镜手术场景三维高效重建
【VALSE2024】0505 赵恒爽《APR:视觉基础大模型》
常见20种验证码识别思路
20230531【大模型时代下的三维视觉:路在何方?】Panel
20210811【知其所以然:因果推理与学习】崔鹏:因果启发的稳定学习
20240417【视频生成与理解】罗平:Efficient Diffusion Transformer for Image and Video Generat…
【VALSE论文速览-68期】MixFormer:更加简洁的端到端单目标跟踪器
20240522【计算机辅助诊疗:过去,现在和未来】骆路阳:Understanding and Learning from Imperfect Medical
20210818【心中的象牙塔:怎样才能拿到理想的教职offer?】刘希慧:博士阶段的经历和感悟分享
20210127 【物以类聚人以群分:聚类分析的一些挑战和进展】 彭玺 深度聚类:从“模态非完全对齐聚类”到“对比聚类”
【122集付费!】CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络一口气全部学完!
20230322【大规模预训练模型的可信性】Panel
20240821【AI for Neuroscience, what and how?】Panel
【VALSE论文速览-94期】Learning Domain Adaptive Object Detection with Probabilistic……
这才是科研该学!2024公认最通俗易懂的【深度学习】教程,从入门到精通一口气学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM
20240327【多模态大模型的前身与今世】叶翰嘉:基于大语言模型的CLIP零样本分类
20230524【大模型背景下的多媒体智能检索】董建锋:多粒度多媒体智能检索
20220420【点云场景理解】弋力:面向交互的四维动态场景理解
【无废话】3小时带你快速入门PyTorch深度学习!--人工智能/深度学习/PyTorch
20221012【自监督表示学习及其应用】陈小军:Self-supervised Image Clustering
20210324【图像视频分割】沈春华 Instance Segmentation Made Simple
20211021【Transformer在医学图像处理的应用】付华柱:Transformers 在多模态 MR 成像中的应用
【VALSE2024】0505 马月昕《特邀报告:三维场景理解的前世、今生与未来》
20220629【比物连类:对比表示学习】宫明明:CRIS: CLIP-Driven Referring Image Segmentation