V
主页
京东 11.11 红包
20231025【面向视觉的零样本学习】李晶晶:基于生成模型的零样本视觉识别
发布人
报告嘉宾:李晶晶 (电子科技大学) 报告时间:2023年10月25日 (星期三)晚上20:00 (北京时间) 报告题目:基于生成模型的零样本视觉识别 报告人简介: 李晶晶博士,电子科技大学计算机学院教授,博导,人社部“博新计划”博士后。中国电子学会优博。入选2019年电子科技大学“学术新人奖”,2020年电子科技大学“百人计划”。主要研究方向为人工智能算法及应用。目前已在TPAMI、TIP、TKDE、TOIS和CVPR等JCR一区期刊及CCF A类会议上发表长文七十余篇,获得授权专利十项。担任TPAMI、TIP、TCYB、TNNLS、TKDE、CVPR、AAAI、MM等期刊和会议审稿人/领域主席/高级程序委员/程序委员。研究成果入选ESI高被引热点,以及中国百篇最具影听国际学术论文。成果在亿纬锂能和腾讯等单位落地应用,产生数亿经济价值。荣获四川省科技进步一等奖和吴文俊人工智能优秀青年奖。 个人主页: https://faculty.uestc.edu.cn/jjl 报告摘要: 神经网络的识别通常被限制在训练数据中预定义的类别上。零样本学习旨在突破这个限制,实现对训练中未见类别的识别。本报告全面探讨了使用生成模型实现零样本视觉识别的方法。报告首先介绍了零样本学习的目标,以及使用语义信息建立语义空间和视觉空间之间的映射,从而实现对未见类别的识别。接着,报告分析了零样本识别问题中的几个关键挑战,如生成的欠约束性、生成样本的单一性、语义成分重要性、特征纠缠性、特征生成质量等。为了解决这些问题,本报告介绍了多种应对的方法,例如使用循环一致的对抗生成网络;使用soul样本正则化机制增加生成多样性;使用集成模型赋予不同语义成分不同权重;使用语义解耦学习区分相关与非相关语义特征;调节生成跨度维持语义一致性和类别多样性。最后,报告介绍了通过对抗样本增强数据,从而提高模型对抗鲁棒性的方法。 参考文献: [1] Z. Chen, P. Zhang, J. Li, S. Wang, Z Huang, “Zero-Shot Learning by Harnessing Adversarial Samples”, Proceedings of the 31th ACM International Conference on Multimedia, 2023 [2] Z. Chen, Y. Luo, R. Qiu, S. Wang, J. Li, Z. Huang, “Semantics Disentangling for Generalized Zero-Shot Learning”, Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV) 2021, [3] Sariyildiz M B, Cinbis R G. Gradient matching generative networks for zero-shot learning, Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2019, [4] Chen S, Hong Z, Xie G S, et al. Msdn: Mutually semantic distillation network for zero-shot learning, Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, 2022, [5] Liu Z, Guo S, Lu X, et al. $^ 2$ P-Encoder: On Exploration of Channel-Class Correlation for Multi-Label Zero-Shot Learning, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2023, [6] Xu W, Xian Y, Wang J, et al. Vgse: Visually-grounded semantic embeddings for zero-shot learning, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022, ……
打开封面
下载高清视频
观看高清视频
视频下载器
MPC+强化学习!Actor Critic模型预测控制,苏黎世大牛教授人类水平性能的自主视觉无人机演讲
【yolov8】一小时掌握!从0开始搭建部署YOLOv8,环境安装+推理+自定义数据集搭建与训练,入门到精通!
2024最火的两个模型:Informer+LSTM两大时间序列预测模型,论文精读+代码复现,通俗易懂!——人工智能|AI|机器学习|深度学习
研究生话题:入门机器学习深度学习需要多久时间?这次终于能搞明白了!
【唐宇迪】7小时深度学习时间序列预测,从零基础到实战(附代码+数据集+原理介绍)LSTM/pandas/机器学习
一口气学完回归算法、聚类算法、决策树、随机森林、神经网络、贝叶斯算法、支持向量机、神经网络等十二大机器学习算法!通俗易懂
【VALSE2024】0505 赵恒爽《APR:视觉基础大模型》
深度学习研一,三个月流水线一般发论文教程。
【毕设项目】基于卷积神经网络构建猫狗识别分类模型 数据增强实战,计算机博士教你做毕设!
爆肝整理!CVPR2024可复现论文合集,原文/代码/演示全都有!(深度学习/计算机视觉)
太厉害了!终于有人能把OpenCV图像处理+YOLO目标检测讲的这么通俗易懂了!无偿分享学不会你来找我!_计算机视觉/深度学习/OpenCV/YOLO
草履虫都能学会!十天学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等十大深度学习神经网络!学不会你来打我!人工智能/pytorch
2024最新即插即用卷积模块MSPANet打败Resnet、SE、CBAM,CNN框架模型涨点!
【VALSE2024】0505 吴小俊《特邀报告:多模态视觉融合方法:是否存在性能极限?》
【中英双语】ChatGPT背后的数学原理是什么?带你看懂Transformer模型的数学矩阵实现!
20240925【大模型机理分析】张辉帅:大模型表征空间的理解与安全可控生成
20231011【医疗基础模型 (上)】王国泰:MIS-FM: 基于大规模自监督预训练模型的 3D 医学图像分割
【YOLOv11速通】迪哥13分钟教你使用自己的数据集从环境搭建到模型训练、推理、导出一条龙实操,入门到精通!-YOLO/目标检测/人工智能/计算机视觉
20231009【VALSE短教程】《零基础开始学习生成对抗网络》特邀讲师:桂杰教授
强推!我敢保证这是B站最全的(python+机器学习+深度学习)系列教程,3小时就能从入门到精通,通俗易懂,小白也能学得会!人工智能|深度学习|计算机视觉
可以说知道这五个网站就没有找不到的数据集!特别是最后一个简直就是学术利器!-人工智能/深度学习/机器学习/数据集
20220803【妙笔生花,画龙点睛: 视觉生成式模型专题研讨】周博磊:生成模型的解释性,交互性,小样本学习,以及我对Dalle2的看法
比啃书效果好太多了!不愧是原著作者亲授,复旦大学邱锡鹏教授的《神经网络与深度学习》终于出视频教程了!!真的通俗易懂!(人工智能、深度学习、机器学习、计算机视觉)
【对新手超级友好】三小时深度学习PyTorch快速入门教程,包教包会!!——人工智能|机器学习|深度学习
20241009【视觉计算中的跨域和跨任务学习问题】赵知临:外分布机器学习理论与算法
20240828【医学多模态分析与研究:从传统模型到大模型的演变】王淑君:Multi-modal Representation Learning for Me…
【VALSE2023】0610 胡瀚《视觉自监督学习年度进展评述》
20210428【可解释机器学习-知其所以然】周博磊:生成模型的可解释性与交互内容创作
20220713【超级视觉深度学习模型与标签学习方法】刘同亮:标签学习简介——助力超级深度学习
20230816【数字虚拟人的研究进展与未来】韩晓光:基于图像的三维毛发重建
DIT模型未来的2大方向:控制和加速。REPA和RF-inversion论文解读
20240828【医学多模态分析与研究:从传统模型到大模型的演变】刘明霞:多中心多模态脑影像智能分析及应用研究
禁止低效啃书!《清华高翔博士-视觉SLAM14讲》视频教程全集,简直不要太强!
20240529【可控的视觉内容生成】陈铠:Geometric-Controllable Visual Generation: A Systematic ……
图像分割、目标检测、特征提取、边缘检测、图像滤波、人脸识别,这绝对是B站最适合入门学习的OpenCV计算机视觉课程!从入门到图像处理实战!人工智能丨深度学习丨
2024终于有人把【图像处理与机器视觉】讲清楚啦!
YOLOV11 2.0来啦!支持实时推理,人流量车流量,物体对象监测,实时预览数据,本地一键安装整合包,支持图片,视频,屏幕画面捕捉,数据导出,视觉AI大模型
吹爆!六小时速通,深度学习之图像处理+目标检测+图像分割超全教程来啦!(matlab/计算机视觉/人工智能/深度学习/机器学习/图像处理/计算机视觉)
目前B站最完整的【图神经网络从入门到精通】讲解,我居然20小时就学懂了GNN原理模型与应用,纯干货!超详细!看完血赚!神经网络深度学习/AI 人工智能
20210625;短教程:《Transformers》;特邀讲师:邱锡鹏教授