V
主页
视觉基础模型的探索:MMPreTrain | CVPR 2023 (全英分享)
发布人
本教程将分享视觉基础模型与多模态模型的最新进展,并介绍相关的开源库(MMPreTrain:https://github.com/open-mmlab/mmpretrain)。内容分为以下四个部分: 第一部分为深度学习基础模型及相关库(MMPreTrain)介绍,这部分将简要介绍 MMPretrian 支持各类的深度学习算法,介绍算法库的设计思路和主要功能。 第二部分为多模态学习,这部分将首先介绍多模态学习的最新进展,再分享如何使用 MMPreTrain 进行各类多模态任务的具体实践。 第三部分为基于图像分类的基础模型应用,这部分将展示如何使用 MMPreTrain 进行经典的图像分类任务,并分享快速掌握应用基础模型的技巧。 第四部分为基于自监督学习的基础模型实践,在这部分将首先介绍自监督学习的概念和流程,再分享如何使用 MMPreTrain 进行自监督学习探索。
打开封面
下载高清视频
观看高清视频
视频下载器
深度学习预训练与MMPretrain
『超实用』ImageJ图像处理 - AI大模型SAM2细胞追踪python案例
图像与视频生成、编辑和增强工具 MMagic | CVPR 2023 (全英分享)
通用、统一且灵活的开源算法平台 OpenMMLab 2.0 | CVPR 2023 (全英分享)
社区开放麦#2|CVPR前沿姿态估计论文精讲
基于 Visual Transformer 的分割模型综述
面向人工智能的开放数据平台:OpenDataLab | CVPR 2023 (全英分享)
OpenMMLab基础模型研究进展
超大规模视觉通用感知模型-代季峰教授 | AI奇妙夜#6
【OpenMMLab 公开课】语义分割与 MMSegmentation
通用目标检测工具 MMDetection3.0 | CVPR 2023 (全英分享)
MMPretrain代码课
视频理解基础模型及下游应用-王利民教授 | AI奇妙夜#7
2. 使用 MMDet3D 预训练模型在点云和数据图像上推理
AI 2.0:突破性技术推动智能制造的应用创新
CVPR 2024 - 具身智能中的多模态三维感知思考
CVPR2023 首个大规模全场景人体数据集 Human-Art | 社区开放麦#47
【OpenMMLab 公开课】目标检测与 MMDetection 上
运用 SAM 模型分割任意点云
多模态大模型的技术实践与思考
Github八万star,开源计算机视觉神器OpenMMLab
2024最好出创新点的方向:【对比学习+多模态】CLIP模型、Dalle2、多模态3D目标检测、MedCLIP医学图像文本,计算机博士带你轻松搞定论文创新点!
【论文导读】视觉语言地学大模型综述(一)导论
30+视觉/多模态工具!通用Agent工具库AgentLego给大模型一双 “慧眼
4 目标检测算法基础
社区开放麦#30 | 入门剪枝利器 MMRazor,迈出模型压缩第一步
社区开放麦#3|PyTorch 分布式训练解读
【多模态+大模型+知识图谱】2024完整版:这绝对是B站最全的教程,论文创新点终于解决了!——人工智能/深度学习/aigc/计算机视觉
基于大模型对话系统的前世今生
【迄今为止最先进的模型】博士精讲CLIP、BLIP-2等多模态大模型落地应用!视觉Agent、ChatGLM、ChatGPT人工智能AI
视频目标追踪与 MMTracking 实践
【OpenMMLab 公开课】底层视觉与 MMEditing 上
【OpenMMLab 公开课】底层视觉与 MMEditing 下
玩转 MMYOLO 之工具篇(一):特征图可视化
社区开放麦#42 | 面向自动驾驶场景的纯视觉三维语义占有预测
玩转 MMYOLO 之基础篇(一):配置文件全解读
AI 奇妙夜#2 | 子豪兄分享人工智能学习心法
李沐在上海交通大学讲座【大语言模型的实践经验和未来预测】我在B站上交大!
【CVPR-2022】| Han Hu -- Convergence of Architectures and Learning Methods
AI实战营第二期 开营仪式