视觉基础模型的探索：MMPreTrain | CVPR 2023 (全英分享)

发布人

本教程将分享视觉基础模型与多模态模型的最新进展，并介绍相关的开源库（MMPreTrain：https://github.com/open-mmlab/mmpretrain）。内容分为以下四个部分：

第一部分为深度学习基础模型及相关库（MMPreTrain）介绍，这部分将简要介绍 MMPretrian 支持各类的深度学习算法，介绍算法库的设计思路和主要功能。
第二部分为多模态学习，这部分将首先介绍多模态学习的最新进展，再分享如何使用 MMPreTrain 进行各类多模态任务的具体实践。
第三部分为基于图像分类的基础模型应用，这部分将展示如何使用 MMPreTrain 进行经典的图像分类任务，并分享快速掌握应用基础模型的技巧。
第四部分为基于自监督学习的基础模型实践，在这部分将首先介绍自监督学习的概念和流程，再分享如何使用 MMPreTrain 进行自监督学习探索。

打开封面下载高清视频观看高清视频视频下载器

视觉基础模型的探索：MMPreTrain | CVPR 2023 (全英分享)

深度学习预训练与MMPretrain

『超实用』ImageJ图像处理 - AI大模型SAM2细胞追踪python案例

图像与视频生成、编辑和增强工具 MMagic | CVPR 2023 （全英分享）

通用、统一且灵活的开源算法平台 OpenMMLab 2.0 | CVPR 2023 （全英分享）

社区开放麦#2｜CVPR前沿姿态估计论文精讲

基于 Visual Transformer 的分割模型综述

面向人工智能的开放数据平台：OpenDataLab | CVPR 2023 （全英分享）

OpenMMLab基础模型研究进展

超大规模视觉通用感知模型-代季峰教授 | AI奇妙夜#6

【OpenMMLab 公开课】语义分割与 MMSegmentation

通用目标检测工具 MMDetection3.0 | CVPR 2023 （全英分享）

MMPretrain代码课

视频理解基础模型及下游应用-王利民教授 | AI奇妙夜#7

2. 使用 MMDet3D 预训练模型在点云和数据图像上推理

AI 2.0：突破性技术推动智能制造的应用创新

CVPR 2024 - 具身智能中的多模态三维感知思考

CVPR2023 首个大规模全场景人体数据集 Human-Art | 社区开放麦#47

【OpenMMLab 公开课】目标检测与 MMDetection 上

运用 SAM 模型分割任意点云

多模态大模型的技术实践与思考

Github八万star，开源计算机视觉神器OpenMMLab

2024最好出创新点的方向：【对比学习+多模态】CLIP模型、Dalle2、多模态3D目标检测、MedCLIP医学图像文本，计算机博士带你轻松搞定论文创新点！

【论文导读】视觉语言地学大模型综述（一）导论

30+视觉/多模态工具！通用Agent工具库AgentLego给大模型一双 “慧眼

4 目标检测算法基础

社区开放麦#30 | 入门剪枝利器 MMRazor，迈出模型压缩第一步

社区开放麦#3｜PyTorch 分布式训练解读

【多模态+大模型+知识图谱】2024完整版：这绝对是B站最全的教程，论文创新点终于解决了！——人工智能/深度学习/aigc/计算机视觉

基于大模型对话系统的前世今生

【迄今为止最先进的模型】博士精讲CLIP、BLIP-2等多模态大模型落地应用！视觉Agent、ChatGLM、ChatGPT人工智能AI

视频目标追踪与 MMTracking 实践

【OpenMMLab 公开课】底层视觉与 MMEditing 上

【OpenMMLab 公开课】底层视觉与 MMEditing 下

玩转 MMYOLO 之工具篇（一）：特征图可视化

社区开放麦#42 | 面向自动驾驶场景的纯视觉三维语义占有预测

玩转 MMYOLO 之基础篇（一）：配置文件全解读

AI 奇妙夜#2 | 子豪兄分享人工智能学习心法

李沐在上海交通大学讲座【大语言模型的实践经验和未来预测】我在B站上交大！

【CVPR-2022】| Han Hu -- Convergence of Architectures and Learning Methods

AI实战营第二期 开营仪式

AI实战营第二期开营仪式