V
主页
社区开放麦#41 | 视觉大模型设计新范式
发布人
本次分享探讨了视觉大模型的设计方案。指出了Information Bottleneck Principal 主导下的网络架构中存在的丢失信息的问题,介绍普通 Reversible Network 推广到 Multi-Column 的架构形式以及逐个 column 监督的中间监督训练方式。【OpenMMLab】公众号回复“社区开放麦”获取ppt。
打开封面
下载高清视频
观看高清视频
视频下载器
大模型时代下视觉网络的创新设计与拓展 | 热门研究 云际会#1
业界可用的高性能的姿态估计模型能有多快? | 社区开放麦#46
AI奇妙夜#5 | “视觉与语言”跨模态智能及应用
书生·浦语大模型全链路开源开放体系
【2024最新】不要再看那些过时的PyTorch老教程了,深度学习PyTorch入门实战计算机视觉最新版全套教程(人工智能机器视觉教程)
社区开放麦#27 | 部署神器Halide, 实现高性能算法
社区开放麦#19 | 对 AI 炼丹师友好的模型部署探索
【OpenMMLab 公开课】底层视觉与 MMEditing 上
社区开放麦#32 | ONNX 新特性和最佳实践介绍
社区开放麦#15| 突破纯视觉 3D 检测深度估计瓶颈
MMSelfSup 代码教程【5】自监督预训练模型的评估:“检测”下游任务
OpenMMLab:视觉、语言与生成式人工智能开源平台
社区开放麦#16 | 稀疏卷积的高性能部署
星语天文大模型,科普与科学领域的多模态、智能体探索
CVPR 2023 有向目标检测角度预测新方法 — 相移编码 | 社区开放麦#45
社区开放麦#14 | 从时间序列角度破解姿态估计中的两大问题
MMSelfSup 代码教程【6】在 MMDetection 中使用自监督预训练模型
5. PointPillars 和 KittiDataset 的配置文件解读
底层视觉与MMEditing
AI 奇妙夜#2 | 子豪兄分享人工智能学习心法
生成模型 GAN 与 MMGeneration 实践
基于大模型对话系统的前世今生
MOSS:如何打造对话式语言模型 | 社区开放麦#48
社区开放麦#8 | 迈向真实世界的感知:3D 目标检测
人体姿态估计与 MMPose 实践
通用、统一且灵活的开源算法平台 OpenMMLab 2.0 | CVPR 2023 (全英分享)
【OpenMMLab 公开课】目标检测与 MMDetection 上
魔搭社区-浦语模型和工具实战
MMSelfSup 代码教程【3】自监督预训练模型的评估:“分类” 下游任务 之 线性评估
CVPR2023 首个大规模全场景人体数据集 Human-Art | 社区开放麦#47
超大规模视觉通用感知模型-代季峰教授 | AI奇妙夜#6
医学大模型研发与应用的最新进展
多模态扩散模型的革新应用 | 热门研究云际会#4
探索之路:OCR 领域在大模型浪潮中的创新契机 | 热门研究云际会#3
4. 使用 MMDetection3D 训练
LMDeploy 大模型量化部署实践
视频目标追踪与 MMTracking 实践
社区开放麦#38 目标检测新范式!DETR 系列算法解读
当大模型遇上心理咨询:基于心理咨询报告的对话重构和评测框架CPsyCoun
AI 奇妙夜#4 | 文字识别:从数据趋动到模型自监督