V
主页
社区开放麦#29 | ECCV Oral | 用于场景文本检测识别的弱监督视觉语言预训练方法
发布人
针对场景文本检测识别任务中,对图像中文本实例不敏感且适用的图文训练数据较难获取,难以直接应用的解决方案。【OpenMMLab】公众号回复“社区开放麦”获取 ppt。
打开封面
下载高清视频
观看高清视频
视频下载器
【OpenMMLab 公开课】目标检测与 MMDetection 下
社区开放麦#1|基于关键点的动作识别
【Python自动化脚本】用Python实现OCR识别提取图片文字,操作简单新手小白也能学会,附源码!!!
光学字符识别与MMOCR
社区开放麦#18 | 半监督学习在 3D 目标检测的最新进展
开放检测视觉场景理解 | 社区开放麦
清华提出首个面向无监督和半监督新意图发现的文本聚类框架USNID
MMSelfSup 代码教程【5】自监督预训练模型的评估:“检测”下游任务
社区开放麦#30 | 入门剪枝利器 MMRazor,迈出模型压缩第一步
社区开放麦#15| 突破纯视觉 3D 检测深度估计瓶颈
多模态 Agents:用大模型语言模型串联多模态专家
社区开放麦#27 | 部署神器Halide, 实现高性能算法
【OpenMMLab 公开课】视频理解与 MMAction2
社区开放麦#10 | MMDeploy ncnn 部署实战
MFF:简单高效的多级特征融合自监督方法 | ICCV 2023
CVPR23 | 3D Occupancy 预测冠军方案:FB-OCC
【OpenMMLab 公开课】计算机视觉与 OpenMMLab 概述
社区开放麦#4|手把手带你复现最新自监督算法
社区开放麦#13 | 手势识别算法综述与正确打开方式
社区开放麦#3|PyTorch 分布式训练解读
AI 奇妙夜#4 | 文字识别:从数据趋动到模型自监督
【OpenMMLab 公开课】目标检测与 MMDetection 上
5 MMDetection 代码教学
OpenMMLab:视觉、语言与生成式人工智能开源平台
基于大规模多模态扩散模型的文本到视频生成
MMPretrain代码课
社区开放麦#33 | 详解 ACCV22 大规模细粒度图像分类夺冠方案
社区开放麦#38 目标检测新范式!DETR 系列算法解读
OpenMMLab 开放平台发布!
AI奇妙夜#5 | “视觉与语言”跨模态智能及应用
【OpenMMLab 公开课】语义分割与 MMSegmentation
MMSelfSup 代码教程【7】模型自监督预训练 之 MAE
4 目标检测算法基础
【OpenMMLab 公开课】底层视觉与 MMEditing 上
MMSelfSup 代码教程【1】模型自监督预训练 之 SimCLR
CVPR 2024 - 具身智能中的多模态三维感知思考
Alpaca-CoT: 多接口统一的LLM轻量级指令微调平台
CVPR2023 首个大规模全场景人体数据集 Human-Art | 社区开放麦#47
弱监督有向目标检测 | 杨学
OpenMMLab 环境配置 (一) Windows 11 CPU