社区开放麦#29 | ECCV Oral | 用于场景文本检测识别的弱监督视觉语言预训练方法

发布人

针对场景文本检测识别任务中，对图像中文本实例不敏感且适用的图文训练数据较难获取，难以直接应用的解决方案。【OpenMMLab】公众号回复“社区开放麦”获取 ppt。

打开封面下载高清视频观看高清视频视频下载器

【OpenMMLab 公开课】目标检测与 MMDetection 下

社区开放麦#1｜基于关键点的动作识别

【Python自动化脚本】用Python实现OCR识别提取图片文字，操作简单新手小白也能学会，附源码！！！

光学字符识别与MMOCR

社区开放麦#18 | 半监督学习在 3D 目标检测的最新进展

开放检测视觉场景理解 | 社区开放麦

清华提出首个面向无监督和半监督新意图发现的文本聚类框架USNID

MMSelfSup 代码教程【5】自监督预训练模型的评估：“检测”下游任务

社区开放麦#30 | 入门剪枝利器 MMRazor，迈出模型压缩第一步

社区开放麦#15| 突破纯视觉 3D 检测深度估计瓶颈

多模态 Agents：用大模型语言模型串联多模态专家

社区开放麦#27 | 部署神器Halide, 实现高性能算法

【OpenMMLab 公开课】视频理解与 MMAction2

社区开放麦#10 | MMDeploy ncnn 部署实战

MFF：简单高效的多级特征融合自监督方法 | ICCV 2023

CVPR23 | 3D Occupancy 预测冠军方案：FB-OCC

【OpenMMLab 公开课】计算机视觉与 OpenMMLab 概述

社区开放麦#4｜手把手带你复现最新自监督算法

社区开放麦#13 | 手势识别算法综述与正确打开方式

社区开放麦#3｜PyTorch 分布式训练解读

AI 奇妙夜#4 | 文字识别：从数据趋动到模型自监督

【OpenMMLab 公开课】目标检测与 MMDetection 上

5 MMDetection 代码教学

OpenMMLab：视觉、语言与生成式人工智能开源平台

基于大规模多模态扩散模型的文本到视频生成

MMPretrain代码课

社区开放麦#33 | 详解 ACCV22 大规模细粒度图像分类夺冠方案

社区开放麦#38 目标检测新范式！DETR 系列算法解读

OpenMMLab 开放平台发布！

AI奇妙夜#5 | “视觉与语言”跨模态智能及应用

【OpenMMLab 公开课】语义分割与 MMSegmentation

MMSelfSup 代码教程【7】模型自监督预训练之 MAE

4 目标检测算法基础

【OpenMMLab 公开课】底层视觉与 MMEditing 上

MMSelfSup 代码教程【1】模型自监督预训练之 SimCLR

CVPR 2024 - 具身智能中的多模态三维感知思考

Alpaca-CoT: 多接口统一的LLM轻量级指令微调平台

CVPR2023 首个大规模全场景人体数据集 Human-Art | 社区开放麦#47

弱监督有向目标检测 | 杨学

OpenMMLab 环境配置（一） Windows 11 CPU

社区开放麦#29 | ECCV Oral | 用于场景文本检测识别的弱监督视觉语言预训练方法

【OpenMMLab 公开课】目标检测与 MMDetection 下

社区开放麦#1｜基于关键点的动作识别

【Python自动化脚本】用Python实现OCR识别提取图片文字，操作简单新手小白也能学会，附源码！！！

光学字符识别与MMOCR

社区开放麦#18 | 半监督学习在 3D 目标检测的最新进展

开放检测视觉场景理解 | 社区开放麦

清华提出首个面向无监督和半监督新意图发现的文本聚类框架USNID

MMSelfSup 代码教程【5】自监督预训练模型的评估：“检测”下游任务

社区开放麦#30 | 入门剪枝利器 MMRazor，迈出模型压缩第一步

社区开放麦#15| 突破纯视觉 3D 检测深度估计瓶颈

多模态 Agents：用大模型语言模型串联多模态专家

社区开放麦#27 | 部署神器Halide, 实现高性能算法

【OpenMMLab 公开课】视频理解与 MMAction2

社区开放麦#10 | MMDeploy ncnn 部署实战

MFF：简单高效的多级特征融合自监督方法 | ICCV 2023

CVPR23 | 3D Occupancy 预测冠军方案：FB-OCC

【OpenMMLab 公开课】计算机视觉与 OpenMMLab 概述

社区开放麦#4｜手把手带你复现最新自监督算法

社区开放麦#13 | 手势识别算法综述与正确打开方式

社区开放麦#3｜PyTorch 分布式训练解读

AI 奇妙夜#4 | 文字识别：从数据趋动到模型自监督

【OpenMMLab 公开课】目标检测与 MMDetection 上

5 MMDetection 代码教学

OpenMMLab：视觉、语言与生成式人工智能开源平台

基于大规模多模态扩散模型的文本到视频生成

MMPretrain代码课

社区开放麦#33 | 详解 ACCV22 大规模细粒度图像分类夺冠方案

社区开放麦#38 目标检测新范式！DETR 系列算法解读

OpenMMLab 开放平台发布！

AI奇妙夜#5 | “视觉与语言”跨模态智能及应用

【OpenMMLab 公开课】语义分割与 MMSegmentation

MMSelfSup 代码教程【7】模型自监督预训练 之 MAE

4 目标检测算法基础

【OpenMMLab 公开课】底层视觉与 MMEditing 上

MMSelfSup 代码教程【1】模型自监督预训练 之 SimCLR

CVPR 2024 - 具身智能中的多模态三维感知思考

Alpaca-CoT: 多接口统一的LLM轻量级指令微调平台

CVPR2023 首个大规模全场景人体数据集 Human-Art | 社区开放麦#47

弱监督有向目标检测 | 杨学

OpenMMLab 环境配置 （一） Windows 11 CPU

MMSelfSup 代码教程【7】模型自监督预训练之 MAE

MMSelfSup 代码教程【1】模型自监督预训练之 SimCLR

OpenMMLab 环境配置（一） Windows 11 CPU