AI 奇妙夜#4 | 文字识别：从数据趋动到模型自监督 - 视频下载 Video Downloader

京东 11.11 红包

AI 奇妙夜#4 | 文字识别：从数据趋动到模型自监督

发布人

本期AI奇妙夜有幸邀请到金连文教授，介绍了从如何低成本利用大规模数据、如何降低深度学习模型对标签数据的依赖这一视角，来介绍 OCR 领域一些新的研究进展，并对此领域的一些重要问题及发展趋势进行讨论和展望。【OpenMMLab】公众号回复“社区开放麦”获取ppt哦~
MMOCR也支持了老师提到的SPTS模型，欢迎来探索使用：https://github.com/open-mmlab/mmocr

打开封面下载高清视频观看高清视频视频下载器

这也太全了！U-Net、V-Net、Deeplab、Mask R-CNN、Mask2former五大图像分割算法一口气学完！语义分割、实例分割全详解！

最好出论文idea的两大方向：GNN图神经网络+Transformer模型，三小时可掌握各变体基础原理及代码实战，讲的是真的通俗易懂！

完整60讲！计算机博士手把手教学的【Transformer】入门到精通，从零讲解基础原理及模型架构，绝对通俗易懂！

AI奇妙夜第一期

视频理解基础模型及下游应用-王利民教授 | AI奇妙夜#7

光学字符识别与MMOCR

生成模型 GAN 与 MMGeneration 实践

【OpenMMLab 公开课】目标检测与 MMDetection 上

AI时代数据应用的全链路工厂- Chat2DB

AI奇妙夜#5 | “视觉与语言”跨模态智能及应用

运用 SAM 模型分割任意点云

【中英精校】Meta首席科学家杨立昆：人类智能有四个关键特征是当前AI系统所不具备的：推理、规划、持久记忆以及对物理世界的理解｜2024.10.13

模型部署与 MMDeploy 实践

2. 使用 MMDet3D 预训练模型在点云和数据图像上推理

人体姿态估计与 MMPose 实践

社区开放麦#18 | 半监督学习在 3D 目标检测的最新进展

【OpenMMLab 公开课】视频理解与 MMAction2

MMDetection代码课

社区开放麦#29 | ECCV Oral | 用于场景文本检测识别的弱监督视觉语言预训练方法

社区开放麦#30 | 入门剪枝利器 MMRazor，迈出模型压缩第一步

【Transformer神经网络】

人体关键点检测与MMPose

社区开放麦#7 MMPose 姿态估计创意 demo 大赛

【OpenMMLab 2.0 系列直播】MMPose 介绍

OpenDataLab —— 一个面向人工智能的开放数据平台

计算机视觉与OpenMMLab 开源算法体系

MMSelfSup 代码教程【4】自监督预训练模型的评估：“分类” 下游任务之 SVM 评估

MMSelfSup 代码教程【7】模型自监督预训练之 MAE

最强免费开源文字识别Umi-OCR

【零基础小白必看】10月1日后才开始学深度学习！没有思路直接跟我学，保姆级深度学习教程！——AI人工智能丨机器学习丨神经网络（CNN、RNN、GAN、LSTM）

【OpenMMLab 2.0 系列直播】 MMAction2 介绍

社区开放麦#34 | 突破 AI 推理性能瓶颈，神经网络量化的方法与实践

探索之路：OCR 领域在大模型浪潮中的创新契机 | 热门研究云际会#3

草履虫都能毕业！Opencv+YOLO实时目标检测，计算机视觉方向从零到实战，带你做毕设！（计算机视觉/深度学习/Opencv/YOLO）

AI奇妙夜：缓解多模态大模型中使用裁剪策略增大分辨率的“后遗症”

玩转 MMYOLO 之实用篇（三）：自定义数据集从标注到部署保姆级教程

清华提出首个面向无监督和半监督新意图发现的文本聚类框架USNID

没有思路直接抄！一个月轻松入门深度学习！核心知识点都在这里了！（神经网络算法丨CNN丨RNN丨transformer丨GAN丨机器学习丨人工智能丨计算机视觉）

社区开放麦#15| 突破纯视觉 3D 检测深度估计瓶颈

社区开放麦#32 | ONNX 新特性和最佳实践介绍