V
主页
京东 11.11 红包
AI 奇妙夜#4 | 文字识别:从数据趋动到模型自监督
发布人
本期AI奇妙夜有幸邀请到金连文教授,介绍了从如何低成本利用大规模数据、如何降低深度学习模型对标签数据的依赖这一视角,来介绍 OCR 领域一些新的研究进展,并对此领域的一些重要问题及发展趋势进行讨论和展望。【OpenMMLab】公众号回复“社区开放麦”获取ppt哦~ MMOCR也支持了老师提到的SPTS模型,欢迎来探索使用:https://github.com/open-mmlab/mmocr
打开封面
下载高清视频
观看高清视频
视频下载器
这也太全了!U-Net、V-Net、Deeplab、Mask R-CNN、Mask2former五大图像分割算法一口气学完!语义分割、实例分割全详解!
最好出论文idea的两大方向:GNN图神经网络+Transformer模型,三小时可掌握各变体基础原理及代码实战,讲的是真的通俗易懂!
完整60讲!计算机博士手把手教学的【Transformer】入门到精通,从零讲解基础原理及模型架构,绝对通俗易懂!
AI奇妙夜第一期
视频理解基础模型及下游应用-王利民教授 | AI奇妙夜#7
光学字符识别与MMOCR
生成模型 GAN 与 MMGeneration 实践
【OpenMMLab 公开课】目标检测与 MMDetection 上
AI时代数据应用的全链路工厂- Chat2DB
AI奇妙夜#5 | “视觉与语言”跨模态智能及应用
运用 SAM 模型分割任意点云
【中英精校】Meta首席科学家杨立昆:人类智能有四个关键特征是当前AI系统所不具备的:推理、规划、持久记忆以及对物理世界的理解|2024.10.13
模型部署与 MMDeploy 实践
2. 使用 MMDet3D 预训练模型在点云和数据图像上推理
人体姿态估计与 MMPose 实践
社区开放麦#18 | 半监督学习在 3D 目标检测的最新进展
【OpenMMLab 公开课】视频理解与 MMAction2
MMDetection代码课
社区开放麦#29 | ECCV Oral | 用于场景文本检测识别的弱监督视觉语言预训练方法
社区开放麦#30 | 入门剪枝利器 MMRazor,迈出模型压缩第一步
【Transformer神经网络】
人体关键点检测与MMPose
社区开放麦#7 MMPose 姿态估计创意 demo 大赛
【OpenMMLab 2.0 系列直播】MMPose 介绍
OpenDataLab —— 一个面向人工智能的开放数据平台
计算机视觉与OpenMMLab 开源算法体系
MMSelfSup 代码教程【4】自监督预训练模型的评估:“分类” 下游任务 之 SVM 评估
MMSelfSup 代码教程【7】模型自监督预训练 之 MAE
最强免费开源文字识别Umi-OCR
【零基础小白必看】10月1日后才开始学深度学习!没有思路直接跟我学,保姆级深度学习教程!——AI人工智能丨机器学习丨神经网络(CNN、RNN、GAN、LSTM)
【OpenMMLab 2.0 系列直播】 MMAction2 介绍
社区开放麦#34 | 突破 AI 推理性能瓶颈,神经网络量化的方法与实践
探索之路:OCR 领域在大模型浪潮中的创新契机 | 热门研究云际会#3
草履虫都能毕业!Opencv+YOLO实时目标检测,计算机视觉方向从零到实战,带你做毕设!(计算机视觉/深度学习/Opencv/YOLO)
AI奇妙夜:缓解多模态大模型中使用裁剪策略增大分辨率的“后遗症”
玩转 MMYOLO 之实用篇(三):自定义数据集从标注到部署保姆级教程
清华提出首个面向无监督和半监督新意图发现的文本聚类框架USNID
没有思路直接抄!一个月轻松入门深度学习!核心知识点都在这里了!(神经网络算法丨CNN丨RNN丨transformer丨GAN丨机器学习丨人工智能丨计算机视觉)
社区开放麦#15| 突破纯视觉 3D 检测深度估计瓶颈
社区开放麦#32 | ONNX 新特性和最佳实践介绍