V
主页
CVPR22 Oral, GLIP: Grounded Language-Image Pre-training
发布人
CVPR2022的oral工作,GLIP,它拥有更加细粒度的视觉语言表征空间,通过构建图像区域和文本单词之间细粒度的大规模预训练,实现更加细粒度的表征学习。支持open-vocabulary detection和grounding任务,并具备强大的zero-shot能力。
打开封面
下载高清视频
观看高清视频
视频下载器
CV大神谢赛宁大作 Sora的底层架构模型 DiT论文解读
强推!2024医学生必看的【人工智能+医疗】全套教程,教程从零开始,导师不教你的知识本课程统统告诉你,讲的非常全面!-人工智能/医学/计算机技术/计算机视觉
【多模态学习 BLIP2的前世与今生】ALBEF, BLIP和BLIP2全系列工作串讲
结合创新,小波变换+注意力机制,实现100%分类准确率
太厉害了 已跪!终于有人能把OpenCV图像处理讲的这么通俗易懂了,现在计算机视觉opencv全套分享给大家。
研0和研1怎么快速找到论文代码并且复现模型代码?20分钟事无巨细的教会你!-深度学习/机器学习/神经网络
Llama 3.1论文精读 · 4. 训练infra【论文精读·54】
【2023 ControlNet】斯坦福最新的可控文本生成图像扩散模型
【CVPR'24】扩散模型中时间区间端点奇异性的解决
【阿里最新工作】2023阿里最新可控图像合成工作Composer,生成图像的多样性优于ControlNet,T2I-Adapter
【全198集】CV入门到起飞!一口气学完Python、OpenCV、深度学习基础、Pytorch、卷积神经网络、物体检测、图像分割、等八大计算机视觉必备基础!
图像分割、目标检测、特征提取、边缘检测、图像滤波、人脸识别,这绝对是B站最适合入门学习的OpenCV计算机视觉课程!从入门到图像处理实战!人工智能丨深度学习丨
深度学习基础 | 网络模式 | model.train()、 model.eval()
研一,如何入门深度学习?
【小红书 InstantX】InstantStyle 论文讲解,效果炸裂
标星57.2K,近百万研究生收藏的逐行代码解读网站!
【北京智源 CVPR2023】视觉预训练最新工作,EVA系列工作EVA-01
多模态图像生成最新工作 Muse: Text-To-Image Generation via Masked Generative Transformers
CVPR'24 | BEVSee: 无需相机校准的联合相机 和拍摄对象配准
别再学那些弱鸡算法了!目标检测YOLO系列最强两大算法YOLOv5+YOLOv8基础算法及代码实战三小时即可掌握!
【腾讯】IP-Adapter论文解读,拿捏图生图,人脸更不在话下。
论文有救了!【AI+医疗】刷爆B站最好的医学影像识别技术教程!从理论到科研!临床研究、影像组成、SCI论文解读、Python机器学习、数据处理
【YOLOv10】12分钟通关YOLOv10,环境搭建、模型训练、验证推理、导出、数据集
【CVPR2023 PiMAE】点云图像多模态MAE最新工作
不愧是GitHub大佬!半天就教会了我YOLO、SSD、FasterRCNN、FastRCNN、SPPNet、RCNN等六大目标检测算法!深度学习/物体检测
【北大-腾讯最新工作】T2I-Adapter 更加可控的文本生成图像
【北大,字节】自回归图像生成模型 Visual Autoregressive Model(VAR), 通过Next-Scale预测方式实现图像生成
B站强推!国防科大【OpenCV+TensorFlow】全套教程!终于有人讲明白了OpenCV入门到实战!神经网络/计算机视觉/人脸检测/目标追踪/迁移学习
【讨论班】Step-by-Step Diffusion - An Elementary Tutorial (1)
【大作业-16】基于YOLOv10的海上红外目标检测系统
【科研废物导航】这里的科研工具比4399里的游戏还多!我愿称之为年度最伟大的发现——SCI论文/文献/谷歌学术/期刊查询
刚读研1,导师让做LSTM神经网络,之前没接触过神经网络Python,怎么入门?-深度学习/pytorch/循环神经网络
这才是科研人该学的!一口气学完线性回归、多项式回归、决策树等十大回归模型,从原理到实战,太通俗易懂了,比啃书强太多了!机器学习|深度学习|计算机视觉|人工智能
深度学习炼丹师的好炉子,它会是你的梦中情炉吗?
【3D AIGC论文串讲】单视图3D重建-从单视图中预测3D模型
【强推】35岁程序员转行AI成功拿下高薪offer,迪哥给正在转行的人一些建议和学习规划,让大家少走弯路实现弯道超车!-人工智能/计算机/深度学习/机器学习
研一如何快速入门三维重建?华东理工博士带你通俗易懂的讲解三维重建的原理与算法,3小时就能学会!赶紧收藏
【ICLR2023 DreamFusion】谷歌基于Diffusion Model的文本到3D内容生成工作
强推!【SLAM核心算法】中科院博士一口气带你学完无人驾驶:原理、激光、无人机、VR、传感器、计算机视觉!(人工智能、深度学习、机器学习、神经网络、图像处理)
【肝疯了】审稿100篇才知道2周足够写完一篇SCI了,基本套路讲解和手把手实操演示!(人工智能/计算机视觉/SCI)