V
主页
[论文速览]OWL-ViT: Simple Open-Vocabulary Object Detection with ViT[2205.06230]
发布人
论文题目:Simple Open-Vocabulary Object Detection with Vision Transformers / OWL-ViT 论文地址:http://arxiv.org/abs/2205.06230 代码:https://github.com/google-research/scenic/tree/main/scenic/projects/owl_vit DETR: BV1T64y1D7NY * 本视频旨在传递一篇论文的存在推荐感兴趣的您阅读,并不是详细介绍,受up能力限制经常出现中英混杂,散装英语等现象,请见谅。如论文报道出了偏差,欢迎各位怒斥。 ** 新论文推荐,过往论文查找,欢迎编辑这个文档: https://docs.qq.com/sheet/DSUdOTG9xWUdydVB6 *** Slides每1-2月会上传到置顶动态地址
打开封面
下载高清视频
观看高清视频
视频下载器
[论文夕拾]Diffusion Models for Robotics
[论文速览]LLaVA: Visual Instruction Tuning[2304.08485]
都2024了,还不知道先学Transformer还是Diffusion?迪哥精讲BERT、Swin、DETR、VIT四大核心模型,原理讲解+论文解读+代码复现!
[论文简析]Region-Aware Pretraining for Open-Vocab. Object Det. w/ ViT[2305.07011]
[论文简析]VQ-VAE:Neural discrete representation learning[1711.00937]
[论文速览]Flamingo: a Visual Language Model for Few-Shot Learning[2204.14198]
[论文速览]Theia: Distilling Diverse Vision Foundation Models for Robot..[2407.20179]
[论文简析]VAE: Auto-encoding Variational Bayes[1312.6114]
直观理解Vision Transformer(ViT)及Diffusion Models使用扩散模型进行图像合成,
[论文速览]iFormer: Inception Transformer[2205.12956]
[论文简析]Point Transformer V2[2210.05666]
【共享LLM前沿】假如我从11月1号开始学大模型!9小时学会搭建对话机器人办公助手、大模型预训练微调、四大多模态大模型!
[论文速览]Diffusion Policy: Visuomotor Policy Learning via Action Diff.[2303.04137]
[论文简析]DeiT: Data-efficient Image Transformers[2012.12877]
论文答辩吓哭了多少大学生?论文答辩有多恐怖😱
[论文速览]Open Vocab. Semantic Seg. with Patch Aligned Contrastive...[2212.04994]
比刷剧还爽!【OpenCV+YOLO】终于有人能把OpenCV图像处理+YOLO目标检测讲的这么通俗易懂了!J建议收藏!(人工智能、深度学习、机器学习算法)
[论文简析]Swin Transformer: Hierarchical ViT using Shifted Windows[2103.14030]
[论文速览]Decision Transformer: RL via Sequence Modeling[2106.01345]
[论文速览]BLIP-2 ...with Frozen Image Encoders and Large Language Models[2301.12597]
[论文速览]Bootstrapping Language-Image Pre-training...[2201.12086]
辛苦写的论文被学院老师看上了,通讯和一作都保不住了,该怎么办?
【Aku助眠】asmr 缓慢而温柔...
强推! 导师散养不管不问,中山大学最新最全的【SCI论文写作】从研究性以及综述论文角度出发全套流程-SCI论文_SCI论文写作
【自学大模型】9小时学懂大模型预训练微调及四大多模态大模型!讯飞大佬通俗易懂讲解如何构建对话机器人办公助手!RLHF、transformer、CLIP、ViT
[论文简析]GroupViT: Semantic Segmentation Emerges from Text Supervision[2202.11094]
[论文简析]SAC: Soft Actor-Critic Part 1[1801.01290]
【共享LLM前沿】通俗易懂搞懂四大多模态大模型CLIP BLIP VIT MLLM及对话机器人办公助手!大模型预训练微调
[论文速览]DDPG&TD3[1509.02971][1802.09477]
【附源码】一次性讲清楚目标检测YOLO算法——底层原理+项目实训+论文解读,超详细教学,通俗易懂!机器学习|计算机视觉|深度学习
【文献汇报】多尺度注意力Transformer
[论文简析]Object-Centric Learning with Slot Attention[2006.15055]
[论文简析]MixMAE & Mixed AE[2205.13137][2303.17152]
吹爆!用Transformer结合目标检测做跨领域研究!真的超级容易出论文!(SCI丨论文写作丨科研丨研究生丨创新点丨idea)
[论文简析]MViT: Multiscale Vision Transformers[2104.11227]
还是太全面了!NLP十天起飞,一口气学完文本分类、文本摘要、机器翻译、知识图谱、情感分析等十大技术点!算法原理+论文解读,草履虫都能学会!大模型|机器学习
[论文简析]Red Circle: Visual Prompt Engineering for VLMs[2304.06712]
[论文速览]Autoregressive Image Generation using Residual Quantization[2203.01941]
[论文简析]Point Transformer[2012.09164]
[论文简析]Regularized Vector Quantization for Tokenized Image Synthesis[2303.06424]