V
主页
基于深度学习的视频文本的跨模态检索30页综述来了,包含近7年150篇相关论文!
发布人
-
打开封面
下载高清视频
观看高清视频
视频下载器
【多模态+大模型+知识图谱】2024最好创新的研究方向!绝对是B站最全的教程,论文创新点终于解决了!——人工智能|深度学习|aigc|计算机视觉
阿里发布最强中文图文多模态模型:Chinese CLIP,基于两亿中文图文多模态数据!
鹏城实验室开放了45页多模态预训练大模型综述!总结了近5年多模态预训练相关的算法和数据!多模态预训练学习包!
最全的30页Loss函数总结综述来了,包含30多种损失函数,涉及分类,回归,Ranking等!
图灵机得主Hiton极力推荐的谷歌深度学习调参手册及中文翻译版来了,包含30页调参技巧,需要的同学快来领取!
中科大提出All-in-One多模态预训练方法,利用统一的多模态互信息提升多模态性能,下游检测分割性能超过BEIT V3!
动作识别最新综述来了,包含RNN,3D卷积以及Transformer等算法,涉及近300篇相关论文!
花了一周时间整理的多模态领域经典必读论文30篇,赶紧点赞收藏!
AI模型的大一统!微软多模态组提出了多模态领域杀疯了的多边形战士BEIT V3!多项视觉,多模态任务达到SOTA!
AI可解释性综述来了,神经网络的黑盒性质经常被许多学者Diss,而可解释性方法让AI不在是完全黑盒!
基于Diffusion模型的以文生图综述来了!包含145篇相关论文,涉及Diffusion相关理论和基础介绍!
深度学习基础 | argparse 模块 | 命令行参数解析
里斯本大学学者提出检索增强的Image Captioning 方法,可以在预训练图文编码器的基础上进一步提升Caption性能!
ai聊天 无敏感词无限制畅聊,支持自定义创建及语音,支持安卓、iOS端!
2024 AI夏令营 第二期|【从零入门AI竞赛(多模态方向)】进阶分享
多模态大模型 MiniCPM-V 2.6「实时视频理解」首次上端!
Adobe研究院提出了用于视频和音频多模态数据的视听对比学习的自监督策略,在多项视频和音频数据集上达到新SOTA!
【多模态+知识图谱】半天居然就跟着博士从零构建知识图谱!基于知识图谱的六大项目实战!医药问答系统、知识抽取、推荐系统、Neo4j数据库、大模型
05_多模态_基于MiniCPM-V进行全参微调和lora微调
举双手建议医学生结合AI发论文就死磕这4个宝藏学习工具!非常非常有用!-医学/医疗/医学图像/神经网络/深度学习
基于深度学习的时序预测37页综述来了,包含方法和应用的介绍,囊括CNN,RNN以及Attention等近50种主流算法!
深度学习基础 | 网络模式 | model.train()、 model.eval()
【EMNLP2023】清华联合阿里提出了利用大型语言模型辅助多模态OOD检测的新方法!
2024 AI夏令营 第四期|【从零入门多模态大模型数据合成】开营仪式
阿里多模态团队基于OFA多模态预训练模型,提出最强中文OCR模型,效果惊艳!
深度卷积神经网络结构剪枝综述来了!涉及300篇相关论文,史上最强总结综述!
2024 AI夏令营 第二期|【外滩大会·全球Deepfake攻防挑战赛】多模态赛道赛题解读与Baseline解析
北京智源多模态团队提出EVA:多模态助力视觉自监督预训练,加入掩码,视觉表征学习更上一层楼!目前代码和模型已开源!
我的抓药机械臂做了一个违背祖宗的决定
最新开放词汇目标检测综述,涵盖开放词汇目标检测各种类型方法,近250篇相关文献,需要快来领取!!#科研 #计算机 #AI #论文 #深度学习
基于Transformer的单目标跟踪35页综述来了,近100篇相关论文,涉及近两年20多种方法!
基于Diffusion模型的DiffFace来了,交换效果超过之前的经典模型!代码和模型即将开源!
几秒钟完成图像定制化生成!清华联合腾讯提出无需微调的AIGC新框架!
【最新综述论文】医学图像分析的数据高效深度学习方法总结,涵盖超过250篇医学AI相关论文!!
Llama 3.1论文精读 · 3. 模型【论文精读·54】
给多模态加Buffer,GNN在视觉语言下游任务的应用综述来了!包含125篇相关论文,涉及Image Captioning,VQA,Retrieval三大方向!
腾讯提出一种新的CLIP模型,利用更加soft的跨模态对齐策略,提升CLIP在各项任务上的性能!
一文读懂多模态,230页多模态综述开源了!涵盖了CV,NLP,图文多模态的经典方法和SOTA模型
阿里提出用于视频文本理解的高效多模态模型MuLTI,通过设计了Multiway Sampler和多项选择建模任务 在多项视频理解任务上达到新SOTA!
上交学者提出了一种利用Diffusion模型生合成语义分割数据集,并基于此训练了一个开放词汇分割的模型,效果惊艳!