V
主页
阿里提出用于视频文本理解的高效多模态模型MuLTI,通过设计了Multiway Sampler和多项选择建模任务 在多项视频理解任务上达到新SOTA!
发布人
-
打开封面
下载高清视频
观看高清视频
视频下载器
【多模态+大模型+知识图谱】2024最好创新的研究方向!绝对是B站最全的教程,论文创新点终于解决了!——人工智能|深度学习|aigc|计算机视觉
【多模态+大模型+知识图谱】2024完整版:这绝对是B站最全的教程,论文创新点终于解决了!——人工智能/深度学习/aigc/计算机视觉
多模态大模型 MiniCPM-V 2.6「实时视频理解」首次上端!
【脑客中国·科研】第155位讲者 | 王杰:多模态磁共振成像与脑科学
还在偷偷浏览颜色网站?可长点心吧,黑客都快笑疯了!(本视频提供网络安全教程)
在家做AI,2月赚了一年生活费,分享我的实操方法,目前经济自由!!
如何设计和使用多模态评估任务来评估学习者的语言能力
多模态还能助力NLP任务!上交学者提出TILT方法,利用多模态检索图像增强文本表征,多项NLP下游任务达到SOTA!
InternVL 多模态模型语音功能小剧透!
斯坦福大学AI博士,揭秘最新多模态AI - 杨俊睿 Jackie,MAUI
【多模态+知识图谱】半天居然就跟着博士从零构建知识图谱!基于知识图谱的六大项目实战!医药问答系统、知识抽取、推荐系统、Neo4j数据库、大模型
图像+音频驱动的口播视频生成!谷歌提出VLOGGER!
精选【人工智能课程】大模型时代 如何学习人工智能?零基础学习教程!人工智能学习路线 人工智能就业方向 人工智能 大模型 多模态技术路线 人工智能项目开发
在家坚持Python接单,昨天568,一台电脑,方法简单,分享我的接单平台、接单技巧以及实操方法!!
阿里发布最强中文图文多模态模型:Chinese CLIP,基于两亿中文图文多模态数据!
国内智驾老兵百度开源BEVWorld:通过统一BEV潜在空间实现自动驾驶的多模态世界模型
解锁CLIP长文本能力!即插即用替换CLIP!上海AI Lab提出Long-CLIP!
开源AI项目爆火!大叔秒变少女,GitHub狂揽7.9K星 | 零度解说
谷歌提出利用语言大模型重写caption来提升图文多模态预训练模型,简单技巧即可提升CLIP多项zeroshot 性能!代码已开源!
15项将改变未来的新型技术( 纳米技术 6G 机器人 无人机 3D打印 人工智能AI AR)
NVIDIA放大招了!在生成模型基础上提出Action-GPT:利用GPT实现任意文本生成动作!效果绝了!
字节提出新的多边形战士,通用基础模型X-FM,将视觉,文本和多模态的训练做到了一个阶段,在多项下游任务表现不错!
人工智能已经学会了DNA语言,新AI模型可解码DNA隐藏规则,黑盒揭开正在加速度#人工智能#大模型#DNA#科技
鹏城实验室学者提出了一种新的视频语言多模态预训练模型SOTA-VLP,融合了空间时序建模方法,捕获细粒度特征,多项任务取得SOTA!
原来AI真的能生成高颜值美女,快来试试多模态生成模型吧!
解锁CLIP长文本能力!即插即用替换CLIP!上海AI Lab提出Long-CLIP!
谷歌基于多模态预训练模型,提出了一种开放词汇的时序动作检测模型,可以检测视频中任意动作!性能远超之前方法!
研一、研二必看!论文创新点居然如此简单!博士研究生手把手带你亲历SCI论文从撰写到投稿的全过程【SCI论文写作】
【全100集】大模型时代 如何学习人工智能?零基础学习AI人工智能课程: 人工智能学习路线,技术路线,人工智能入门实战 近期大模型图鉴 多模态大模型入门详解
一个非常变态,但可以让你快速学会C++的方法!
微软学者整理了100页图文多模态预训练综述,涉及各种多模态模型和应用,并且附带视频教程,需要的同学快来领取!
阿里联合清华提出了用于医学VQA的新方法RAMM,利用检索增强的策略在医学VQA数据集上取得新SOTA!数据集,代码即将开源!
腾讯联合新国立提出了一种one-shot文本生成视频的方法!效果超过CogVideo!代码和模型即将开源!
2分钟内快速完成学术论文全文翻译
3D版CLIP横空出世,助力各种点云任务!涨点效果明显!
中科大提出All-in-One多模态预训练方法,利用统一的多模态互信息提升多模态性能,下游检测分割性能超过BEIT V3!
微软亚研提出了小模型蒸馏方法TinyMIM!MIM预训练小模型性能提升4个百分点!目前模型和代码均已开源!
2024 AI夏令营 第四期|【从零入门多模态大模型数据合成】开营仪式
AI 快速生成论文写作框架!
Llama 3.1 一键本地部署!Meta 最强开源大模型,100%保证成功,无需GPU也能运行,可离线使用 | 零度解说