V
主页
多模态任务终结者:Meta-Transformer
发布人
【分享人】张懿元香港中文大学 MMLab 博士生,研究方向包括多模态学习和基础模型设计。 【分享内容】1计算机视觉、自然语言处理与3D视觉的融合2多模态下的骨干网络泛化3多模态预训练 Paper:https://readpaper.com/paper/1880723763752826112?channel=OpenMMLab 【OpenMMLab】公众号回复‘社区开放麦’即可获取视频课件。
打开封面
下载高清视频
观看高清视频
视频下载器
多模态论文串讲·上【论文精读·46】
多模态论文串讲·下【论文精读·49】
【研究生速进!】全网最新最全的多模态情感识别前沿论文带读,代码与教程一并打包!——人工智能|AI|计算机视觉|机器学习
Transformer论文逐段精读【论文精读】
什么是多模态?从识别一只猫谈起
CVPR2023 | CDDFuse:多模态图像融合方法
【多模态+大模型+知识图谱】这绝对是B站最全的教程,论文创新点终于解决了!——人工智能|深度学习|aigc|计算机视觉
多模态模型起源【Transformer】四大分支模型:VIT、swintransformer、DETR及Medicaltransformer
基于 Visual Transformer 的分割模型综述
【强推】最新多模态大模型教程了,VIT、Clip、SAM等模型实战,精讲多模态大模型原理,包教包会,看完你就全面了解 人工智能|深度学习|transformer
[2023北京智源大会]视觉与多模态大模型
详解:Agent到底是什么?会成为下一个热潮吗?-北大博士后人工智能专家卢菁博士授课 人工智能|大模型|多模态|AIGC
中科院刘静:多模态预训练的进展回顾与展望(多模态大模型系列【一】)
GPT-4论文精读【论文精读·53】
多模态学习的统一架构!Meta-Transformer实现骨干网络大一统!12种模态,一个学习框架!多模态大模型(MLLM)/ CLIP /计算机视觉
强推!科大讯飞和中科院终于把多模态大模型讲明白了,CLIP、blip、blip2三种模型原理一口气学完,看完还不会你来打我!人工智能|深度学习|多模态
人工智能目前最火爆的方向-【多模态大模型】,科大讯飞前NLP专家花三小时串讲,让你从入门到精通悉数掌握!
Transformer被秒杀?微软最新提出—RetNet模型,性能强,成本低,号称秒杀Transformer模型?(人工智能/深度学习/计算机视觉)
多模态也大一统了?
【双语字幕】CMU《多模态机器学习》课程(2020) by Louis-Philippe Morency
【多模态是什么?】这绝对是全网最好的多模态大模型教程,计算机界大佬5小时精讲,带你吃透多模态知识图谱 、多模态模型、多模态图像融合!
RetNet闪亮登场!transformer可以退下了!成本低、速度快、性能强,微软、清华重大突破!
低成本微调垂直领域专属 ChatGPT
CVPR 2023 | 结合Transformer和CNN的多任务多模态图像融合方法
真的很绝!2023 CVPR|结合Transformer和CNN的多任务多模态图像融合方法- CDDFuse
如何基于大模型构建智能体?多机构百页综述从交互角度详解 AI Agent!
小红书REDtech来了 | 多模态技术在小红书的应用与实践
迈向更强的开集目标检测-From Detection to Grounding
探索未知:LLM Agent 应用开发的全新时代
【沈向洋带你读论文】Transformers 在图学习表征方面真的表现不佳吗?【Transformers】【图学习】
【多模态+知识图谱】2023最好创新的研究方向!从原理推导到项目实战!一天就能学会!——人工智能|AI|多模态|知识图谱|机器学习|深度学习|计算机视觉
极市直播第119期|Meta-Transformer:一个学习框架解决十二种模态
基于大规模多模态扩散模型的文本到视频生成
Transformer对时序预测真的有效吗? | AAAI'23 Oral
多模态大模型的前奏:迈向真实世界的通用感知 | 热门研究云际会#2
Meta-Transformer:用统一框架彻底改变多模态学习
社区开放麦#1|基于关键点的动作识别
多模态 Agents:用大模型语言模型串联多模态专家
【AI Drive】天津大学副教授张长青:多模态融合的基础问题及算法研究
RetNet算法介绍,它真的能继承Transformer?