V
主页
多模态 Agents:用大模型语言模型串联多模态专家
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
基于⼤语⾔模型的 AI Agents—Part 1
中科院刘静:多模态预训练的进展回顾与展望(多模态大模型系列【一】)
强推!科大讯飞和中科院终于把多模态大模型讲明白了,CLIP、blip、blip2三种模型原理一口气学完,看完还不会你来打我!人工智能|深度学习|多模态
从第一性原理看大模型Agent技术
低成本微调垂直领域专属 ChatGPT
CVPR 2024 - 具身智能中的多模态三维感知思考
Agent is all you need!动手学Agent应用开发 - 开营仪式
ProAgent:清华发布实现各种场景WorkFlow自动生成的Agent,首次将Agent和RPA完美结合,连使用Zapier/n8n创建工作流都可让机器干了
论文分享《Cognitive Architectures of Language Agents》
LLM Agent应用开发揭秘
【卢菁老师说】Agent就是一场彻头彻尾的AI泡沫
多模态扩散模型的革新应用 | 热门研究云际会#4
如何基于大模型构建智能体?多机构百页综述从交互角度详解 AI Agent!
详解:Agent到底是什么?会成为下一个热潮吗?-北大博士后人工智能专家卢菁博士授课 人工智能|大模型|多模态|AIGC
【官方教程】ChatGLM3-6B 部署和微调(Function Call、Code Interpreter、Agent)
大模型时代通用检测趋势解读及MMDetection未来展望
基于大模型的智能体综述论文解析
探索未知:LLM Agent 应用开发的全新时代
多模态大模型的前奏:迈向真实世界的通用感知 | 热门研究云际会#2
LLaVA:正面硬刚GPT-4V、Cogvlm,开源多模态大模型LLaVA-1.5,130亿参数8个A100一天训完,附运行示例
基于大规模多模态扩散模型的文本到视频生成
关于通义千问大模型你希望了解的一切&多模态能力评测首发!魔搭Agent多模态应用尝鲜!
MMBench:基于ChatGPT的全方位多模能力评测体系
MMDetection:从通用目标检测迈向多模态智能体
大模型、生成模型等前沿分享-密歇根州立大学数据科学与工程实验室专场【Global AI Lab】
AI Agent高端沙龙:1、AI Agent是连接大模型和传统软件数字世界的桥梁;2、解构智能体:如何设计和构建自己的智能体应用;3企业级LLMOps落地实践
清华智谱开源视觉大模型 CogVLM,可免费商用
阿里云AI Agent开源!如何基于开源大模型搭建自己的智能体?
【沈向洋带你读论文】Transformers 在图学习表征方面真的表现不佳吗?【Transformers】【图学习】
CVPR23 | 3D Occupancy 预测冠军方案:FB-OCC
如何高效微调大模型?技术原理与最佳实践揭秘!
多模态任务终结者:Meta-Transformer
大模型角色扮演框架 RoleLLM
【卢菁老师说】国产大模型的尴尬,遥遥领先,一用就废
复旦+米哈游联合推出 :LLM agent研究!原神级的AI小镇究竟长什么样?
迈向更强的开集目标检测-From Detection to Grounding
AutoGen + Flowise = 零代码平台上的超级AI助理
清华智谱AI第三代大语言模型 ChatGLM3发布,性能如何?
【论文一刻】ICCV'23 从蒸馏到自蒸馏:通用归一化损失与定制软标签
【论文一刻 】ICCV'23 从2D图像到3D空间:全新的特征拉升方法 - 3D Deformable Attention