多模态大模型串讲 - 视频下载 Video Downloader

多模态大模型串讲

发布人

我上的这堂课，在咕泡上过。咕泡的也是正版，之前写的误伤友军

打开封面下载高清视频观看高清视频视频下载器

大模型量化一网打尽（一）理论基础

读研期间，如何快速构建知识图谱？跟着博士轻松搞懂多模态大模型+知识图谱！（知识抽取｜Graph RAG｜多模态知识图谱｜Neo4j｜医药问答系统）

【PyTorch+多模态大模型】使用PyTorch从零构建多模态视觉大模型！博士串讲CLIP、BLIP-2、对比学习、LLM

Emu3：统一理解和生成的多模态大模型

PDF转HTML格式，专精于OCR识别的多模态大模型，适配多场景多功能。从原理到效果实测，带你一步一步解析。

mPLUG-DocOwl2：多页多模态文档理解大模型

大模型课程L2: 基于Pytorch手把手从头实现Transformer

本地部署Molmo-7B多模态大模型媲美Llama3.2-90B！全方位测评：图像识别、视频分析，打造多模态视觉AI助手！轻松实现监控视频快速找人

LLaMA-omni：低延时的语言交互多模态大模型

【多模态+大模型+知识图谱】2024完整版：这绝对是B站最全的教程，论文创新点终于解决了！——人工智能/深度学习/aigc/计算机视觉

大模型量化一网打尽(第二部分）

VILA-U：端到端的统一理解和生成任务的多模态大模型

多模态高清解码原理

使用PyTorch从零构建多模态视觉大模型！油管大佬精讲基于transformer的大模型及对比学习！Openai Dalle2建模分析、CLIP模型、

大模型为什么跌到了白菜价

跨模态细粒度高清检索项目

Cambrian-1：以视觉为中心，基于多个vision encoder的多模态大模型

OMG-LLaVA：拥有segmentation能力的视觉多模态大模型

医学生必看！博士精讲大模型+医学应用！1小时搞懂大模型技术如何赋能医学影像、临床研究实战！视觉大模型、多模态大模型

NVLM：融合LLaVA和Flamingo架构的多模态大模型系列

大模型量化一网打尽（三）实战

从零开始用 LoRA 微调 transformer 大模型

Qwen2-VL：支持任意精度图片以及视频输入的开源大模型系列

SlowFast-LLaVA：无需训练的视频理解多模态大模型

基于多模态大模型开源OCR2.0模型

阿尔特曼：o1仅仅是“推理模型的GPT-2”；黄仁勋：我给你加速50倍

【基于PyTorch从零构建多模态（视觉）大模型 by Umar Jamil】

代码实现大模型强化学习(PPO)，看这个视频就够了。

LongLLaVA:基于Jamba的多图理解多模态大模型

AI圈疯传！国内外目前大模型书籍中评分最高的新书！还没出版就拿下25.5w satr！从零开始构建LLM大语言模型教程

吴恩达大模型系列：多模态 RAG：通过视频聊天丨Multimodal RAG: Chat with Videos 附课件+代码

0.5B小模型将原始HTML完美转换为干净的Markdown，或许专用场景的小模型才是未来主流

通义千问大模型，霸榜高分，极致Open ~

LLaMA3.2：LLaMA3.2大模型系列

DPO:人类偏好对齐技术——大模型训练的最后一公里

LongCite：让大模型精准找到 {引用}

AI 大模型周报 2024年10月 a

Research Track 2: 多模态大模型最新的一些论文

个人非常推荐的GraphRag相关的论文（附代码），不像Microsoft官方的graphRag那么复杂，这篇论文更偏向于阐述LLM和KG的结合范式的研究。

有点恶心，但是一周可以拿5个大模型岗offer