V
主页
多模态大模型串讲
发布人
我上的这堂课,在咕泡上过。咕泡的也是正版,之前写的误伤友军
打开封面
下载高清视频
观看高清视频
视频下载器
大模型量化一网打尽(一)理论基础
读研期间,如何快速构建知识图谱?跟着博士轻松搞懂多模态大模型+知识图谱!(知识抽取|Graph RAG|多模态知识图谱|Neo4j|医药问答系统)
【PyTorch+多模态大模型】使用PyTorch从零构建多模态视觉大模型!博士串讲CLIP、BLIP-2、对比学习、LLM
Emu3:统一理解和生成的多模态大模型
PDF转HTML格式,专精于OCR识别的多模态大模型,适配多场景多功能。从原理到效果实测,带你一步一步解析。
mPLUG-DocOwl2:多页多模态文档理解大模型
大模型课程L2: 基于Pytorch手把手从头实现Transformer
本地部署Molmo-7B多模态大模型媲美Llama3.2-90B!全方位测评:图像识别、视频分析,打造多模态视觉AI助手!轻松实现监控视频快速找人
LLaMA-omni:低延时的语言交互多模态大模型
【多模态+大模型+知识图谱】2024完整版:这绝对是B站最全的教程,论文创新点终于解决了!——人工智能/深度学习/aigc/计算机视觉
大模型量化一网打尽(第二部分)
VILA-U:端到端的统一理解和生成任务的多模态大模型
多模态高清解码原理
使用PyTorch从零构建多模态视觉大模型!油管大佬精讲基于transformer的大模型及对比学习!Openai Dalle2建模分析、CLIP模型、
大模型为什么跌到了白菜价
跨模态细粒度高清检索项目
Cambrian-1:以视觉为中心,基于多个vision encoder的多模态大模型
OMG-LLaVA:拥有segmentation能力的视觉多模态大模型
医学生必看!博士精讲大模型+医学应用!1小时搞懂大模型技术如何赋能医学影像、临床研究实战!视觉大模型、多模态大模型
NVLM:融合LLaVA和Flamingo架构的多模态大模型系列
大模型量化一网打尽(三)实战
从零开始用 LoRA 微调 transformer 大模型
Qwen2-VL:支持任意精度图片以及视频输入的开源大模型系列
SlowFast-LLaVA:无需训练的视频理解多模态大模型
基于多模态大模型开源OCR2.0模型
阿尔特曼:o1仅仅是“推理模型的GPT-2”;黄仁勋:我给你加速50倍
【基于PyTorch从零构建多模态(视觉)大模型 by Umar Jamil】
代码实现大模型强化学习(PPO),看这个视频就够了。
LongLLaVA:基于Jamba的多图理解多模态大模型
AI圈疯传!国内外目前大模型书籍中评分最高的新书!还没出版就拿下25.5w satr!从零开始构建LLM大语言模型教程
吴恩达大模型系列:多模态 RAG:通过视频聊天丨Multimodal RAG: Chat with Videos 附课件+代码
0.5B小模型将原始HTML完美转换为干净的Markdown,或许专用场景的小模型才是未来主流
通义千问大模型,霸榜高分,极致Open ~
LLaMA3.2:LLaMA3.2大模型系列
DPO:人类偏好对齐技术——大模型训练的最后一公里
LongCite:让大模型精准找到 {引用}
AI 大模型周报 2024年10月 a
Research Track 2: 多模态大模型最新的一些论文
个人非常推荐的GraphRag相关的论文(附代码),不像Microsoft官方的graphRag那么复杂,这篇论文更偏向于阐述LLM和KG的结合范式的研究。
有点恶心,但是一周可以拿5个大模型岗offer