V
主页
【多模态论文解读】GOT-OCR2.0
发布人
用LLM做解码器进行感知任务的尝试 https://www.mubu.com/doc/ePIhGnOUUr https://github.com/hzg0601/LLM-Notes https://github.com/chatchat-space/Langchain-Chatchat
打开封面
下载高清视频
观看高清视频
视频下载器
【迄今为止最先进的模型】博士精讲CLIP、BLIP-2等多模态大模型落地应用!视觉Agent、ChatGLM、ChatGPT人工智能AI
PDF转HTML格式,专精于OCR识别的多模态大模型,适配多场景多功能。从原理到效果实测,带你一步一步解析。
【RAG论文解读】GraphRAG
【RAG论文解读】RankRAG
吴恩达同步更新AI课,第52讲:多模态RAG,与视频聊天。Multimodal RAG: Chat with Videos
吴恩达《多模态RAG:与视频对话|Multimodal RAG: Chat with Videos》中英字幕(豆包
基于多模态大模型开源OCR2.0模型
大模型技术栈全览
清华团队开源端到端OCR模型 性能碾压多模态大模型
OCR神器一键提取图片、文档文字,开源免费,本地就能跑!
【多模态+大模型+知识图谱】2024完整版:这绝对是B站最全的教程,论文创新点终于解决了!——人工智能/深度学习/aigc/计算机视觉
【RAG论文解读】Speculative RAG
【论文导读】多模态大语言模型综述(五)多模态幻觉
人工智能助力企业转型:多模态模型
【RAG论文解读】Corrective RAG
【论文导读】BLIP系列(四):BLIP-3
90分钟串讲Attention-Transformer-BERT-GPT
【2024最新】清华大佬一小时带你入门提示词工程(Prompt Engineering),全网最通俗易懂教程,全程干货无废话!大模型|LLM|多模态|人工智能)
【RAG论文解读】Raptor
【PyTorch+多模态大模型】1小时精讲使用PyTorch从零构建多模态视觉大模型!CLIP、BLIP-2、计算机视觉、LLM
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
小白都能听懂的Transformer技术原理详解,带你秒懂Transformer底层逻辑原理
Qwen2-VL-7B实现精准pdf转markdown,从原理、代码实现、存在问题以及优化方向全流程讲解
GraphRAG实现解读【上篇 - 写入】
2024最好出创新点的两个研究方向:对比学习+多模态大模型入门教程!算法解读+论文精讲+代码复现,计算机博士带你轻松搞定论文创新点!
【首发优惠】多模态大模型 前沿算法与实战应用 系列课程第一季:图文与视频理解
【RAG论文解读】RouterLLM
入门必看!9月5日后才开始多模态大模型,没有方向直接照着学,真的分分钟上手人工智能大模型!——机器学习丨深度学习丨计算机视觉丨自然语言处理
【RAG论文解读】IRCoT
从零开始手把手带你基于LangGraph构建Agent智能体,看完这套实战教程,少走99%的弯路!
如何为 RAG 选择合适的文档解析器?
大模型分布式训练(0)分布式通信基本概念
吴恩达大佬又出新课了!《Hugging Face中的开源模型》双语字幕,16集全,建议收藏!-huggingface、开源模型、吴恩达
【基于PyTorch从零构建多模态(视觉)大模型 by Umar Jamil】
大模型上下文扩展技术原理
大模型应用--RAG、Agent及其背后的Prompt Engineering技巧概览
2024大模型RAG企业项目实战:从零开始搭建一套完整的RAG系统,理论+原理+代码深入解析,小白都能学会的实战教程!【LLM大模型+RAG】
transfusion:统一transformer和diffusion框架的多模态大模型
2024最好出创新点的方向:【对比学习+多模态】CLIP模型、Dalle2、多模态3D目标检测、MedCLIP医学图像文本,计算机博士带你轻松搞定论文创新点!
【论文精讲】精讲Diffusion Policy扩散策略:基于扩散模型的机器人动作生成策略