llava-onevision：llava系列集大成者 - 视频下载 Video Downloader

llava-onevision：llava系列集大成者

发布人

project page: https://llava-vl.github.io/blog/2024-08-05-llava-onevision/

打开封面下载高清视频观看高清视频视频下载器

UnifiedMLLM：多任务多模态大模型

BLIP3: 抛弃Q-former的BLIP

VITA: 开源版GPT-4o实现

【全374集】2024最新清华内部版！终于把AI大模型（LLM）讲清楚了！全程干货讲解，通俗易懂，拿走不谢！

Qwen2_math

transfusion：统一transformer和diffusion框架的多模态大模型

LLaVA-MoD：基于知识蒸馏的小多模态大模型

国内ChatGPT最新免费白嫖教程！用到就是赚到！

OMG-LLaVA：拥有segmentation能力的视觉多模态大模型

(超爽中英!) 2024公认最好的【Agent智能体】系列教程！带你从0到1构建自己的智能体！

SHOW-o：统一理解和生成任务的transformer

【Ollama+RAGFlow】快速搭建本地知识库，免费、无限制、保护隐私、无需网络~小白入门必看的保姆级教程！

idefics2：视觉多模态大模型的架构探索

RAG实战系列，如何针对word文档中的表格进行问答，解决跨页表格问题

吹爆！这可能是唯一能将搭建私有化应用讲清楚的教程了，环境搭建-模型准备-模型部署-api调用-知识库构建一条龙解读！草履虫都能学得会！人工智能|大模型

The AI Scientist: 用AI完成科研全栈任务

【附源码】2024最新53个大模型实战项目！练完即就业Ⅰ基础到框架Ⅰ适合小白入门_LLM_RAG_Agent_ChatGPT_Prompt

三分钟一键部署Ollama！解压即用！从安装到微调，只要五步，免费开源 AI 助手 Ollama ，带你从零到精通，保姆级新手教程，100%保证成功！

【数学视角下的Transformer】不愧是MIT数学系的Philippe Rigollett——自注意力机制、深度神经网络、CV+NLP

NVLM：融合LLaVA和Flamingo架构的多模态大模型系列

目前，最满意的本地知识库 Copilot【总第 128 期】

LLaMA3.2：LLaMA3.2大模型系列

agent Q: 超强网页交互agent

【吴恩达最新课程】面向初学者的 AI Python：AI Python 编码基础知识！最适合AI大模型小白的Python入门教程！

GameNGen：使用diffusion model做的游戏引擎

从算法视角理解transformer

RAR：一个基于token shuffling的提升自回归架构图片生成模型表现的策略

北大发布多模态大模型LLaVA-o1，推理计算Scaling新思路

真的超容易“搞深度学习神经网络到底怎么改代码的啊？”复旦博士教我用一本书搞定！

B站强推！不愧是字节大佬讲解的【AI产品经理】教程，23集付费课程（附资料）究极通俗易懂学完即就业！

MM-ICL：关于多模态In Context Learning的消融实验

ChartMoE：使用MoE adapter的Chart理解多模态大模型

【全126集】目前B站最系统的Transformer教程！入门到进阶，全程干货讲解！拿走不谢！（神经网络/NLP/注意力机制/大模型/GPT/RNN）

Points: 融合多个优化策略的多模态大模型

(超爽中英!) 2024公认最好的【生成式AI】系列教程！3小时带你从入门到精通！

VILA-U：端到端的统一理解和生成任务的多模态大模型

【Dify开源项目实战】目前B站最详细的Dify快速入门教程，手把手教你基于Llama 3.1和OpenAI创建聊天机器人与知识库

OLMoE：基于MoE的全开源大模型

【AI大模型】全面对比解析5款开源免费本地知识库，你更适合哪一款？带你一探究竟！

【NeurIPS2024 Oral】VAR：使用next scale prediction，基于自回归架构的图片生成模型