V
主页
llava-onevision:llava系列集大成者
发布人
project page: https://llava-vl.github.io/blog/2024-08-05-llava-onevision/
打开封面
下载高清视频
观看高清视频
视频下载器
UnifiedMLLM:多任务多模态大模型
BLIP3: 抛弃Q-former的BLIP
VITA: 开源版GPT-4o实现
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
Qwen2_math
transfusion:统一transformer和diffusion框架的多模态大模型
LLaVA-MoD:基于知识蒸馏的小多模态大模型
国内ChatGPT最新免费白嫖教程!用到就是赚到!
OMG-LLaVA:拥有segmentation能力的视觉多模态大模型
(超爽中英!) 2024公认最好的【Agent智能体】系列教程!带你从0到1构建自己的智能体!
SHOW-o:统一理解和生成任务的transformer
【Ollama+RAGFlow】快速搭建本地知识库,免费、无限制、保护隐私、无需网络~小白入门必看的保姆级教程!
idefics2:视觉多模态大模型的架构探索
RAG实战系列,如何针对word文档中的表格进行问答,解决跨页表格问题
吹爆!这可能是唯一能将搭建私有化应用讲清楚的教程了,环境搭建-模型准备-模型部署-api调用-知识库构建一条龙解读!草履虫都能学得会!人工智能|大模型
The AI Scientist: 用AI完成科研全栈任务
【附源码】2024最新53个大模型实战项目!练完即就业Ⅰ基础到框架Ⅰ适合小白入门_LLM_RAG_Agent_ChatGPT_Prompt
三分钟一键部署Ollama!解压即用!从安装到微调,只要五步,免费开源 AI 助手 Ollama ,带你从零到精通,保姆级新手教程,100%保证成功!
【数学视角下的Transformer】不愧是MIT数学系的Philippe Rigollett——自注意力机制、深度神经网络、CV+NLP
NVLM:融合LLaVA和Flamingo架构的多模态大模型系列
目前,最满意的本地知识库 Copilot【总第 128 期】
LLaMA3.2:LLaMA3.2大模型系列
agent Q: 超强网页交互agent
【吴恩达最新课程】面向初学者的 AI Python:AI Python 编码基础知识!最适合AI大模型小白的Python入门教程!
GameNGen:使用diffusion model做的游戏引擎
从算法视角理解transformer
RAR:一个基于token shuffling的提升自回归架构图片生成模型表现的策略
北大发布多模态大模型LLaVA-o1,推理计算Scaling新思路
真的超容易“搞深度学习神经网络到底怎么改代码的啊?”复旦博士教我用一本书搞定!
B站强推!不愧是字节大佬讲解的【AI产品经理】教程,23集付费课程(附资料)究极通俗易懂 学完即就业!
MM-ICL:关于多模态In Context Learning的消融实验
ChartMoE:使用MoE adapter的Chart理解多模态大模型
【全126集】目前B站最系统的Transformer教程!入门到进阶,全程干货讲解!拿走不谢!(神经网络/NLP/注意力机制/大模型/GPT/RNN)
Points: 融合多个优化策略的多模态大模型
(超爽中英!) 2024公认最好的【生成式AI】系列教程!3小时带你从入门到精通!
VILA-U:端到端的统一理解和生成任务的多模态大模型
【Dify开源项目实战 】目前B站最详细的Dify快速入门教程,手把手教你基于Llama 3.1和OpenAI创建聊天机器人与知识库
OLMoE:基于MoE的全开源大模型
【AI大模型】全面对比解析5款开源免费本地知识库,你更适合哪一款?带你一探究竟!
【NeurIPS2024 Oral】VAR:使用next scale prediction,基于自回归架构的图片生成模型