V
主页
京东 11.11 红包
NVLM:融合LLaVA和Flamingo架构的多模态大模型系列
发布人
arxiv:https://arxiv.org/pdf/2409.11402 project page:https://nvlm-project.github.io/
打开封面
下载高清视频
观看高清视频
视频下载器
transfusion:统一transformer和diffusion框架的多模态大模型
【LLM前沿】6小时精讲四大多模态大模型CLIP BLIP VIT MLLM及对话机器人办公助手!绝对的通俗易懂的大模型应用教程!
11月官方版GPT4o国内免费使用了!免翻免梯子,零门槛
Emu3:统一理解和生成的多模态大模型
OMG-LLaVA:拥有segmentation能力的视觉多模态大模型
李开复透露「GPT5训练遇到困难,O1模型被迫放出来」OpenAI还有很多私货没有发布
MM-ICL:关于多模态In Context Learning的消融实验
LLaMA-omni:低延时的语言交互多模态大模型
【附代码】超爽中英!2024全网公认最全的(吴恩达大模型LLM微调)系列,看完轻松搭建自己的LLM!
LLaVA-MoD:基于知识蒸馏的小多模态大模型
Janus:基于分离视觉编码器的统一理解与生成的多模态大模型
什么是科研,什么是学术,识时务者为俊杰
Fluid:使用连续token表示,随机顺序生成的自回归文生图模型
AVG-LLaVA:自适应尺度视觉特征选择的多模态大模型
谁懂啊!ai一键产出高质量小说秒过签约一天收益四五张!
mini-omni:实时可交互语音大模型
Cambrian-1:以视觉为中心,基于多个vision encoder的多模态大模型
一行代码不写搞定开发和上线|Cursor + Devbox|AI写代码|全栈开发|Docker|K8S
Aria:基于MoE架构的原生多模态大模型
【多模态+知识图谱】博士轻松带你从零构建知识图谱!基于知识图谱的六大项目实战—医药问答系统、知识抽取、推荐系统、Neo4j数据库、大模型
一辆汽车,需要多少算力?自动驾驶芯片:规控算法与AI大模型
人类寿命即将翻倍?!【诺贝尔奖2024】
LLaMA3.2:LLaMA3.2大模型系列
AI泡沫为什么没有破?
开源AI女友安装教学 [Open-LLM-VTuber]
Points: 融合多个优化策略的多模态大模型
AI短片制作全流程!用FLUX出图+Minimax海螺AI生成视频+DomoAI转绘高清化 制作一个小短片
【导师散养不教】读了100篇文献总结出来的读文献的原则与实操演示,足够你读研用了!(-论文/SCI论文/SCI论文写作/人工智能)
idefics2:视觉多模态大模型的架构探索
Research Track 1:多模态大模型最新的一些论文
Research Track 5:多模态大模型最新的一些论文
大模型项目失败的十大原因(一)
8年设计师,聊聊AI是怎么把我“取代”的:创意工作者如何面对AI浪潮?经历分享与职业建议 | ProArt创艺国度校园行分享记录
MM1.5:Apple多模态大模型系列
40分钟长视频,关于小论文的粉丝千问千答,错过后悔一辈子
突发!台积电停止AI芯片供应!一切疑与华为有关
MarDini:一个基于masked auto-regression和DiT的非对称视频生成模型
AI时代,英语学习已经变的无比简单!
Research Track 6:多模态大模型最新的一些论文
ChartMoE:使用MoE adapter的Chart理解多模态大模型