GLM-4V：如何让大模型具备视觉理解

发布人

本视频介绍了CogView 、CogVLM、CogAgent 以及基于这些模型基础上研发的 GLM-4V。

目前GLM-4V 已经上线 智谱清言（chatglm.cn），并能够在智谱API平台进行调用（bigmodel.cn）

打开封面下载高清视频观看高清视频视频下载器

【GLM-4】一键包智谱AI开源新模型已添加自适配代码

【ChatGLM】本地版ChatGPT？6G显存可用！ChatGLM-6B 清华开源模型一键包发布可更新

视觉大模型：从分割一切、联系一切到跟踪一切

单卡 4090 部署智谱 GLM-4-9B-Chat，30s 极速体验！

GLM-4开源版本终于来了！！超越Llama3，多模态比肩GPT4V，MaaS平台也大升级

清华智谱开源视觉大模型 CogVLM，可免费商用

【保姆级教程】6小时掌握开源大模型本地部署到微调，从硬件指南到ChatGLM3-6B模型部署微调实战｜逐帧详解｜直达技术底层

GLM-4-9B开源模型零门槛部署调用流程｜GLM-4-9B-chat模型与GLM-4v-9B模型部署与调用

智谱发布GLM-4，性能直逼GPT-4

智谱GLM-4-9B开源多模态视觉图生文大模型实测，超越Llama3，比肩GPT4V，本地搭建部署教程，OCR 文字识别强大

智谱清言 GLM-4 好用吗？

GLM-4 两个核心：scaling & 对齐

全能战士GLM-4！联网、绘画、编程样样行，大脑（GLM）、手脚（Tools）一应全～

上海2024 端到端具身智能体技术研讨会 | 视觉语言大模型与自动驾驶（赵行）

作者亲自讲解：LoRA 是什么？

用GLM 4v + Chat TTS实现给大模型加上视觉和声音

ChatGLM+Langchain构建本地知识库，只需6G显存，支持实时上传文档

ChatGLM4性能暴涨但不再开源！详解GLM4模型性能，剖析在线模型技术发展道路！

GLM4 9B - 环境准备和 vllm 部署

万字测评！18个主流大模型深度评测，读懂AI现状【深度模评03】

ChatGLM2 全面放开，正式服务！大家好，我叫「智谱清言」，清言的「清」，清言的「言」

美图自研AI视觉大模型MiracleVision3.0发布！

国内AI大模型：智谱清言vs讯飞星火，谁更胜一筹？

【ChatGLM3-6B】本地部署一键包带训练版

【多模态+大模型+知识图谱】绝对是B站最全的教程，论文创新点终于解决了！——人工智能|深度学习|aigc|计算机视觉

【ChatGLM金融大模型挑战赛 · 决赛项目】01 - 馒头科技

ChatGLM3 一键安装，懒人专属

【Github热门】GLM-4-9B 终于开源了！通用能力超越Llama 3！多模态比肩GPT4V，最多可阅读200万字！

【CogAgent】一键包带Agent能力的视觉模型

视觉大模型-LVM，计算机视觉的GPT时刻来了吗？

【官方教程】ChatGLM + LangChain 实践培训

【ChatGLM3】最强的离线开源版ChatGPT，一键部署，解压即用

【CharacterGLM-6B】一键包 GLM角色扮演模型千呼万唤始出来！

具身智能多模态基础：0. 视觉大模型开篇

纳西妲测试最新发布的GLM4-9B

【ComfyUI】拥有GLM4视觉功能的全新插件,超强助力图像理解！

视觉大模型已出？CV将死？

超越GPT-4o视觉能力？本地部署Qwen2-VL多模态视觉大模型！超越人类的视觉理解能力，精准识别X光片判断骨折、CT扫描检测癌症，还能识别手写体汉字与英文！

【官方教程】ChatGLM3-6B 部署和微调（Function Call、Code Interpreter、Agent）

GLM-4V：如何让大模型具备视觉理解

【GLM-4】一键包 智谱AI开源新模型 已添加自适配代码

【ChatGLM】本地版ChatGPT？6G显存可用！ChatGLM-6B 清华开源模型一键包发布 可更新

视觉大模型：从分割一切、联系一切到跟踪一切

单卡 4090 部署智谱 GLM-4-9B-Chat，30s 极速体验！

最新开源大语言模型GLM-4模型详细教程—环境配置+模型微调+模型部署+效果展示

GLM-4开源版本终于来了！！超越Llama3，多模态比肩GPT4V，MaaS平台也大升级

清华智谱开源视觉大模型 CogVLM，可免费商用

【保姆级教程】6小时掌握开源大模型本地部署到微调，从硬件指南到ChatGLM3-6B模型部署微调实战｜逐帧详解｜直达技术底层

GLM-4-9B开源模型零门槛部署调用流程｜GLM-4-9B-chat模型与GLM-4v-9B模型部署与调用

智谱发布GLM-4，性能直逼GPT-4

智谱GLM-4-9B开源多模态视觉图生文大模型实测，超越Llama3，比肩GPT4V，本地搭建部署教程，OCR 文字识别强大

智谱清言 GLM-4 好用吗？

GLM-4 两个核心：scaling & 对齐

全能战士GLM-4！联网、绘画、编程样样行，大脑（GLM）、手脚（Tools）一应全～

上海2024 端到端具身智能体技术研讨会 | 视觉语言大模型与自动驾驶（赵行）

作者亲自讲解：LoRA 是什么？

用GLM 4v + Chat TTS实现给大模型加上视觉和声音

ChatGLM+Langchain构建本地知识库，只需6G显存，支持实时上传文档

ChatGLM4性能暴涨但不再开源！详解GLM4模型性能，剖析在线模型技术发展道路！

GLM4 9B - 环境准备和 vllm 部署

万字测评！18个主流大模型深度评测，读懂AI现状【深度模评03】

ChatGLM2 全面放开，正式服务！大家好，我叫「智谱清言」，清言的「清」，清言的「言」

美图自研AI视觉大模型MiracleVision3.0发布！

国内AI大模型：智谱清言vs讯飞星火，谁更胜一筹？

【ChatGLM3-6B】本地部署一键包 带训练版

【多模态+大模型+知识图谱】绝对是B站最全的教程，论文创新点终于解决了！——人工智能|深度学习|aigc|计算机视觉

【ChatGLM金融大模型挑战赛 · 决赛项目】01 - 馒头科技

ChatGLM3 一键安装，懒人专属

【Github热门】GLM-4-9B 终于开源了！通用能力超越Llama 3！多模态比肩GPT4V，最多可阅读200万字！

【CogAgent】一键包 带Agent能力的视觉模型

视觉大模型-LVM，计算机视觉的GPT时刻来了吗？

【官方教程】ChatGLM + LangChain 实践培训

【ChatGLM3】最强的离线开源版ChatGPT，一键部署，解压即用

【CharacterGLM-6B】一键包 GLM角色扮演模型 千呼万唤始出来！

具身智能多模态基础：0. 视觉大模型开篇

纳西妲测试最新发布的GLM4-9B

【ComfyUI】拥有GLM4视觉功能的全新插件,超强助力图像理解！

视觉大模型已出？CV将死？

超越GPT-4o视觉能力？本地部署Qwen2-VL多模态视觉大模型！超越人类的视觉理解能力，精准识别X光片判断骨折、CT扫描检测癌症，还能识别手写体汉字与英文！

【官方教程】ChatGLM3-6B 部署和微调（Function Call、Code Interpreter、Agent）

【GLM-4】一键包智谱AI开源新模型已添加自适配代码

【ChatGLM】本地版ChatGPT？6G显存可用！ChatGLM-6B 清华开源模型一键包发布可更新

【ChatGLM3-6B】本地部署一键包带训练版

【CogAgent】一键包带Agent能力的视觉模型

【CharacterGLM-6B】一键包 GLM角色扮演模型千呼万唤始出来！