V
主页
GLM-4V:如何让大模型具备视觉理解
发布人
本视频介绍了CogView 、CogVLM、CogAgent 以及基于这些模型基础上研发的 GLM-4V。 目前GLM-4V 已经上线 智谱清言(chatglm.cn),并能够在智谱API平台进行调用(bigmodel.cn)
打开封面
下载高清视频
观看高清视频
视频下载器
【GLM-4】一键包 智谱AI开源新模型 已添加自适配代码
【ChatGLM】本地版ChatGPT?6G显存可用!ChatGLM-6B 清华开源模型一键包发布 可更新
视觉大模型:从分割一切、联系一切到跟踪一切
单卡 4090 部署智谱 GLM-4-9B-Chat,30s 极速体验!
最新开源大语言模型GLM-4模型详细教程—环境配置+模型微调+模型部署+效果展示
GLM-4开源版本终于来了!!超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
清华智谱开源视觉大模型 CogVLM,可免费商用
【保姆级教程】6小时掌握开源大模型本地部署到微调,从硬件指南到ChatGLM3-6B模型部署微调实战|逐帧详解|直达技术底层
GLM-4-9B开源模型零门槛部署调用流程|GLM-4-9B-chat模型与GLM-4v-9B模型部署与调用
智谱发布GLM-4,性能直逼GPT-4
智谱GLM-4-9B开源多模态视觉图生文大模型实测,超越Llama3,比肩GPT4V,本地搭建部署教程,OCR 文字识别强大
智谱清言 GLM-4 好用吗?
GLM-4 两个核心:scaling & 对齐
全能战士GLM-4!联网、绘画、编程样样行,大脑(GLM)、手脚(Tools)一应全~
上海2024 端到端具身智能体技术研讨会 | 视觉语言大模型与自动驾驶(赵行)
作者亲自讲解:LoRA 是什么?
用GLM 4v + Chat TTS实现给大模型加上视觉和声音
ChatGLM+Langchain构建本地知识库,只需6G显存,支持实时上传文档
ChatGLM4性能暴涨但不再开源!详解GLM4模型性能,剖析在线模型技术发展道路!
GLM4 9B - 环境准备和 vllm 部署
万字测评!18个主流大模型深度评测,读懂AI现状【深度模评03】
ChatGLM2 全面放开,正式服务!大家好,我叫「智谱清言」,清言的「清」,清言的「言」
美图自研AI视觉大模型MiracleVision3.0发布!
国内AI大模型:智谱清言vs讯飞星火,谁更胜一筹?
【ChatGLM3-6B】本地部署一键包 带训练版
【多模态+大模型+知识图谱】绝对是B站最全的教程,论文创新点终于解决了!——人工智能|深度学习|aigc|计算机视觉
【ChatGLM金融大模型挑战赛 · 决赛项目】01 - 馒头科技
ChatGLM3 一键安装,懒人专属
【Github热门】GLM-4-9B 终于开源了!通用能力超越Llama 3!多模态比肩GPT4V,最多可阅读200万字!
【CogAgent】一键包 带Agent能力的视觉模型
视觉大模型-LVM,计算机视觉的GPT时刻来了吗?
【官方教程】ChatGLM + LangChain 实践培训
【ChatGLM3】最强的离线开源版ChatGPT,一键部署,解压即用
【CharacterGLM-6B】一键包 GLM角色扮演模型 千呼万唤始出来!
具身智能多模态基础:0. 视觉大模型开篇
纳西妲测试最新发布的GLM4-9B
【ComfyUI】拥有GLM4视觉功能的全新插件,超强助力图像理解!
视觉大模型已出?CV将死?
超越GPT-4o视觉能力?本地部署Qwen2-VL多模态视觉大模型!超越人类的视觉理解能力,精准识别X光片判断骨折、CT扫描检测癌症,还能识别手写体汉字与英文!
【官方教程】ChatGLM3-6B 部署和微调(Function Call、Code Interpreter、Agent)