V
主页
4090单卡可跑丨CogVideoX视频生成模型
发布人
智谱AI开源了「清影」同源的视频生成模型——CogVideoX,让每一位开发者、每一家企业都能自由地开发属于自己的视频生成模型,从而推动整个行业的快速迭代与创新发展。 GitHub:https://github.com/THUDM/CogVideo CogVideoX开源模型包含多个不同尺寸大小的模型,目前我们将开源CogVideoX-2B,它在FP-16精度下的推理仅需18GB显存,微调则只需要40GB显存,这意味着单张4090显卡即可进行推理,而单张A6000显卡即可完成微调。 CogVideoX-2B的提示词上限为226个token,视频长度为6秒,帧率为8帧/秒,视频分辨率为720*480。我们为视频质量的提升预留了广阔的空间,期待开发者们在提示词优化、视频长度、帧率、分辨率、场景微调以及围绕视频的各类功能开发上贡献开源力量。
打开封面
下载高清视频
观看高清视频
视频下载器
「清影」人人能用的AI视频来了!
清影迈入新阶段:10s 时长、4k、60 帧超高清画质、任意尺寸
如何高质量生成文生视频
全新GLM-4v-plus,更强的视频理解能力
「智谱AI OpenDay」新一代视频生成模型 CogVideoX
课程丨Prompt迭代技巧与实战
「官方教程」GLM-4-9B 实战部署和微调
Allegro:开源的SOTA视频生成模型
新清影:模型全面升级、4K、任意比例、自带音效
课程丨指令工程方法与实践
CogAgent:具备GUI能力的大模型
Mochi 1体积最大最为先进的开源视频生成模型,ComfyUI实现
这才是我想要的AI视频,画面、声音一键生成!
Vidu-1.5 多模态模型,支持多图融合生成一致性ai视频
太超前了!谁懂智谱新开源模型“新清影”的含金量
【Stable Diffusion】最强AI生成视频详细教程!极度爆炸的视频生成!真的太实用了,这3个新功能一个比一个炸~(附SD安装包及插件)保姆级AI绘教程
「第一课」GPT快速迁移GLM
Mochi1-Comfyui:16G显存可玩!!最强开源AI视频模型Comfyui工作流
如何高质量使用图生视频
字节跳动推出 X-Portrait 2面部动作表情生成技术,比 Runway Act-One 更强大
Agent丨工作流
4. 买白菜不砍价-基于GLM多智能体协同的法律行业问答系统
喂饭教程!25分钟本地部署Qwen2大模型:配置、微调、部署+效果展示,带你训练自己的行业大模型!
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
LongCite:让大模型精准找到 {引用}
贵阳AI宣传片「清影」生成
9. RedCoast-高可靠低成本的ReactCodeAgent智能协同框架
AI视频赛道最强搅局者:Genmo,开源视频生成技术Mochi 1
北大发布多模态大模型LLaVA-o1,推理计算Scaling新思路
2025版AI大模型全套视频 (LLM+RAG系统+GPT-4o+OpenAI)这绝对是ai大模型教程天花板!
真正的AI Agent来了!AutoGLM初体验
Ollama with Vision - 实现多模态 RAG | Ollama 具备视觉功能,以支持多模态检索增强生成 (RAG)
GLM-4 两个核心:scaling & 对齐
「第二课」GPT快速迁移GLM:代码&Demo
【ChatGLM金融大模型挑战赛 · 决赛项目】01 - 馒头科技
Genmo 开源超高质量视频生成模型Mochi 1 DiT,可商用!
FLUX修脸 修手 提示词反推 高清重绘教程!
ViggleAI新功能上线,一键替换视频中的多个角色
全程干货!低成本手把手教你Fine-Tuning基于Qwen2.5-7B大模型从零微调行业大模型,过程可视化呈现
在Qwen2.5基础上训练的最强表格模型诞生,适配excel、csv和数据库等结构化数据,查询、分析、可视化、建模无压力