V
主页
「官方教程」GLM-4-9B 实战部署和微调
发布人
自 2023 年 3 月 14 日开源 ChatGLM-6B 以来,GLM 系列模型受到广泛关注和认可。特别是 ChatGLM3-6B开源以后,开发者对智谱AI 第四代模型的开源充满期待。 为了使小模型(10B 以下)具备更加强大的能力,GLM 技术团队进行了大量探索工作。经过近半年的探索,我们推出了第四代 GLM 系列开源模型:GLM-4-9B。 在预训练方面,我们引入了大语言模型进入数据筛选流程,最终获得了 10T 高质量多语言数据,数据量是 ChatGLM3-6B 模型的 3 倍以上。同时,我们采用了 FP8 技术进行高效的预训练,相较于第三代模型,训练效率提高了 3.5 倍。在有限显存的情况下,我们探索了性能的极限,并发现 6B 模型性能有限。因此,在考虑到大多数用户的显存大小后,我们将模型规模提升至 9B,并将预训练计算量增加了 5 倍。 综合以上技术升级和其他经验,GLM-4-9B 模型具备了更强大的推理性能、更长的上下文处理能力、多语言、多模态和 All Tools 等突出能力。GLM-4-9B 系列模型包括:基础版本 GLM-4-9B(8K)、对话版本 GLM-4-9B-Chat(128K)、超长上下文版本 GLM-4-9B-Chat-1M(1M)和多模态版本 GLM-4V-9B-Chat(8K)。 GitHub仓库链接:https://github.com/THUDM/GLM-4 本期分享嘉宾:@zR_ZYX
打开封面
下载高清视频
观看高清视频
视频下载器
用AI续写新闻联播片头曲,没想到燃成这样
冒死上传!被传疯啦!国外价值399美刀的Comfyui四合一动画工作流!爆肝3个通宵终于研究透了!丝滑流程!comfyui教程 零基础学AI绘画
首个控制材料的Controlnet开源!为了它我们花了半年....
全能战士GLM-4!联网、绘画、编程样样行,大脑(GLM)、手脚(Tools)一应全~
简直逆天!知乎2.7w赞!豆瓣9.5!最好的SCI科研论文写作指导书!看完再也不担心写paper
可灵AI生成的游戏画面,小地图逻辑令我惊讶
返老还童 AI版拜登与特朗普的总统大选辩论
环·大唐迷航【AI影像大赛-科幻赛道】
一段纯ai生成的视频
知名心理学家乔丹·彼得森:提高警惕,AI大模型20%的回答都在撒谎!!
Face-Adapter整合包,低成本面部迁移信息保持,表情迁移,换脸,onnx模型,onnx-runtime,和InstantID相颉顽
国内最好用AI工具TOP10,第一名用好了直接开挂!
CogVLM2:第二代视觉大模型,19B即可比肩 GPT-4V
Runway G3 Alpha电影级的效果简直逆天了🐸
机中0.o二哈,六足机器人
用AI复活照片中的迈克尔·杰克逊!
史上最强ai分镜
义乌轻创业做电商,用AI搞定产品图!
中國AI機器人仿生「微表情」🤖機械狗首現軍演❗️Made By China YYDS
机器人之梦 ⭕️网首发 分享
AI造永动机,claude更新后被玩坏了
探索GLM-4-9B开源模型:ITREX — LLM工具实战
老照片AI自动生成视频,3天赚了1600
【全198集】不愧是吴恩达!一口气讲完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等深度学习神经网络算法,简直不要太爽!
【可灵AI】顺飞顺飞全球可飞
意外吓哭小盆友,六足机器人测试20240621doob
程序员开发AI的原因,竟然是为了自己偷懒?
【自制】我开发了一个通用机器人大脑!【硬核】
【干货分享】稳定丝滑视频转绘技术——Diffutoon在ComfyUI中的使用
这个AI的声音太好听了,差点错过了更强大的功能
做了一个命令行小工具,用 GPT 自动生成 Git 提交信息,完善 Git 仓库代码管理。
我开发AI自动剪辑软件,坚持免费两年,结局是……
【Ai复古】义和团练拳珍贵录像
【可灵AI】小猫咪用筷子夹面条吃
“我被人机验证给气炸了”
梦中的婚礼(冰冰x猫梓子)
Claude又出了一个提示词生成器,为开发者自动生成专业的提示词
TouchDesigner插件|ChatAI最全AI模型接入助手
【SD3训练教程】SD3训练包更新!新增学习率调节器、新优化器!AI教程25
卧槽!无需代码的国产游戏制作神器终于来了!