【卢菁老师说】大模型占用显存的计算方式

发布人

在这个大模型横行的时代
动辄几十上百亿的参数
对GPU显存要求越来越高
那在玩大模型的时候
到底多少显存才够用
这个是可以根据模型预先计算出来的
当你拿到一个模型首先看模型的版本
比如llama就有7B 13B 70B三个版本
1B是10亿
7B就是有70亿个参数
其次要看模型参数的精度
通常有float32 float16 int8 int4这几种精度
学过计算机的都知道
一个float32占用4个字节32比特
一个float16减少一半
以此类推 int8 int4占用空间依次减半
有了这些基础
根据拿到的模型版本和参数精度
我们就可以计算出
要部署这个模型需要的显存数量
我们来计算下
llama-7B模型在不同精度下的显存占用
70亿个参数
精度为float32每个参数占用4个字节
我们可以计算出来大约需要26G显存
根据这个结果
那么半精度 int8 int4依次除以2
就能计算出来
精度越低模型准确度损失越大
这个需要根据实际情况
去选择合适的精度
模型在推理过程中
还会产生一些中间结果，会消耗显存，所以还要留有余量
以上计算仅适用于模型推理
如果对模型进行全量参数训练
那需要的显存会大得多，这就诞生了如lora之类的方法

打开封面下载高清视频观看高清视频视频下载器

【卢菁老师说】大模型占用显存的计算方式

人工智能用生成图像的方式来做天气预报

大模型其实没有真正意义上的开源

1300亿参数，国内首个数学大模型MathGPT上线！

大模型的成本和应用

【卢菁老师说】中医和人工智能的相似之处

谷歌终于解决了！AI生成图像不再有难点！设计师这个岗位会越来越快的被人工智能所替代。

Cursor十大使用技巧：免费无限量使用Cursor Pro会员指南

清华团队开源文本生成3D图像模型

英伟达悄悄投资了一家AI公司！它将彻底影响短视频的创作...

用语音自动化操作电脑软件的gpt，凭说话控制所有设备，软件的时代正在到来，大模型就是人类和外部世界的智能中介

Meta发布划时代的文生图AI：一句话生成精准的图，能自由修改图里的内容！

振奋！三年突破芯片封锁实现5G 无耻！美国开始调查华为Mate60Pro泄密

【卢菁老师说】人类的智力本质就是神经网络

即插即用的高效多尺度注意力机制模块EMA

复旦大学开源中国版ChatGPT模型Moss _人工智能

国产大模型的罪与罚

AI产生自我意识，「古墓丽影」劳拉觉醒！电子游戏革命来了

让提示词变异 攻破大模型

人工智能对大自然预测错误，反倒可能是大自然错了？利用预测的差异性，来指导酶的突变改造

医疗版ChatGPT直播评测！治疗方案与真人医生96%一致

全民模型的时代已经到来？影像级模型生成工具：Luma AI_人工智能

O1：模型认知智能的突破

ChatGPT“代码解释器”终于全面开放了，魔法升级！

程序员的Ai助手来了！轻松写代码

近日，Meta推出了跨6种感知能力的AI模型——ImageBind，这一模型能将图片与文本、声音、3

国内免翻墙使用chatgpt4.0教程，无需账号，无限次数，安卓手机也可使用。

AI玩的是概率，强求百分百准确是超低性价比的做法。即使不准确，也有办法

在图像的潜在空间修改图像，能达到自然合理的效果。采用运动监督和点跟踪，实现了灵活准确和通用

Michal Kosinski在使用GPT4过程中发现，它竟然要求我提供一份自己的文档 并编写了一份python 代码在机器里，随后教授惊奇发现它正引诱人类帮助

小米大模型首次曝光，64亿参数、同参数量级排名第一

大模型的训练门槛被复旦大学打下来了

【赛博省钱大法】

人工智能实现自我改进 _AIGC一步之遥 _agentgpt

英伟达发布重磅研究，AI开始化身细节怪！ 近日，英伟达联合约翰霍普金斯大学推出的 AI 模型Neuralangel，能将 2D 视频片段转化为细节层次丰富的 3

我从来不用自己剪视频，因为我会用AI

AI绘画又整新活了，无限拉近或拉远生成的图片 _AI _AI绘画

图片编辑（image editing)是一大类方向，而最简单的无疑是通过对话来修改图片。这已不是科幻，不会太久可能就会有工具推出

【卢菁老师说】强烈谴责无良自媒体吹爆大模型

当AI进化到可以反问后

近日，谷歌发布全球首个全科医疗大模型Med-PaLM M。该模型能够理解临床语言、影像图片以及基因组学。

让提示词变异攻破大模型

Michal Kosinski在使用GPT4过程中发现，它竟然要求我提供一份自己的文档并编写了一份python 代码在机器里，随后教授惊奇发现它正引诱人类帮助

英伟达发布重磅研究，AI开始化身细节怪！近日，英伟达联合约翰霍普金斯大学推出的 AI 模型Neuralangel，能将 2D 视频片段转化为细节层次丰富的 3