V
主页
京东 11.11 红包
模型量化加速
发布人
课程汇报,参考引用了网上很多资料,有问题欢迎提出。
打开封面
下载高清视频
观看高清视频
视频下载器
大模型量化一网打尽(一)理论基础
吴恩达《深入模型量化|Quantization in Depth》中英字幕
Quantization aware training(神经网络量化训练)
神经网络量化
模型量化 quantization
模型量化六:QLoRA 4bit 量化 NormalFloat4 量化
1.1模型量化概念及意义
深度学习模型压缩方法(一):模型蒸馏
模型量化一:量化基础 对称量化 非对称量化 极大值量化 零点量化
【大模型量化】llama.cpp轻量化模型部署及量化
模型压缩架构和流程介绍!量化/剪枝/蒸馏/二值化4件套!【推理系统】模型压缩第01篇
【已完结】量化神经网络白皮书 2021
1. 量化流程
大语言模型量化简介
大模型量化一网打尽(三)实战
大模型量化是怎么实现的——transformers源码解读
大模型量化部署 解析当前应用较广的几种量化部署方案!
深度学习模型压缩方法(三):量化
如何将大模型快速转化为对应的GPTQ量化模型,十分钟快速拥有自己的GPTQ模型
AI 开发中模型量化相关的技术实践
什么是模型量化model quantization, 推荐一个用AI做PPT目前最好的工具
模型量化压缩(Pytorch)
大语言模型推理:优化关键技术解析
商汤科技丨如何做模型量化,训练极低比特网络
大模型量化一网打尽(第二部分)
一分钟学会 ONNX模型INT8量化
5、模型压缩与加速
利用 NVIDIA TensorRT-LLM 加速大模型推理
【精读AI论文】知识蒸馏
深度学习之模型优化—理论实践篇(搞定模型剪枝量化蒸馏神经网络搜索,这一门课就够了)
yolo系列模型的部署、精度对齐与int8量化加速
大模型并发加速部署 解析当前应用较广的几种并发加速部署方案!
深度学习模型压缩方法(二):剪枝
低比特量化基本原理!【推理引擎】模型压缩系列第02篇
深度学习模型部署与模型剪枝优化实践(附源码),搞懂深度学习模型,这一门课就够了!!顶级大佬带你从基础知识到实战,从来都没有听过这么好的课程!!
llama.cpp 源码解析-- CUDA版本流程与逐算子详解
大语言模型量化损失测试 fp16/int8/int4成绩对比
神经网络加速基础知识
详解TensorRT的C++/Python高性能部署,实战应用到项目
大语言模型推理加速