V
主页
模型剪枝核心原理!模型剪枝算法和流程介绍!Model Pruning深度解析【推理引擎】模型压缩05
发布人
【推理引擎】模型压缩05:模型剪枝核心原理!模型剪枝算法和流程介绍!Model Pruning深度解析!——模型剪枝研究模型权重中的冗余, 并尝试删除/修剪冗余和非关键的权重。虽然模型剪枝的算法层出不穷,近年来也是越来越多的剪枝算法被工业界所真正应用,但究其分类主要分为Unstructured Pruning(非结构化剪枝)和 Structured Pruning(结构化剪枝)两种。
打开封面
下载高清视频
观看高清视频
视频下载器
模型压缩架构和流程介绍!量化/剪枝/蒸馏/二值化4件套!【推理系统】模型压缩第01篇
知识蒸馏原理介绍!知识从哪里来怎么蒸馏?【推理引擎】模型压缩系列第06篇(上)
低比特量化基本原理!【推理引擎】模型压缩系列第02篇
Kernel优化架构介绍!【推理引擎】Kernel优化第01篇
推理系统和推理引擎的不同之处在哪?【推理系统】系列02篇
感知量化训练QAT原理!伪量化节点计算方式!【推理引擎】模型压缩系列第03篇
推理引擎架构介绍!MNN、TF Lite、TensorRT介绍!【推理系统】系列05篇(上)
推理系统架构和Trition架构介绍!【推理系统】系列04篇
什么是推理系统?推理有哪些应用?【推理系统】系列01篇
推理引擎架构!MNN、TensorRT架构介绍!【推理系统】系列05篇(下)
CNN模型小型化算法总结!ESPnet/GhostNet系列介绍!【推理系统】模型小型化第03篇
CNN模型小型化原理!SqueezeNet/ShuffleNet/MobileNet系列介绍!【推理系统】模型小型化第02篇
知识蒸馏SOTA算法解读!【推理引擎】模型压缩系列第06篇(下)
计算图优化策略!【推理引擎】离线优化系列第01篇
Flash Attention原理!数据布局转换与内存优化!【推理引擎】离线优化第04篇
离线转换模块架构与流程!【推理引擎】离线转换系列第01篇
深入GPU原理:线程和缓存关系【AI芯片】GPU原理01
模型序列化和反序列化原理!【推理引擎】离线转换系列第02篇
算子融合/算子替换/算子前移优化!【推理引擎】离线优化第03篇
卷积优化:Im2Col算法和组合优化算法【推理引擎】Kernel优化第03篇
训练后量化PTQ深度解读!与量化部署核心原理!【推理引擎】模型压缩系列第04篇
AI芯片涉及哪些知识?【AI芯片】内容简介
如何自定义计算图IR?【推理引擎】离线转换系列第03篇
卷积优化:Winograd算法【推理引擎】Kernel优化第04篇
Transformer轻量化SOTA模型原理!【推理系统】模型小型化第04篇
大模型训练需要多少GPU?大模型显存怎么算? #大模型 #AI系统
大模型为什么需要微调?有哪些微调方式?#大模型 #微调
QNNPack之间接优化算法【推理引擎】Kernel优化第05篇
模型转换技术细节!【推理引擎】离线转换系列第04篇
云侧和端侧推理方式的特点和区别!【推理系统】系列03篇
如何计算模型参数量?什么是FLOPS和MACC?【推理系统】模型小型化第01篇
常量折叠与冗余节点消除优化!计算图优化Details!【推理引擎】离线优化第02篇
LLVM架构了解下?为什么LLVM这么火?一起初体验实操LLVM【AI编译器】系列第四篇
OpenAI o1大模型炸了,数学逻辑推导能力堪比博士! #大模型 #OpenAI
分布式并行策略基础介绍!【分布式并行】系列第01篇
分布式训练、分布式集群的基础介绍!【分布式集群】第01篇
LLVM IR详解!LLVM编译器的核心理念来啦!【AI编译器】系列第五篇(上)
为什么AI框架都用计算图?什么是计算图?到底计算图有什么用?【计算图】系列第二篇
大模型的训练流程是什么?详解大模型预训练和微调间区别 #大模型 #微调
为什么需要集合通信?NCCL的架构是什么样? #大模型 #通信 #集合通信