CNN模型小型化算法总结！ESPnet/GhostNet系列介绍！【推理系统】模型小型化03 - 视频下载 Video Downloader

CNN模型小型化算法总结！ESPnet/GhostNet系列介绍！【推理系统】模型小型化03

发布人

【推理系统】模型小型化03：CNN模型小型化算法总结！ESPnet/GhostNet系列介绍！

 轻量级网络的核心是在尽量保持精度的前提下，从体积和速度两方面对网络进行轻量化改。本视频内容主要是对CNN的模型小型化进行介绍，特别是ESPnet/GhostNet 系列进行详细展开，最后对轻量化网络模型的演进点进行总结。

打开封面下载高清视频观看高清视频视频下载器

模型压缩架构和流程介绍！量化/剪枝/蒸馏/二值化4件套！【推理系统】模型压缩第01篇

如何计算模型参数量？什么是FLOPS和MACC？【推理系统】模型小型化第01篇

低比特量化基本原理！【推理引擎】模型压缩系列第02篇

CNN模型小型化原理！SqueezeNet/ShuffleNet/MobileNet系列介绍！【推理系统】模型小型化第02篇

什么是推理系统？推理有哪些应用？【推理系统】系列01篇

知识蒸馏原理介绍！知识从哪里来怎么蒸馏？【推理引擎】模型压缩系列第06篇(上)

Transformer轻量化SOTA模型原理！【推理系统】模型小型化第04篇

Kernel优化架构介绍！【推理引擎】Kernel优化第01篇

推理引擎架构介绍！MNN、TF Lite、TensorRT介绍！【推理系统】系列05篇(上)

卷积优化：Im2Col算法和组合优化算法【推理引擎】Kernel优化第03篇

模型剪枝核心原理！模型剪枝算法和流程介绍！Model Pruning深度解析【推理引擎】模型压缩系列第05篇

感知量化训练QAT原理！伪量化节点计算方式！【推理引擎】模型压缩系列第03篇

云侧和端侧推理方式的特点和区别！【推理系统】系列03篇

推理引擎架构！MNN、TensorRT架构介绍！【推理系统】系列05篇(下)

知识蒸馏SOTA算法解读！【推理引擎】模型压缩系列第06篇(下)

推理系统架构和Trition架构介绍！【推理系统】系列04篇

推理系统和推理引擎的不同之处在哪？【推理系统】系列02篇

计算图优化策略！【推理引擎】离线优化系列第01篇

算子融合/算子替换/算子前移优化！【推理引擎】离线优化第03篇

卷积优化：Winograd算法【推理引擎】Kernel优化第04篇

QNNPack之间接优化算法【推理引擎】Kernel优化第05篇

训练后量化PTQ深度解读！与量化部署核心原理！【推理引擎】模型压缩系列第04篇

模型序列化和反序列化原理！【推理引擎】离线转换系列第02篇

Flash Attention原理！数据布局转换与内存优化！【推理引擎】离线优化第04篇

AI芯片涉及哪些知识？【AI芯片】内容简介

模型转换技术细节！【推理引擎】离线转换系列第04篇

为什么AI框架都用计算图？什么是计算图？到底计算图有什么用？【计算图】系列第二篇

大模型推理需要多大的显存？ #大模型 #AI系统 #推理 #显存

大模型为什么需要微调？有哪些微调方式？#大模型 #微调

向量数据库介绍，Vector和Embedding关系 #大模型 #向量数据库

分布式并行策略基础介绍！【分布式并行】系列第01篇

大模型整体架构、大模型全流程介绍 #大模型 #AI系统

深入GPU原理：线程和缓存关系【AI芯片】GPU原理01

如何自定义计算图IR？【推理引擎】离线转换系列第03篇

大模型是怎么训起来的？分布式并行框架介绍 #大模型 #分布式并行 #训练

离线转换模块架构与流程！【推理引擎】离线转换系列第01篇

分布式训练总结！【大模型与分布式训练】系列第07篇

分布式训练、分布式集群的基础介绍！【分布式集群】第01篇

推理引擎内存布局方式【推理引擎】Kernel优化第06篇

PyTorch数据并行怎么实现？DP、DDP、FSDP数据并行原理？【分布式并行】系列第02篇