什么是大模型量化和蒸馏？ - 视频下载 Video Downloader

什么是大模型量化和蒸馏？

发布人

打开封面下载高清视频观看高清视频视频下载器

大语言模型量化简介

大模型量化一网打尽（一）理论基础

【精读AI论文】知识蒸馏

神经网络-量化与部署，进阶之路迟早要越过的大山

模型量化一：量化基础对称量化非对称量化极大值量化零点量化

动手学RAG：Part1 什么是RAG？

1.1模型量化概念及意义

模型压缩架构和流程介绍！量化/剪枝/蒸馏/二值化4件套！【推理系统】模型压缩第01篇

通俗易懂理解自注意力机制（Self-Attention）

【研1基本功（真的很简单）LoRA 低秩微调】大模型微调基本方法1 —— bonus "Focal loss"

最近火爆的GraphRAG是什么？真的那么有用吗？

大模型RAG企业项目实战：手把手带你搭建一套完整的RAG系统，原理讲解+代码解析，草履虫都能学明白！LLM大模型_RAG_大模型微调_多模态

大模型量化部署解析当前应用较广的几种量化部署方案！

模型量化加速

作者亲自讲解：LoRA 是什么？

深度学习模型压缩方法（三）：量化

深度学习模型压缩方法（二）：剪枝

量化 vs 剪枝 vs 蒸馏：为推理优化神经网络！

大模型项目失败的十大原因（一）

什么是端到端（End-to-End）模型？

灵魂发问：知识蒸馏真的有用吗？

如何把RAG和知识图谱结合

知识蒸馏：小模型向大模型学习

大模型项目选择RAG还是微调：八个判断依据

深度学习模型压缩方法（一）：模型蒸馏

微调一个模型需要多少GPU显存？

经典RAG很难解决的问题以及Agent思路

RAG实战中常见的问题

什么是知识图谱？与大模型的关系是什么？

模型量化六：QLoRA 4bit 量化 NormalFloat4 量化

如何知道一个大模型在推理和训练时需要多少显存？

RAG增强检索是如何工作的？

什么是混合专家模型（MoE)？

什么是灾难性遗忘？为什么要重视它？

未来一年大模型发展的八大趋势

吴恩达《深入模型量化|Quantization in Depth》中英字幕

通俗易懂理解大模型预训练和微调

为什么需要智能体（Agent）

【大模型量化】llama.cpp轻量化模型部署及量化

什么是大模型幻觉？为什么会产生幻觉？