V
主页
什么是大模型量化和蒸馏?
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
大语言模型量化简介
大模型量化一网打尽(一)理论基础
【精读AI论文】知识蒸馏
神经网络-量化与部署,进阶之路迟早要越过的大山
模型量化一:量化基础 对称量化 非对称量化 极大值量化 零点量化
动手学RAG:Part1 什么是RAG?
1.1模型量化概念及意义
模型压缩架构和流程介绍!量化/剪枝/蒸馏/二值化4件套!【推理系统】模型压缩第01篇
通俗易懂理解自注意力机制(Self-Attention)
【研1基本功 (真的很简单)LoRA 低秩微调】大模型微调基本方法1 —— bonus "Focal loss"
最近火爆的GraphRAG是什么? 真的那么有用吗?
大模型RAG企业项目实战:手把手带你搭建一套完整的RAG系统,原理讲解+代码解析,草履虫都能学明白!LLM大模型_RAG_大模型微调_多模态
大模型量化部署 解析当前应用较广的几种量化部署方案!
模型量化加速
作者亲自讲解:LoRA 是什么?
深度学习模型压缩方法(三):量化
深度学习模型压缩方法(二):剪枝
量化 vs 剪枝 vs 蒸馏:为推理优化神经网络!
大模型项目失败的十大原因(一)
什么是端到端(End-to-End)模型?
灵魂发问:知识蒸馏真的有用吗?
如何把RAG和知识图谱结合
知识蒸馏:小模型向大模型学习
大模型项目选择RAG还是微调:八个判断依据
深度学习模型压缩方法(一):模型蒸馏
微调一个模型需要多少GPU显存?
经典RAG很难解决的问题以及Agent思路
RAG实战中常见的问题
什么是知识图谱?与大模型的关系是什么?
模型量化六:QLoRA 4bit 量化 NormalFloat4 量化
如何知道一个大模型在推理和训练时需要多少显存?
RAG增强检索是如何工作的?
什么是混合专家模型(MoE)?
什么是灾难性遗忘?为什么要重视它?
未来一年大模型发展的八大趋势
吴恩达《深入模型量化|Quantization in Depth》中英字幕
通俗易懂理解大模型预训练和微调
为什么需要智能体(Agent)
【大模型量化】llama.cpp轻量化模型部署及量化
什么是大模型幻觉?为什么会产生幻觉?