V
主页
LLM推理加速新范式!推测解码(Speculative Decoding)最新综述
发布人
LLM推理加速新范式!推测解码最新综述 - NICE九期 夏鹤明 - 香港理工大学在读PhD 内容大纲 - 大模型推理加速动机: 自回归解码分析 - 推测解码的早期探索:“推测-验证”新范式 - 推测解码:定义、算法及代表性工作 - Spec-Bench:推测解码评测新基准 Unlocking Efficiency in Large Language Model Inference: A Comprehensive Survey of Speculative Decoding
打开封面
下载高清视频
观看高清视频
视频下载器
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
全栈大模型微调框架LLaMA Factory:从预训练到RLHF的高效实现
EMNLP2024分享会之模型对齐主题
EMNLP2024分享会之Agent主题
【保姆级教程】使用LLaMA-Factory,实现Llama3中文增强模型微调+法律大模型微调
EMNLP2024分享会之模型/推理加速主题
【包学包会】不需要高配置!6分钟教会你使用Ollama在本机运行部署llama3.1 || 大模型本地部署、LLM、
RNN卷土重来:基于门控记忆槽的线性注意力机制
FacTool: 生成人工智能中的事实检测 - 用于多任务和多领域场景的工具增强框架
Transformer模型能否进行隐式的推理?一个关于Grokking和泛化的深入探索
蛋白质交流的艺术:ProLLM用'思维链'重新定义蛋白质相互作用预测!
你的模型真的擅长数学吗?MathCheck:大模型数学推理能力的新评估范式
微软+罗格斯大学提出:使用交互式推测解码赋能Agent,将智能体规划速度提高一倍!
Phidata:首个代理 UI - 构建具有记忆、知识、工具和推理能力的代理!(开源)
【李宏毅】2024秋《生成式人工智能导论》教程!LLM大模型入门到进阶,比刷剧爽多了!--附带课件代码
综述 - LLM遇见数学
【RAG项目实战】手把手带你搭建一套完整的RAG系统,原理讲解+代码解析,草履虫都能学明白!LLM大模型/RAG/LangChain/知识库
LLM智能应用开发 L9:大语言模型解析 VI 数据集处理, 微调 [2024南京大学计算机学院选修课]
B站讲的最好的AI大模型实战(2024最新版)LLM+RAG系统+GPT-4o+OpenAI,全部都讲明白了!!
EMNLP2024分享会之多模态主题
Transformer的无限之路:位置编码视角下的长度外推
Deita: 用高质量数据在微调中“四两拨千斤”
【NICE一期】张子殷:代码大模型综述
【全网最牛】2024年最新Langchain0.2版教程,从入门到精通,通俗易懂,看完就会,必看教程!!!!
大语言模型的时间魔法:从共时推理到框架优化
四种方法免费使用ChatGPT-4o 和Claude 3.5 Sonnet的方法,本人亲测有效 | 黄思平
【宝藏级微调教程】使用Llama Factory实现中文llama3微调,这绝对是全B站最用心(没有之一)
【AI大模型】斯坦福CS229夏季新课:LLM大模型深度解析来了
EMNLP2024分享会之模型编辑主题
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI),3天学完,让你少走99%弯路!
6篇NeurIPS'24|大语言模型: 模拟人类信任行为、推理边界框架、偏见放大等
LLMBar:评价用于评估指令遵循的大语言模型
Agent+RAG大模型落地应用实践经验分享(超级干货)
“显微镜”下的RAG:通过 RAGChecker 进行细粒度诊断评估
EMNLP2024分享会之NER、模型微调
(超爽中英!) 2024最好的【吴恩达RAG】教程!更适合程序员,全程干货无废话,学完成为AGI大佬!(附课件+代码)
如何加速大语言模型推理?万字长文综述大语言模型高效推理技术
【11月最新版ChatGPT4.0】免费使用教程!免翻,无任何限制,GPT4o体验分享
【11月官方版ChatGPT】国内免费使用了!免翻,无任何限制,国内即可直接使用,最新GPT4o白嫖分享教程!
LLaMA-MoE:基于参数复用的混合专家模型构建方法探索