V
主页
沉浸式大模型面试,你能扛到第几枪?
发布人
只为给大家分享大模型面试题: 1,为什么Transformer推理需要做KV缓存? 2,具体是怎么做的? 3,带有 KV 缓存的大模型推理过程,包含几个阶段? 4,每个阶段的具体工作? 5,一般用什么数据类型来存储 KV 张量? 6,如何估算 KV 缓存消耗的显存大小? 7,使用KV缓存有什么缺点? 8,有什么解决方案? 9,实际项目中一般会使用哪些量化策略? 10,量化有没有什么缺点? 11,针对缺陷的优化方案? 12,讲讲KV缓存的最新工作和paper!
打开封面
下载高清视频
观看高清视频
视频下载器
奇葩问题把李沐大神整不会了
211百度程序员伪装成专科面试,面试官:别让我跪下来求你别走
大模型算法,看了n份简历后我的建议是
未来一年大模型发展的八大趋势
留学生小组pre经典开局
经典RAG很难解决的问题以及Agent思路
说句真话,走专家线没前途!
【大模型面试】Flash Attention面试连环炮,淘汰80%面试竞争者
⏱️78s看懂FlashAttention【有点意思·1】
大模型专家,冒充双非1年,期望40K
能救一个是一个!按这个思路读研,秒杀一片
【手撕LLM面试题系列】大模型推理优化
【卢菁老师说】从面试官的角度看大模型岗位的技术要求和准备方向
动手学RAG:Part1 什么是RAG?
能刷掉80%候选人的一道大模型面试题!
AI产品经理面试题:RAG、Agent、LLM区别和联系
【深度学习算法工程师】高频面试题20道(一)
程序员如何接私活指南
【沉浸式大模型面试】RAG项目拷问
llm面试-langchain
大模型面经--微调篇
LLM面试_为什么常用Decoder Only结构
作者亲自讲解:LoRA 是什么?
校招大模型算法岗,如何选择方向 + 准备?
腾讯大模型岗面试好强啊,真的hold不住了!
大语言模型算法工程师面试实战指南
非科班转大模型的信息差
面试官:请写一个堆排序
面试官:如何解决大模型的badcase?
给大模型新人的经验,刷到少走3年弯路!
通俗易懂理解全量微调和LoRA微调
大模型面试现场【八股、项目细节拷问】
【包教包会】一条视频速通AI大模型原理
(超爽中英!) 2024公认最好的【Agent智能体】系列教程!附课件代码 Building Your Own Database Agent
【通关大厂大模型面试】 美团大模型北斗计划面试
LoRA是什么?| 5分钟讲清楚LoRA的工作原理
面试高频题拆解(速成作弊版)
【人工智能】为什么要放弃LangChain? /Octomind资深工程师
其实好多算法工程师干着TM的前后端的活
都发布一个月了【还不会微调Llama3吗】!迪哥十分钟带你微调-量化-部署-应用一条龙解读!草履虫都能学会!!!