V
主页
【直播连麦回放】AI推理加速/大模型推理/HPC方向的学习、面试和就业答疑讨论会
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
记上周秋招面试一小伙的全过程- AI HPC/AI推理优化方向
【面经】纯原创手写的两篇AI工程开发+CUDA+大模型的面经or知识点
深入解析大模型kimi背后的推理系统解决了什么问题
[C++与深度学习框架] 模板推导再炫技: 统一各个芯片device各个算子的调用和分发机制
全网首篇探究GPU内CUDAcore和TensorCore并行计算
FlashAttentionV1V2算法解释--附为什么没看到处理AttentionMask?
大模型能无限长输出?streamingLLM告诉你答案
(代码实战) 深度学习算子开发必备之高维坐标与一维偏移的互相转换类Index2OffsetHelper
三桶油面试班第一集 免费分享
揭秘NVIDIA大模型加速库FasterTransformer(三),每日一个C++/AI知识点
自制大模型在浏览器上推理:WebAssembly加速现已支持
一起赏析百度Paddle kernelCall源码的C++模板"炫技"show
【TensorRT MoE】全网首篇从TensorRT-LLM CUDA MoE kernel角度理解Mixtral 8x7B的推理加速和展望
AI模型量化为什么不怎么采用per channel粒度来量化激活呢?
大模型提示词泄露与越狱攻击
写CUDA和写好CUDA到底难在哪
再记上周秋招面试一小伙的全过程(v2.0版本)- AI HPC&AI推理优化方向
【直播回放】AI-HPC方向校招笔试如何应对-2024年4月25日场
NV FT解读之大模型smooth quantization, 省GPU必备
为什么有了const又来个constexpr?到底啥区别?每天一个C++/AI知识点
【vLLM】个人视角畅谈大模型推理优化的挑战、现有工作和未来展望
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
【C++与大模型】模板技法实现任意类型下的LLM大模型推理
std::function与函数指针的用法--每日一个C++/AI知识点
【大模型论文解读】Flash decoding++:有些“槽点”的LLM推理优化paper
【直播回放】AI-HPC方向连麦答疑-2024年4月25日场
2025版AI大模型全套视频 (LLM+RAG系统+GPT-4o+OpenAI)这绝对是ai大模型教程天花板!
【直播回放】AI-HPC公司名称篇+应届生时间线安排-2024年4月6日场
大模型时代下的端到端自动驾驶(上篇)
【设计模式专场】揭秘C++面试高频之迭代器模式
【fastgpt喂饭教程】最新开源AI知识库 FastGPT,手把手教你搭建最强AI知识库
“已读乱回”---结构化面试保命秘籍
这位大佬真他吖的天才!霸榜多天,在笔记本电脑上就可以从零构建大语言模型,简直是有手就行!
【2024最新】轻松掌握提示词工程Prompt Engineering,超简单详细,包教会的!!!
彻底祛魅了!其实事业单位面试根本没有大家想象中那么难……
纯自制非机构的CUDA课程v2.2版本更新~
【破解深度学习】1.2 一句话讲清CNN、RNN、Transformer的区别
【AI大模型实战】两小时带你彻底掌握提示工程(Prompt Engineering)超详细,草履虫都能听懂!!!(大模型|LLM|多模态|人工智能)
温和的走进深度学习(下)
自研的AI工程和CUDA课程全新上线v2.0版本