V
主页
深度解析Group-Query Attention的finetune和推理加速原理
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
【大模型论文解读】Flash decoding++:有些“槽点”的LLM推理优化paper
【C++与大模型】模板技法实现任意类型下的LLM大模型推理
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)通俗易懂,学完即就业!拿走不谢,学不会我退出IT圈!!!
【TensorRT MoE】全网首篇从TensorRT-LLM CUDA MoE kernel角度理解Mixtral 8x7B的推理加速和展望
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
【C++】你真的了解C++ memcpy吗?来看看它的性能分析
CUDA如何手撸transpose转置算子--每日一个C++/AI知识点
(代码实战) 深度学习算子开发必备之高维坐标与一维偏移的互相转换类Index2OffsetHelper
【直播连麦回放】AI推理加速/大模型推理/HPC方向的学习、面试和就业答疑讨论会(中)
人人都能参与开发的从0到1大模型GPU推理引擎课程
【AI项目实战】全网最适合新手入门的【RAG医疗问答系统】教程:如何搭建一个基于RAG的医疗问答系统,我竟30分钟就搞懂了?
【包学包会】不需要高配置!6分钟教会你使用Ollama在本机运行部署llama3.1 || 大模型本地部署、LLM、
【面经】纯原创手写的两篇AI工程开发+CUDA+大模型的面经or知识点
【Dify开源项目实战 】目前B站最详细的Dify快速入门教程,手把手教你基于Llama 3.1和OpenAI创建聊天机器人与知识库
不看太可惜!又快又准,即插即用!Sage Attention——清华8bit量化Attention
【直播回放】AI-HPC岗位名称篇和公司篇-2024年3月24日场(下篇)
【直播回放】AI-HPC公司名称篇+应届生时间线安排-2024年4月6日场
每日一个C++/AI知识点之C++多态系列1
多头注意力(Multi-Head Attention)
30分钟学会微调Qwen1.8B大模型,轻松实现天气预报功能
每日一个C++/AI知识点之extern ”C“和指针引用区别
AI运行时性能优化神器之LRUcache替换算法--每日一个C++/AI知识点
AI高性能优化:ResNet50静态图优化手段之Pad+Conv2d的融合
【RAG项目实战】手把手带你搭建一套完整的RAG系统,原理讲解+代码解析,草履虫都能学明白!LLM大模型/RAG/LangChain/知识库
4 BERT模型训练1-数据处理(构建mask 训练语料)
揭秘NVIDIA大模型加速库FasterTransformer,每日一个C++/AI知识点
写CUDA和写好CUDA到底难在哪
C++工厂模式之每日一个C++/AI知识点(又要送书咯
【全100集】人工智能课程(理论+实战) 大模型学习路线及框架详解 pytorch transformer详解 大模型rag ChatGLM llama微调
3 GPT2模型实现、训练及推理
自研的AI工程和CUDA课程全新上线v2.0版本
纯自制非机构的CUDA课程v2.2版本更新~
B站强推!2024公认最通俗易懂的【AI大模型】教程,全套付费课程(附资料)LLM大模型__RAG_大模型微调_Chinese-LLaMA
【设计模式专场】揭秘C++设计模式之原型模式
std::function与函数指针的用法--每日一个C++/AI知识点
LLM工程-掌握AI与大型语言模型 - LLM Engineering: Master AI & Large Language Models (LLMs)
【直播回放】AI-HPC方向校招笔试如何应对-2024年4月25日场
计算机系统性能优化之阿姆达尔定律--每日一个C++/AI知识点
深入解析大模型kimi背后的推理系统解决了什么问题
85、Differential Transformer 论文原理逐段讲解