V
主页
AI推理优化视角解读LLaMA模型结构和源代码
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
【vLLM】个人视角畅谈大模型推理优化的挑战、现有工作和未来展望
【大模型论文解读】Flash decoding++:有些“槽点”的LLM推理优化paper
记上周秋招面试一小伙的全过程- AI HPC/AI推理优化方向
【直播连麦回放】AI推理加速/大模型推理/HPC方向的学习、面试和就业答疑讨论会
大模型LLM生成策略:搜索or采样?(搜索篇)
NV FT解读之大模型smooth quantization, 省GPU必备
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
【直播连麦回放】AI推理加速/大模型推理/HPC方向的学习、面试和就业答疑讨论会(中)
大模型做 OCR? Llama OCR 和 Zerox 介绍
大模型能无限长输出?streamingLLM告诉你答案
AI运行时性能优化神器之LRUcache替换算法--每日一个C++/AI知识点
【直播连麦回放】AI推理加速/大模型推理/HPC方向的学习、面试和就业答疑讨论会(下)
大模型Agent+RAG企业级项目实战:带你手把手打造个性化定制数字人,原理讲解+代码解析,草履虫都能学明白!(智能体|知识库|LLM|提示词)
【Agent+RAG】10小时博士精讲AI Agent(人工智能体)系列—提示工程、文本大模型、GPT...
AI 大模型周报 2024年11月 c
B站强推!2024公认最通俗易懂的【AI大模型】教程,全套付费课程(附资料)LLM大模型__RAG_大模型微调_Chinese-LLaMA
【设计模式专场】揭秘C++模板工厂模式
深入解析大模型kimi背后的推理系统解决了什么问题
自研的AI工程和CUDA课程全新上线v2.0版本
揭秘NVIDIA大模型加速库FasterTransformer(三),每日一个C++/AI知识点
【包学包会】不需要高配置!6分钟教会你使用Ollama在本机运行部署llama3.1 || 大模型本地部署、LLM、
C++ string性能优化测试(片尾有抽奖哦不要错过~)
“羊驼”开眼看世界!Llama3.2-vision视觉大测试,AI能看懂什么?
写CUDA和写好CUDA到底难在哪
【TensorRT MoE】全网首篇从TensorRT-LLM CUDA MoE kernel角度理解Mixtral 8x7B的推理加速和展望
【LLM前沿】6小时精讲四大多模态大模型CLIP BLIP VIT MLLM及对话机器人办公助手!绝对的通俗易懂的大模型应用教程!
B站强推!不愧是字节大佬讲解的【AI产品经理】教程,23集付费课程(附资料)究极通俗易懂 学完即就业!
Qwen2.5-Coder接入Cursor,顶尖大模型在个人电脑帮你写代码! | 本地运行集成代码开发器LLM丨一站式搞定低代码开发全流程!
std::function与函数指针的用法--每日一个C++/AI知识点
谈谈AI+HPC的就业方向和范围
【直播回放】AI-HPC岗位名称篇和公司篇-2024年3月24日场(下篇)
大模型RAG企业项目实战:手把手带你基于Langchain搭建一套完整的RAG系统,原理讲解+代码解析,看完就能跑通!LLM大模型_RAG_大模型微调_多模态
一起赏析百度Paddle kernelCall源码的C++模板"炫技"show
C++并不难,跟我一起每日一个C++/AI知识点之C++重载
涩涩模型下载网站!!!全攻略!!!你想要的全都有
【C++与大模型】模板技法实现任意类型下的LLM大模型推理
人人都能参与开发的从0到1大模型GPU推理引擎课程
「Github一周热点47期」llama官方配套资料、低代码框架、网页变化监控工具、工作流编排平台和我的世界AI工具
直逼Torch CUDA dropout性能-每日一个C++/AI知识点
2025版AI大模型全套视频 (LLM+RAG系统+GPT-4o+OpenAI)这绝对是ai大模型教程天花板!