V
主页
大语言模型基础架构:稳定性的挑战及集群效率优化
发布人
王淼|NVIDIA 资深解决方案架构师 大模型训练任务流程拆解、做好集群监控、确保环境可靠等先进经验。
打开封面
下载高清视频
观看高清视频
视频下载器
TensorRT-LLM中的 Quantization GEMM(Ampere Mixed GEMM)的 CUTLASS 2.x 实现讲解
知乎AI大模型全栈工程师培养计划,零基础入门到精通【就业前景/学习路线/实战学习/就业】
手机安装运行最新开源的Qwen2-7B-Instruct大语言模型(可断网使用)
TRT-LLM 最佳部署实践
TensorRT 教程 | 基于 8.6.1 版本 | 第一部分
【LangChain入门到实战】从0到1手把手教你,大模型初学者入门必学框架(持续更新ing)
黄仁勋和马克·扎克伯格探讨 AI 和下一代计算平台
[创投沙龙] LLM & XR:GenAI在元宇宙中的应用未来 (Part1)
强推!不愧是公认的讲的最好的【AI大模型全套教程】李宏毅大佬12小时带你从入门到进阶,一套全解决!
Microsoft微软的 GraphRag开源了,如何使用知识图谱(knowledge graph)做大模型RAG增强
【2024最新】从入门到提示词工程师:全网最通俗易懂Prompt-Learning提示词学习教程!学不会我退出IT圈!
基于TensorRT-LLM提升大模型算力使用效率
CUTLASS 2.x 与 3.x 的入门使用
基于 NVIDIA Triton 推理服务器端到端部署 LLM serving
如何通过低代码编程使用一行代码利用 TensorRT将Pytorch推理速度提高 6 倍
【全168集】华为大佬终于把AI大模型落地做成了教程,通俗易懂,2024最新内部版,学完即就业!
FP8 训练的挑战及最佳实践
探索长序列并行:Megatron-Core 的 Context Parallelism 解析
爆肝整理制作!Jetson主控也能使用的六个AI大语言模型,效果直逼ChatGPT!
奔向工业元宇宙
NVIDIA 视频加速技术详解之二:使用 FFmpeg 以及 GMAT 在 GPU 上加速视频编解码
NVIDIA 自动驾驶实验室:如何通过 AI 分割模型增强自动驾驶安全性
【全286集】价值4W的LLM大网课,字节大佬为萌新研制的大模型保姆级教程,大模型入门到进阶,一套全解决!
TensorRT-LLM 中的 Hopper Mixed GEMM 的 CUTLASS 3.x 实现讲解
CMU《多模态机器学习|CMU Multimodal Machine Learning, Fall 2023》中英字幕
利用多 CUDA stream 加速推荐系统
我居然只花一个小时就搞懂了【Llama3】大模型微调、部署、量化,超详细讲解,简单几步轻松打造属于自己的大模型!!!(大语言模型/人工智能课程)
GraphRAG安装指南
【Kaggle竞赛】手把手教学,全网最细致的Kaggle项目实战教程!赛题解析/代码详解 LLM/NFL/OTTO/ICR 机器学习/深度学习/神经网络
什么?树莓派5也能运行大语言模型了?全面评测各家离线大语言模型!
专家面对面:AI赋能数字人制作与动画
LLM大模型入门必学:全网最通俗易懂Prompt提示词工程入门教程!-Prompt Engineering (附文档+书籍)
使用 MONAI 选择正确的评价指标
TensorRT 加速AI推理Hackathon 2023 初赛总结:Stable Diffusion + ControlNet TensorRT 性能优化
利用 NVIDIA TensorRT-LLM 加速大模型推理
通用场景描述(OpenUSD):自定义Schema
NVIDIA AI 加速精讲堂-TensorRT-LLM量化原理、实现与优化
2024年最新清华大学公开课!【AI大模型LLM】精讲!清华大佬终于把AI大模型(LLM)讲清楚了!通俗易懂!(人工智能、神经网络、机器学习、图像处理)
自定义部署可调式语音合成服务 – NVIDIA Riva实战
西门子和 NVIDIA 携手打造 AI 加速工业自动化的未来