大语言模型基础架构：稳定性的挑战及集群效率优化 - 视频下载 Video Downloader

大语言模型基础架构：稳定性的挑战及集群效率优化

发布人

王淼｜NVIDIA 资深解决方案架构师
大模型训练任务流程拆解、做好集群监控、确保环境可靠等先进经验。

打开封面下载高清视频观看高清视频视频下载器

TensorRT-LLM中的 Quantization GEMM（Ampere Mixed GEMM）的 CUTLASS 2.x 实现讲解

知乎AI大模型全栈工程师培养计划，零基础入门到精通【就业前景/学习路线/实战学习/就业】

手机安装运行最新开源的Qwen2-7B-Instruct大语言模型（可断网使用）

TRT-LLM 最佳部署实践

TensorRT 教程 | 基于 8.6.1 版本 | 第一部分

【LangChain入门到实战】从0到1手把手教你，大模型初学者入门必学框架（持续更新ing）

黄仁勋和马克·扎克伯格探讨 AI 和下一代计算平台

[创投沙龙] LLM & XR：GenAI在元宇宙中的应用未来 (Part1)

强推！不愧是公认的讲的最好的【AI大模型全套教程】李宏毅大佬12小时带你从入门到进阶，一套全解决！

Microsoft微软的 GraphRag开源了，如何使用知识图谱（knowledge graph）做大模型RAG增强

【2024最新】从入门到提示词工程师：全网最通俗易懂Prompt-Learning提示词学习教程！学不会我退出IT圈！

基于TensorRT-LLM提升大模型算力使用效率

CUTLASS 2.x 与 3.x 的入门使用

基于 NVIDIA Triton 推理服务器端到端部署 LLM serving

如何通过低代码编程使用一行代码利用 TensorRT将Pytorch推理速度提高 6 倍

【全168集】华为大佬终于把AI大模型落地做成了教程，通俗易懂，2024最新内部版，学完即就业！

FP8 训练的挑战及最佳实践

探索长序列并行：Megatron-Core 的 Context Parallelism 解析

爆肝整理制作！Jetson主控也能使用的六个AI大语言模型，效果直逼ChatGPT！

奔向工业元宇宙

NVIDIA 视频加速技术详解之二：使用 FFmpeg 以及 GMAT 在 GPU 上加速视频编解码

NVIDIA 自动驾驶实验室：如何通过 AI 分割模型增强自动驾驶安全性

【全286集】价值4W的LLM大网课，字节大佬为萌新研制的大模型保姆级教程，大模型入门到进阶，一套全解决！

TensorRT-LLM 中的 Hopper Mixed GEMM 的 CUTLASS 3.x 实现讲解

CMU《多模态机器学习|CMU Multimodal Machine Learning, Fall 2023》中英字幕

利用多 CUDA stream 加速推荐系统

我居然只花一个小时就搞懂了【Llama3】大模型微调、部署、量化，超详细讲解，简单几步轻松打造属于自己的大模型！！！（大语言模型/人工智能课程）

GraphRAG安装指南

【Kaggle竞赛】手把手教学，全网最细致的Kaggle项目实战教程！赛题解析/代码详解 LLM/NFL/OTTO/ICR 机器学习/深度学习/神经网络

什么？树莓派5也能运行大语言模型了？全面评测各家离线大语言模型！

专家面对面：AI赋能数字人制作与动画

LLM大模型入门必学：全网最通俗易懂Prompt提示词工程入门教程！-Prompt Engineering （附文档+书籍）

使用 MONAI 选择正确的评价指标

TensorRT 加速AI推理Hackathon 2023 初赛总结：Stable Diffusion + ControlNet TensorRT 性能优化

利用 NVIDIA TensorRT-LLM 加速大模型推理

通用场景描述（OpenUSD）：自定义Schema

NVIDIA AI 加速精讲堂-TensorRT-LLM量化原理、实现与优化

2024年最新清华大学公开课！【AI大模型LLM】精讲！清华大佬终于把AI大模型（LLM）讲清楚了！通俗易懂！（人工智能、神经网络、机器学习、图像处理）

自定义部署可调式语音合成服务 – NVIDIA Riva实战

西门子和 NVIDIA 携手打造 AI 加速工业自动化的未来