季光、陈庾｜TensorRT Hackathon 2023 总结｜AIGC 及大语言模型推理的典型案例深入解析 - 视频下载 Video Downloader

季光、陈庾｜TensorRT Hackathon 2023 总结｜AIGC 及大语言模型推理的典型案例深入解析

发布人

打开封面下载高清视频观看高清视频视频下载器

【全168集】华为大佬终于把AI大模型落地做成了教程，通俗易懂，2024最新内部版，学完即就业！

类似微软的GraphRag，neo4j版的GraphRag代码开源，本地运行，包括使用llm大模型构建知识图谱以及检索增强

B站强推！2024公认最通俗易懂的【AI机器人开发】教程，全套付费课程（附资料）NVIDIA_Isaac_Sim

如何优雅的、本地化、运行Meta 最新的大模型Llama 3.1

B站强推！2024公认最通俗易懂的【Transformer】教程，125集付费课程（附资料）神经网络_注意力机制_深度学习_BERT_大模型

TensorRT 加速AI推理Hackathon 2023 初赛总结：Stable Diffusion + ControlNet TensorRT 性能优化

关于Llama3.1模型简要总结&启示

AI泡沫将在1-2年内破灭

CUDA实现矩阵乘法的8种优化策略编程介绍

使用 MONAI 选择正确的评价指标

西门子和 NVIDIA 携手打造 AI 加速工业自动化的未来

5分钟教会你给本地大模型接入知识库RAG～【小白喂饭级教程】

1TB显存GT610被我魔改成功！堪称核弹！

强推！基于LangChain实现RAG检索增强+吴恩达构建和评估高级的RAG模型应用教程，实现大模型落地！

未来20年将改变世界的20大新科技：通用人工智能（AGI）、基因编辑、量子计算、脑机接口、人形机器人、生成式AI、人造子宫、纳米技术、物联网

[半导体] Broadcom 博通：AI芯片收入超AMD👊🏻直追Nvidia？半导体市值全球第三，仅落后台积电！

怎么加快大模型推理？10分钟学懂VLLM内部原理，KV Cache，PageAttention

清华大模型公开课第二季回归！全球顶级开源社区梦幻联动【每周更新中】

如何给大模型喂数据？让AI更懂你～【小白科普】

【第二期】WIN10 优化电脑性能降低系统延迟

B站强推！这可能是唯一能将LLama大模型讲清楚的教程了，LLama系列复现-微调-预训练-应用实例解读，草履虫都能看懂！人工智能/多模态大模型

NVIDIA 视频加速技术详解之六：GPU图像编解码技术

强推！这可能是B站最全的【大模型微调】实战教程了，AI大佬精细讲解全程干货无废话，学完即可就业！人工智能_大模型微调_多模态_清华大模型

2024 AI夏令营第一期｜【零基础开始大模型应用开发】SDK & Gradio 开发分享

最近火爆的GraphRAG是什么？真的那么有用吗？

神操作！闲置手机电脑变身“超级计算机”，在家运行70B大模型！

大模型成功背后的RLHF到底是什么？

NVIDIA ISAAC 介绍

什么是混合专家模型（MoE)？

使用大模型时可调节的温度指的是什么？

CUTLASS 2.x 与 3.x 的入门使用

Flash Attention 为什么那么快？原理讲解

看了几百家近期融资的AI公司，谈一点感悟

探索长序列并行：Megatron-Core 的 Context Parallelism 解析

英伟达特供RTX5090D 或将于2025年初推出

(超爽中英!) 2024吴恩达最好的【ChatGPT提示词工程师】教程！附课件代码 DeepLearning.AI

开启 AI 未来时刻 - 中文字幕版黄仁勋 COMPUTEX 2023主题演讲

Windows入门AI视觉处理-搭建虚拟背景应用

使用大模型时可调节的TopK、TopP到底是什么意思？

利用多 CUDA stream 加速推荐系统