V
主页
73、爆火必看的nano-GPT2 Pytorch经典代码逐行讲解
发布人
大家好,本期直播视频主要逐行讲解了爆火的nano-GPT2 Pytorch代码,包含了因果自注意力机制、TransformerBlock、GPT model、多机多卡训练代码和推理调参代码。并提供了一些自己的思考。希望大家一键三连,点赞转发评论收藏,谢谢大家!
打开封面
下载高清视频
观看高清视频
视频下载器
Transformer 的 Pytorch 代码实现讲解
19、Transformer模型Encoder原理精讲及其PyTorch逐行实现
火爆全网!GPT-1/2/3原理详解+源码解读!这可能是你在B站见过最详细的讲解!比刷剧爽多了!-GPT算法、GPT、GPT-2、GPT-3
小型GPT代码逐行讲解
大语言模型LLM基础之Tokenizer完全介绍
GPT,GPT-2,GPT-3 论文精读【论文精读】
58、Improved Diffusion的PyTorch代码逐行深入讲解
Transformer论文逐段精读【论文精读】
54、Probabilistic Diffusion Model概率扩散模型理论与完整PyTorch代码详细解读
从零开始手搓一个LLM(一)把参数缩减到足够单卡训练的NanoGPT
【珍藏】从头开始用代码构建GPT - 大神Andrej Karpathy 的“神经网络从Zero到Hero 系列”之七
深度学习代码有救了!我发现了一个逐行解读代码的网站!!-机器学习/计算机视觉/AI/人工智能
从0训练一个GPT小模型 Retriever-0.1B
Transformer的PyTorch实现
33、完整讲解PyTorch多GPU分布式训练代码编写
手把手从头实现GPT by Andrej Karpathy
66、Classifier Guided Diffusion条件扩散模型论文与PyTorch代码详细解读
2080 Ti就能跑70B大模型,上交大新框架让LLM推理增速11倍
71、VQGAN模型+VQ离散化模块的代码讲解
18、深入剖析PyTorch中的Transformer API源码
PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】
83-预训练模型-GPT2(模型原理)-自然语言处理-深度学习-pytorch
4、PyTorch的Dataset与DataLoader详细使用教程
12、如何在PyTorch中训练模型
66集付费!只花了3小时学懂了深度学习神经网络入门到实战,GNN、RNN、GAN一口气学明白!
51、基于PyTorch ResNet18的果蔬分类逐行代码讲解
【保姆级AI教程】3小时训练一个拿捏你喜好的GPT,没有显卡也能跑!
1、PyTorch介绍与张量的创建
68、VQVAE预训练模型的论文原理及PyTorch代码逐行讲解
69、VQGAN+Transformer自回归建模图像生成的论文原理细致讲解
从零实现GPT-2,瞎写笑傲江湖外传,金庸直呼内行
20、Transformer模型Decoder原理精讲及其PyTorch逐行实现
55、PyTorch的交叉熵、信息熵、二分类交叉熵、负对数似然、KL散度、余弦相似度的原理与代码讲解
【李沐】因为过拟合刷题,我最后只能去MIT和CMU这种学校
75、Llama源码讲解之RoPE旋转位置编码
74、GPT-3论文原理讲解
62、Score Diffusion Model分数扩散模型理论与完整PyTorch代码详细解读
81、LLaMA-1 论文导读
77、Llama源码讲解之GroupQueryAttention和KV-cache
67、DiffusionLM 基于扩散模型的语言模型论文原理精讲