【学习笔记】手绘详解batchnorm与layernorm的区别【跟李沐学AI：Transformer论文逐段精读】 - 视频下载 Video Downloader

【学习笔记】手绘详解batchnorm与layernorm的区别【跟李沐学AI：Transformer论文逐段精读】

发布人

李沐大佬在2021年到2022年在B站有更新过很多论文精读视频，以及深度学习课程，我之前也学习过一部分，质量非常不错，内容都很干货，就大佬层面来说，已经讲得很详细了。最近有在挑一部分视频再看看，有些很好的点，在学习中，我也打算分享下自己的学习笔记。
Transformer论文逐段精读：【Transformer论文逐段精读【论文精读】】 【精准空降到 25:50】 https://www.bilibili.com/video/BV1pu411o7BE/?share_source=copy_web&amp;vd_source=591ed5b4226ab314d67afd7e30b5aac5&amp;t=1550

打开封面下载高清视频观看高清视频视频下载器

【研1基本功（真的很简单）Group Query-Attention】大模型训练必备方法——bonus(位置编码讲解)

【论文精读】Understanding Diffusion Models: A Unified Perspective 01【introduction】

Transformer结合U-Net登上《nature》！新成果让精度和效率都很美丽，相关10种创新思路

跟着李沐读论文！【多模态论文串讲】这可能是目前为把多模态内容讲的最简单易懂的教程了吧！（Openai CLIP模型、对比学习、对比学习、Diffusion模型）

2024最新模型Mamba详解，mamba模型及其公式推导及其论文速读，你要的全都有！不愧是火爆的MAMBA，简直太好用了！-北京邮电大学/清华大学

【学习笔记】AI时代：未来10年生存新法则，从工作、学习、财富积累，未来的发展详细解读

（强推）Transformer模型最通俗易懂的讲解，零基础也能听懂！看计算机大佬如何讲解Transformer原理！（人工智能、深度学习、机器学习、图像处理）

论文精读+代码复现！【transformer与卡尔曼滤波算法】保姆级入门教程！2小时带你彻底学透人工智能两大算法！太强了！（人工智能、深度学习、神经网络、AI）

2024论文最佳创新点！Swin-Unet：基于Transformer的医学图像分割实战，论文详解+源码复现，研究生必看！

在CV界，传统卷积已经彻底输给Transformer了吗？

2024最好出创新点的两个研究方向：【GNN+Transformer】模型入门到实战教程！论文精讲+代码复现，迪哥带你轻松搞定论文创新点！

【论文精读】为什么用SDE(随机微分方程)来描述扩散过程 (3.1节，3.2节)

秒懂！图神经网络！一口气带你学完（图卷积、PYG、图注意力机制、图相似度）真的简单易懂！建议收藏！

【代码详解】扩散模型中如何融合时间信息t到图x上（x+t），Transformer中的位置编码PE(position encoding)

全网近百万大学生研究生收藏！逐行解读深度学习代码的网站！

发论文idea来了，强化学习+Transformer 29个创新点汇总！再也不用担心发论文了

Mamba2卷土重来！收录ICML2024：与Transformer表现相当，速度提高了2-8倍

【官方双语】ChatGPT背后是什么模型和原理？详细阐述decoder-only transformer模型！

当Transformer遇上空间和时间，就变成全能模型了！

动态注意力机制构建使模型准确率高达84.3%！10种前沿创新思路让你一举拿下论文idea!

【公式推导】DDPM采样等价于VP对应的逆SDE的一种数值解法【论文精读】【附录E】【P21】

Transformer杀疯了！王炸成果结合U-Net登上Nature子刊！最新成果让精度和效率非常震撼！

10分钟学会使用wandb（深度学习监控平台）【完美替代tensorboard】

AI大讲堂：What can I say? 专业拆解【Mamba Out 模型】

【公式推导】基于分数角度score，扩散模型DM优化目标的设定3【论文精读】【P16-17】

【整整300集】清华大学121个小时讲完的Transformer教程，零基础入门到精通！真的通俗易懂！（人工智能、深度学习、机器学习实战、图像处理、神经网络）

【公式推导】朗之万动力学公式（Langevin Dynamics）就是梯度下降！！为什么数据生成会是梯度下降的形式？【基于分数的生成模型】

高效涨点：金字塔池化新突破！精度提升33.8%，速度不减！(附11种创新思路+源码)

菜鸟狂喜！花8个小时啃透【Huggingface+BERT+Transformer】，适合新手小白的自然语言处理教程，我不信还有人学不明白！！！（人工智能课程）

终于找到了这个逐行解读代码的网站！全网近百万大学生研究生收藏！github标星超55.6k！----机器学习/深度学习/CV/NLP

2024最新《生成式人工智能导论》台大李宏毅主讲！草履虫都能听懂！建议收藏！（人工智能、机器学习、图像处理、神经网络、计算机视觉）

注意力机制全新升级：高效注意力机制刷新SOTA，速度飙升500%！11种前沿创新改进

比喝水还简单！2024年最详细的【大模型自学路线图】整理出来啦！迪哥手把手教你最高效的大模型学习方法，轻松搞定AIGC大模型！（大模型训练/大模型微调）

SCI文章快速排版：word【最新版】模板一键复制样式

24年发论文论文捷径：Mamba+必备的13种结合创新思路

【Github爆火】128k star！太强了！这次终于把Transformer一次性搞懂了！（大模型版）

【公式推导】加噪过程：为什么只需给定时间步t和原图x0就可以直接生成噪图xt【公式详解】【论文精读】

加速人工智能发展的21个经典深度学习模型，在AI革命的历程中至关重要！

我通过麻省理工物理博士生资格考试啦～

【论文精读】扩散模型由SDE形式进行采样的2个思路：ODE（概率流采样）, 逆SDE（逆扩散采样）