V
主页
【学习笔记】手绘详解batchnorm与layernorm的区别【跟李沐学AI:Transformer论文逐段精读】
发布人
李沐大佬在2021年到2022年在B站有更新过很多论文精读视频,以及深度学习课程,我之前也学习过一部分,质量非常不错,内容都很干货,就大佬层面来说,已经讲得很详细了。最近有在挑一部分视频再看看,有些很好的点,在学习中,我也打算分享下自己的学习笔记。 Transformer论文逐段精读:【Transformer论文逐段精读【论文精读】】 【精准空降到 25:50】 https://www.bilibili.com/video/BV1pu411o7BE/?share_source=copy_web&vd_source=591ed5b4226ab314d67afd7e30b5aac5&t=1550
打开封面
下载高清视频
观看高清视频
视频下载器
【研1基本功 (真的很简单)Group Query-Attention】大模型训练必备方法——bonus(位置编码讲解)
【论文精读】Understanding Diffusion Models: A Unified Perspective 01【introduction】
Transformer结合U-Net登上《nature》!新成果让精度和效率都很美丽,相关10种创新思路
跟着李沐读论文!【多模态论文串讲】这可能是目前为把多模态内容讲的最简单易懂的教程了吧!(Openai CLIP模型、对比学习、对比学习、Diffusion模型)
2024最新模型Mamba详解,mamba模型及其公式推导及其论文速读,你要的全都有!不愧是火爆的MAMBA,简直太好用了!-北京邮电大学/清华大学
【学习笔记】AI时代:未来10年生存新法则,从工作、学习、财富积累,未来的发展详细解读
(强推)Transformer模型最通俗易懂的讲解,零基础也能听懂!看计算机大佬如何讲解Transformer原理!(人工智能、深度学习、机器学习、图像处理)
论文精读+代码复现!【transformer与卡尔曼滤波算法】保姆级入门教程!2小时带你彻底学透人工智能两大算法!太强了!(人工智能、深度学习、神经网络、AI)
2024论文最佳创新点!Swin-Unet:基于Transformer的医学图像分割实战,论文详解+源码复现,研究生必看!
在CV界,传统卷积已经彻底输给Transformer了吗?
2024最好出创新点的两个研究方向:【GNN+Transformer】模型入门到实战教程!论文精讲+代码复现,迪哥带你轻松搞定论文创新点!
【论文精读】为什么用SDE(随机微分方程)来描述扩散过程 (3.1节,3.2节)
秒懂!图神经网络!一口气带你学完(图卷积、PYG、图注意力机制、图相似度)真的简单易懂!建议收藏!
【代码详解】扩散模型中如何融合时间信息t到图x上(x+t),Transformer中的位置编码PE(position encoding)
全网近百万大学生研究生收藏!逐行解读深度学习代码的网站!
发论文idea来了,强化学习+Transformer 29个创新点汇总! 再也不用担心发论文了
Mamba2卷土重来!收录ICML2024:与Transformer表现相当,速度提高了2-8倍
【官方双语】ChatGPT背后是什么模型和原理?详细阐述decoder-only transformer模型!
当Transformer遇上空间和时间,就变成全能模型了!
动态注意力机制构建使模型准确率高达84.3%!10种前沿创新思路让你一举拿下论文idea!
【公式推导】DDPM采样等价于VP对应的逆SDE的一种数值解法【论文精读】【附录E】【P21】
Transformer杀疯了!王炸成果结合U-Net登上Nature子刊!最新成果让精度和效率非常震撼!
10分钟学会使用wandb(深度学习监控平台)【完美替代tensorboard】
AI大讲堂:What can I say? 专业拆解【Mamba Out 模型】
【公式推导】基于分数角度score,扩散模型DM优化目标的设定3【论文精读】【P16-17】
【整整300集】清华大学121个小时讲完的Transformer教程,零基础入门到精通!真的通俗易懂!(人工智能、深度学习、机器学习实战、图像处理、神经网络)
【公式推导】朗之万动力学公式(Langevin Dynamics)就是梯度下降!!为什么数据生成会是梯度下降的形式?【基于分数的生成模型】
高效涨点:金字塔池化新突破!精度提升33.8%,速度不减!(附11种创新思路+源码)
菜鸟狂喜!花8个小时啃透【Huggingface+BERT+Transformer】,适合新手小白的自然语言处理教程,我不信还有人学不明白!!!(人工智能课程)
终于找到了这个逐行解读代码的网站!全网近百万大学生研究生收藏!github标星超55.6k!----机器学习/深度学习/CV/NLP
2024最新《生成式人工智能导论》台大李宏毅主讲!草履虫都能听懂!建议收藏!(人工智能、机器学习、图像处理、神经网络、计算机视觉)
注意力机制全新升级:高效注意力机制刷新SOTA,速度飙升500%!11种前沿创新改进
比喝水还简单!2024年最详细的【大模型自学路线图】整理出来啦!迪哥手把手教你最高效的大模型学习方法,轻松搞定AIGC大模型!(大模型训练/大模型微调)
SCI文章快速排版:word【最新版】模板一键复制样式
24年发论文论文捷径:Mamba+必备的13种结合创新思路
【Github爆火】128k star!太强了!这次终于把Transformer一次性搞懂了!(大模型版)
【公式推导】加噪过程:为什么只需给定时间步t和原图x0就可以直接生成噪图xt【公式详解】【论文精读】
加速人工智能发展的21个经典深度学习模型,在AI革命的历程中至关重要!
我通过麻省理工物理博士生资格考试啦~
【论文精读】扩散模型由SDE形式进行采样的2个思路:ODE(概率流采样), 逆SDE(逆扩散采样)