V
主页
[pytorch optim] 优化器相关 - learning rate scheduler
发布人
本期code:https://github.com/chunhuizhang/llm_aigc/blob/main/tutorials/nn_basics/optimizer/lr_scheduler.ipynb
打开封面
下载高清视频
观看高清视频
视频下载器
[pytorch optim] pytorch 作为一个通用优化问题求解器(目标函数、决策变量)
[LLMs tuning] 04 optimizer Trainer 优化细节(AdamW,grad clip、Grad Norm)等
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
女生有这样的态度 不是坏事 相反她开始认真 喜欢你了
【对新手非常友好】三小时深度学习PyTorch快速入门!包教会你的! --人工智能/深度学习/pytorch
千万别被军队文职9k迷惑了,实际上是加不完的班,跑步完的步,和想象中有很大区别...
【什么是OCR?】强推!2024最容易上手的OCR文字识别教程分享!10小时带你全面解读OCR算法,详解OCR识别的优势!
[LLMs 实践] 13 gradient checkpointing 显存优化 trick
[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程
【历史笔记本】比较秦朝与隋朝的相同点
[pytorch] [求导练习] 06 计算图(computation graph)细节之 retain graph(multi output/backwar)
直接抄她的代码,就是最好的学习方法!!
[pytorch] Tensor 轴(axis)交换,transpose(转置)、swapaxes、permute
这一代的孩子,都很难超越自己了!
[pytorch 强化学习] 08 CartPole Q learning 连续状态离散化(digitize 分桶)及 display_frame_as_gif
[优化算法] 梯度下降、共轭梯度、牛顿法、逆牛顿法(BFGS)
[pytorch 强化学习] 11 逐行写代码实现 DQN(ReplayMemory,Transition,DQN as Q function)
[pytorch] BN、LN、RMSNorm 及 pre LN vs. post LN 对比,标准化
【全集195集】深度学习必看圣经!李沐大神《动手学深度学习》最新版全套视频教程分享,小白也能信手拈来,看完直接跑通!(深度学习/神经网络/pytorch)】
[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置
他没拿我当残疾人,也没拿我当人
Adobe Iightroom classic 2025(lrc2025)最新版分享,无需三连,视频随意自取
【Triton编程】Dropout,Matrix Multiplication,Layer Normalization
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像
[pytorch] [求导练习] 03 计算图(computation graph)及链式法则(chain rule)反向传播过程
[pytorch 番外] Tensorboard 与计算图初步(算子与 ATen)
[pytorch distributed] torch 分布式基础(process group),点对点通信,集合通信
[pytorch distributed] 04 模型并行(model parallel)on ResNet50
【Blender】补档|作为医生 随身带几个口罩很正常吧
[pytorch distributed] 01 nn.DataParallel 数据并行初步
【200集还是太全面了】拒绝低效!一口气学完CNN、RNN、GAN、LSTM、GNN、DQN、Transformer、MLP、AE九大深度学习神经网络!纯干货!
[pytorch] [求导练习] 01 sigmoid 函数自动求导练习(autograd,单变量,多变量 multivariables 形式)
[LLMs 实践] 11 gradient accumulation 显存优化 trick
【python 运筹优化】scipy.optimize.minimize 使用
【PyTorch】只看不练,等于白看!!PyTorch深度学习实战案例,还不拿下!!!
为什么上初中前没人告诉我这些❗
[pytorch] nn.Embedding 前向查表索引过程与 one hot 关系及 max_norm 的作用
【数值计算】牛顿迭代法(Newton's method,Newton-Raphson method,牛顿-拉夫逊(拉弗森))计算二次方根(sqrt)三次方根
Justin Bieber 教你从零开始编写多模态大模型 1
[pytorch] 激活函数(梯度消失)sigmoid,clamp,relu(sparse representation,dying relu)