V
主页
京东 11.11 红包
大模型预训练看这个视频就够了
发布人
大模型预训练代码讲解。 代码:https://github.com/RethinkFun/LLM
打开封面
下载高清视频
观看高清视频
视频下载器
代码实现大模型强化学习(PPO),看这个视频就够了。
【李宏毅】2024年公认最好的【LLM大模型】教程!大模型入门到进阶,一套全解决!2024生成式人工智慧-附带课件代码
怎么加快大模型推理?10分钟学懂VLLM内部原理,KV Cache,PageAttention
从零开始训练大模型
「分布式训练」原理讲解+ 「DDP 代码实现」修改要点
吴恩达教授为你详细讲解大模型预训练和微调,吴恩达系列课程《大语言模型预训练|Pretraining LLMs》中英字幕
第二十课:MoE
Qwen2-7B-微调-训练-评估
迁移学习 | 模型查看&参数查看 | 预训练模型加载 | 模型修改 | 参数冻结
OpenAI创始成员讲解大模型训练过程
动画理解Pytorch 大模型分布式训练技术 DP,DDP,DeepSpeed ZeRO技术
大模型训练如何计算显存占用
吴恩达《大语言模型预训练|Pretraining LLMs》中英字幕【豆包翻译】
吴恩达大模型系列教程:2024吴恩达LLM大模型教程,手把手带你实现大模型预训练和模型微调,中英字幕(附学习课件)
【报告】从GLM-130B到ChatGLM:大模型预训练与微调
Batch Normalization(批归一化)和 Layer Normalization(层归一化)的一些细节可能和你想的并不一样
AI 工程师都应该知道的GPU工作原理,TensorCore
大模型微调看这个视频就够了 SFT NEFTune
DPO (Direct Preference Optimization) 算法讲解
大模型研究方向—RAG & Finetuning & 继续预训练 & Agent
HuggingFace简明教程,BERT中文模型实战示例.NLP预训练模型,Transformers类库,datasets类库快速入门.
使用预训练模型
通俗易懂理解大模型预训练和微调
预训练和直接训练的区别是什么?
通义千问-大模型vLLM推理与原理
原来大模型还可以这么训练?干得漂亮!
你真的理解交叉熵损失函数了吗?
大模型的训练流程是什么?详解大模型预训练和微调间区别 #大模型 #微调
Flash Attention 为什么那么快?原理讲解
案例实战-05-基于LLaMA和LoRA模型进行预训练
2024最易懂的大模型预训练教程,三分钟掌握大模型预训练!零基础小白也能学会,超简单的大模型训练教程~
不要浪费钱买课了,喂饭式教你训练大模型llama3
用梯度检查点来节省显存 gradient checkpointing
如何给大模型喂数据?让AI更懂你~【小白科普】
你知道用什么指标评价一个大模型的好坏吗?PPL,MMLU,MATH,GPQA,BBH,IF-EVAL,MMLU-PRO
一次学懂混合精度训练 AMP Automatic Mixed Precision
大模型修炼之道(三): Llama系列讲解 Llama1,Llama2, Llama3
十分钟搞明白Adam和AdamW,SGD,Momentum,RMSProp,Adam,AdamW
训练大语言模型LLM 如何定义自己训练数据集?#小工蚁
从零开始学习大语言模型(一)