V
主页
京东 11.11 红包
transformers源码阅读——图解mixtral模型——图解MoE细节
发布人
MoE-transformers和传统的transformers有什么区别 Mixtral模型是怎么实现MoE的,模型图解
打开封面
下载高清视频
观看高清视频
视频下载器
transformers源码阅读——mixtral模型解读——MoE实现细节
transfomers源码阅读——Trainer解读系列1_了解训练流程
transformers源码阅读——Trainer解读系列2_关键方法
transformers源码阅读——如何看懂模型代码(以llama为例)
多模态大模型LLaVA模型讲解——transformers源码解读
transformers二次开发——bge-reranker模型微调流程
nlp开发利器——vscode如何debug transformers源码(deepspeed形式)
chatglm3源码阅读——吐槽角度
【动手学习大模型 1/12】LLM 面试和工作的区别,让我们一起 import transformers,了解大模型的基本使用流程 (有较好基础同学不推荐观看)
vLLM源码阅读s1——源码介绍
强化学习TRL包源码解读S1——reward_Trainer
transformers二次开发——为什么要实现自己的sentence-embedding训练代码
图解llama架构 解读源码实现
vLLM源码阅读s2——是如何进行离线推理的
transformers源码阅读——gradient_checkpointing详解
transformers源码阅读——transformers包的文件框架介绍
transformers源码阅读——neftune的工程实现
强化学习TRL包源码解读S2——PPO
【附源码】2024全网公认最通俗易懂的80个Python爬虫练手项目合集,超适合小白练手,简直比刷剧还爽!!——Python/爬虫/数据分析
transformers源码阅读——入门(提高nlp工程师的工程能力)
transformers二次开发——为什么要实现自己的sft代码
训练LLaVA模型(数据集构建、基于Trainer的训练框架搭建)——LLaVA系列
transformers二次开发——(定义自己的数据加载器 模型 训练器)bge模型微调流程
transformers更新了啥S2——在国庆的时候 更新了啥(闲聊)
transformers二次开发——百度轩辕70b大模型数据调度的实现
transformers更新了啥S1——InternLM模型和llama模型竟然是差不多的
如何优雅的修改transformers包的模型结构——面向nlp小白的开发教程
transformers包新功能——一行代码将模型效率提高40%
nlp开发利器——vscode debug nlp大工程(最最最优雅的方式)
阅读lora源码的视频准备
transformers一个非常严重的bug——在使用梯度累计的时候 loss不等效
nlp开发利器——vscode如何debug transformers源码(torchrun形式)
为什么我的模型就没有办法使用ddp——基于bert做embedding任务 使用ddp进行训练
transformers更新了啥S3——23-11-05日更新
nlp开发利器——vscode如何debug transformers源码
lora源码解读
【2024版】用Python暴力破解WiFi,永久白嫖!隔壁老王改密码也没用,源码可分享 | Python爬虫教程
轻量版的GraphRag,pipline更简单,效果与微软的graphRag相媲美。知识图谱和大模型的结合
lora源码解读
一个视频让你对flash attention2下头(比较FA2和sdpa的效率)