V
主页
京东 11.11 红包
transformers源码阅读——Trainer解读系列2_关键方法
发布人
看了这个视频,基本上可以解决transformers训练过程中90%的bug
打开封面
下载高清视频
观看高清视频
视频下载器
transfomers源码阅读——Trainer解读系列1_了解训练流程
强化学习TRL包源码解读S1——reward_Trainer
transformers源码阅读——neftune的工程实现
transformers源码阅读——llama模型调试
如何丝滑的下载大模型——下载hf的大模型真的会谢(太慢了)
transformers源码阅读——投机采样原理和实现方法
强化学习TRL包源码解读S2——PPO
国内的大模型结构和llama有多相似?
transformers二次开发——为什么要实现自己的sentence-embedding训练代码
transformers二次开发——百度轩辕70b大模型数据调度的实现
transformers源码阅读——如何看懂模型代码(以llama为例)
训练LLaVA模型(数据集构建、基于Trainer的训练框架搭建)——LLaVA系列
transformers源码阅读——入门(提高nlp工程师的工程能力)
vLLM源码阅读s2——是如何进行离线推理的
transformers包新功能——一行代码将模型效率提高40%
图解llama架构 解读源码实现
transformers二次开发——为什么要实现自己的sft代码
transformers更新了啥S2——在国庆的时候 更新了啥(闲聊)
transformers二次开发——(定义自己的数据加载器 模型 训练器)bge模型微调流程
为什么我的模型就没有办法使用ddp——基于bert做embedding任务 使用ddp进行训练
transformers疑惑解答S1——transformers是怎么保存模型权重的?
使用vscode愉快的阅读transformers源码
手机本地运行AI大模型 最全面横评 效果实测(二)6B-8B参数模型
文本转向量教程s3——Trainer二次开发(embedding为例)
nlp开发利器——vscode愉快的写nlp代码
lora源码解读
transformers二次开发——bge-reranker模型微调流程
文本转向量教程s1——总体介绍
图解minicpm-v-2.6源码(debug的形式 一个视频看懂他的网络结构)
transformers源码阅读——mixtral模型解读——MoE实现细节
总结
【2024版】用Python暴力破解WiFi,永久白嫖!隔壁老王改密码也没用,源码可分享 | Python爬虫教程
手把手带你发现transformers的bug 并且修复它!
我的pr被transformers官方merge了&如何使用vscode和tensorboard查看训练日志
miniCPM系列S1——技术报告解读(吊打llama2-70b-chat模型?)
transformers一个非常严重的bug——在使用梯度累计的时候 loss不等效
Qt+Ollama开源大模型随意部署,免安装解压即用
一个视频让你对flash attention2下头(比较FA2和sdpa的效率)
如何优雅的修改transformers包的模型结构——面向nlp小白的开发教程
vLLM源码阅读s1——源码介绍