V
主页
京东 11.11 红包
transformers源码阅读——neftune的工程实现
发布人
给embedding添加一个随机数,就可以提高模型性能?neftune就是这么做的。来看看transformers是如何实现neftune的。
打开封面
下载高清视频
观看高清视频
视频下载器
transformers源码阅读——如何看懂模型代码(以llama为例)
如何丝滑的下载大模型——下载hf的大模型真的会谢(太慢了)
transformers源码阅读——Trainer解读系列2_关键方法
transformers源码阅读——llama模型调试
transformers二次开发——为什么要实现自己的sentence-embedding训练代码
国内的大模型结构和llama有多相似?
transformers二次开发——百度轩辕70b大模型数据调度的实现
大模型量化是怎么实现的——transformers源码解读
使用vscode愉快的阅读transformers源码
【2024最新版】用Python处理Excel搞定自动化办公,几分钟轻松搞定一天工作,全天摸鱼(附带课件源码欧)
transformers二次开发——为什么要实现自己的sft代码
longlora是怎么实现的——如何在transformers的模型上修改的
chatglm3源码阅读——吐槽角度
图解llama架构 解读源码实现
transformers包新功能——一行代码将模型效率提高40%
nlp开发利器——vscode如何debug transformers源码(torchrun形式)
llama3出来了,但是你别慌
【Python学习】张雪峰:给所有python人一个忠告!其实普通人学python玩的就是信息差!!
为什么我的模型就没有办法使用ddp——基于bert做embedding任务 使用ddp进行训练
文本转向量教程s2——认识文本转向量方法(sbert本质和推理加速)
强化学习TRL包源码解读S1——reward_Trainer
自定义多模态大模型LLaVA——LLaVA系列
vLLM源码阅读s2——是如何进行离线推理的
transformers源码阅读——gradient_checkpointing详解
80个Python项目(附源码),练完你就牛了!入门到精通,手把手教学!-Python实战项目-Python练手项目-Python基础-项目源码
transformers二次开发——(定义自己的数据加载器 模型 训练器)bge模型微调流程
在摩尔线程原生驱动上进行Llama.cpp的推理(没有使用vulkan)
训练LLaVA模型(数据集构建、基于Trainer的训练框架搭建)——LLaVA系列
【2024python爬虫800集】目前B站最完整的爬虫教程,包含所有干货内容
transformers一个非常严重的bug——在使用梯度累计的时候 loss不等效
文本转向量教程s1——总体介绍
transformers疑惑解答S1——transformers是怎么保存模型权重的?
miniCPM系列S1——技术报告解读(吊打llama2-70b-chat模型?)
nlp开发利器——vscode如何debug transformers源码
我的pr被transformers官方merge了&如何使用vscode和tensorboard查看训练日志
transformers源码阅读——mixtral模型解读——MoE实现细节
Qt+Ollama开源大模型随意部署,免安装解压即用
强化学习TRL包源码解读S2——PPO
如何将Python脚本轻松转换为Windows可执行文件(exe)——让朋友们无需Python环境也能运行你的程序!
【2024·B站推荐】一口气学完【Python自动化办公】(excel、word、pdf)Python数据分析_Python基础_Python自动化