V
主页
京东 11.11 红包
总结
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
大模型面经--微调篇
lora源码解读
一个视频让你对flash attention2下头(比较FA2和sdpa的效率)
一个动画讲清楚:大模型思维链复杂度的底层逻辑
我的vscode主题配色
阅读lora源码的视频准备
llama3出来了,但是你别慌
强化学习TRL包源码解读S2——PPO
lora源码解读
图解llama架构 解读源码实现
transformers模型的批量推理小问题【left padding还是right padding】
transformers更新了啥S1——InternLM模型和llama模型竟然是差不多的
多模态大模型LLaVA模型讲解——transformers源码解读
强化学习TRL包源码解读S1——reward_Trainer
transformers更新了啥S2——在国庆的时候 更新了啥(闲聊)
transformers源码阅读——transformers包的文件框架介绍
transformers二次开发——bge-reranker模型微调流程
vLLM源码阅读s2——是如何进行离线推理的
vLLM源码阅读s1——源码介绍
transformers源码阅读——mixtral模型解读——MoE实现细节
transformers源码阅读——Trainer解读系列2_关键方法
transformers源码阅读——gradient_checkpointing详解
vllm二次开发——自定义的新模型如何部署在vllm上S1
使用vscode愉快的阅读transformers源码
我的pr被transformers官方merge了&如何使用vscode和tensorboard查看训练日志
transformers源码阅读——图解mixtral模型——图解MoE细节
transfomers源码阅读——Trainer解读系列1_了解训练流程
nlp开发利器——vscode如何debug transformers源码
transformers源码阅读——投机采样原理和实现方法
transformers源码阅读——neftune的工程实现
训练LLaVA模型(数据集构建、基于Trainer的训练框架搭建)——LLaVA系列
盘点一周AI大事(10月20日)|牛顿AI发现物理定律,开源大模型击败GPT4o
AI大模型课程2024年最新版,阿里大佬手把手带你学,零基础入门必看的保姆级教程,通俗易懂,内附项目实战
图解minicpm-v-2.6源码(debug的形式 一个视频看懂他的网络结构)
longlora是怎么实现的——如何在transformers的模型上修改的
如何丝滑的下载大模型——下载hf的大模型真的会谢(太慢了)
transformers疑惑解答S1——transformers是怎么保存模型权重的?
大模型量化是怎么实现的——transformers源码解读
chatglm3源码阅读——吐槽角度
如何优雅的修改transformers包的模型结构——面向nlp小白的开发教程