V
主页
图解llama架构 解读源码实现
发布人
看视频吧,llama的图解和源码解读一起做了
打开封面
下载高清视频
观看高清视频
视频下载器
Llama 2 模型结构解析
第二十课:MoE
不要浪费钱买课了,喂饭式教你训练大模型llama3
Transformer论文逐段精读【论文精读】
AI推理优化视角解读LLaMA模型结构和源代码
77、Llama源码讲解之GroupQueryAttention和KV-cache
llama.cpp 源码解析-- CUDA版本流程与逐算子详解
llama3-01-模型简介
【手把手带你实战HuggingFace Transformers-入门篇】基础知识与环境安装
B站强推!这可能是唯一能将LLama大模型讲清楚的教程了,LLama系列复现-微调-预训练-应用实例解读,草履虫都能看懂!人工智能/多模态大模型
transformers源码阅读——如何看懂模型代码(以llama为例)
LLM面试_为什么常用Decoder Only结构
transformers二次开发——为什么要实现自己的sft代码
[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程
通俗易懂-大模型的关键技术之一:旋转位置编码rope (2)
什么是大语言模型LLM?ChatGPT、LLAMA各自有什么优势?
从0用Numpy搭建可训练LLaMa3模型——山东大学威海数科班重案六组第六学期大作业
主流开源大模型LLama基本架构 KV-Cache, Rotary Positional Embedding, RMS Norm, Grouped Query
动画科普AI Agent:大模型之后为何要卷它?
大模型修炼之道(三): Llama系列讲解 Llama1,Llama2, Llama3
75、Llama源码讲解之RoPE旋转位置编码
transfomers源码阅读——Trainer解读系列1_了解训练流程
案例实战-05-基于LLaMA和LoRA模型进行预训练
【大模型量化】llama.cpp轻量化模型部署及量化
案例实战-17-llama.cpp量化模型API服务部署
transformers源码阅读——入门(提高nlp工程师的工程能力)
nlp开发利器——vscode debug nlp大工程(最最最优雅的方式)
Windows下中文微调Llama3,单卡8G显存只需5分钟,可接入GPT4All、Ollama实现CPU推理聊天,附一键训练脚本。
大模型必会第三期,最热门的大模型结构解析llama!
如何丝滑的下载大模型——下载hf的大模型真的会谢(太慢了)
全栈大模型微调框架LLaMA Factory:从预训练到RLHF的高效实现
llama-2-模型推理
动画科普LLM大模型进阶之路:为何GPT之外一定要关注LLaMA
78、Llama源码讲解之Transformer
transformers二次开发——为什么要实现自己的sentence-embedding训练代码
81、LLaMA-1 论文导读
LLAMA3.1 全球最大开源大模型 405B 详细解读!#大模型 #llama
【LLaMA 模型结构详解 by Umar Jamil】
都发布一个月了【还不会微调Llama3吗】!迪哥十分钟带你微调-量化-部署-应用一条龙解读!草履虫都能学会!!!
【大模型微调】使用Llama Factory实现中文llama3微调