V
主页
源码讲解-05-中集-模型预训练代码逐行剖析
发布人
欢迎参与我们的大语言模型开源课程!在这个系列课程中,我们将深入解析最新的研究论文,详细讲解相关代码,以及研究开源项目的实施细节。这是一次探索AI的旅程,帮助你理解并掌握大语言模型的精髓。无论你是研究人员,开发者,或是对AI技术感兴趣的学习者,都能从中受益。 *** 请到我的公众号根据提示下载相关课程的源代码:*** 个人公众号 + 网易云课堂 :唐国梁Tommy
打开封面
下载高清视频
观看高清视频
视频下载器
【B站最通俗易懂大模型微调教】大模型微调和实战经验保姆级入门教程:大模型微调方法原理及大模型主流技术架构全详解-北大AI博士后卢菁博士授课(人工智能_多模态)
源码讲解-04-上集-模型预训练代码逐行剖析
源码讲解-02-llama与lora模型合并
吴恩达最新【Langchain-ChatGLM】教程!手把手带你实现:大模型预训练和模型微调,我1小时就学会了!
【知识图谱实战】计算机博士花6小时带你轻松学习掌握Neo4j数据库实战、医药问答系统、文本关系抽取、金融平台风控模型等等实战项目!附课件源码
案例实战-05-基于LLaMA和LoRA模型进行预训练
llama3-01-模型简介
源码讲解-07-上集-API服务server代码讲解
NLP自然语言处理必学基础!NLP入门到进阶全程干货讲解,绝对通俗易懂,学完即可就业!---人工智能_NLP预训练模型_Transformer模型_深度学习
案例实战-06-上集—基于LLaMA和LoRA模型进行指令精调
【强推】超详细讲解:大模型推理加速方法综述:1.各类魔改Transformer优化 2.量化技术 3.推理加速技术和显存优化-卢菁博士授课
LoRA_01_算法原理深入解析-上集
【全748集】字节大佬终于把 AI大模型(LLM)讲清楚了!通俗易懂,2024最新内部版,学完即就业!AGI商业化落地创业营,一门非常落地的AI大模型创业课!!
DeepSpeed分布式训练框架 DeepSpeed-Chat Step-1-02 actor 模型微调
LangChain 实战案例-01 基于上传的PDF文档进行QA问答 第1节 项目简介
【李宏毅】2024年公认最好的【LLM大模型】教程!大模型入门到进阶,一套全解决!2024生成式人工智慧-附带课件代码
OpenAI禁用的真相
DeepSpeed分布式训练框架 DeepSpeed-Chat Step-1-01 简介
斯坦福大学《自然语言处理2023|CS224n: Natural Language Processing》中英字幕
切勿乐观看待Agent落地,大模型的先天缺陷
llama3-05 使用Docker部署llama3量化模型API服务
LoRA_05_02_基于GPT-2进行LoRA微调实战
案例实战-11-单个LoRA权重与LLaMA合并
超越RAG,Lamini提出大模型微调新方式:记忆微调,幻觉减少10倍
llama3-02-环境配置 基于vLLM推理
LangChain 实战案例-01 基于上传PDF文档进行QA问答 第2节 案例实现
为什么大模型越微调越差?
Chinese- LLaMA- Alpaca 案例实战-02-指令数据生成
全面超越Llama-3,GLM-4-9B重磅开源!GLM-4开源模型介绍与深度解析
QLoRA_01_课程简介
一种鉴别大模型套壳的方法斯坦福最先中招
llama3-04 使用llama.cpp进行llama3模型的量化和部署
LoRA_07_在VS Code中debug LoRA微调细节
老KG专家,保姆级教程讲解如何构建知识图谱
案例实战-13-指令精调手把手教程-升级版
案例实战-04-基于webUI进行交互
抽丝剥茧手撕RAG,本地知识库检索开发与原理
建议人工智能NLP方向学子死磕这套课程—三大核心算法Huggingface+Transformer+BERT基础原理及代码实战,绝对通俗易懂!
Chinese LLaMA Alpaca 案例实战-01-项目概览
RAG+知识图谱的四种方法