V
主页
[LLMs 实践] 10 预训练语料,mapping & streaming(load_dataset)
发布人
本期 code: https://github.com/chunhuizhang/personal_chatgpt/blob/main/tutorials/pretrain_corpus_%E5%A4%A7%E6%A8%A1%E5%9E%8B%E9%A2%84%E8%AE%AD%E7%BB%83%E8%AF%AD%E6%96%99.ipynb https://github.com/chunhuizhang/bert_t5_gpt/blob/main/tutorials/dataset_dataloader.ipynb
打开封面
下载高清视频
观看高清视频
视频下载器
[LLMs 实践] 08 LLM.int8 量化细节 (load_in_8bit)以及 bitsandbytes 库
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
[LLMs 实践] 12 LLM SFT training (trl SFTTrainer、alpaca dataset)
[LLMs 实践] 13 gradient checkpointing 显存优化 trick
[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程
[LLMs 实践] 02 LoRA(Low Rank Adaption)基本原理与基本概念,fine-tune 大语言模型
[动手写神经网络] 手动实现 Transformer Encoder
[损失函数设计] 为什么多分类问题损失函数用交叉熵损失,而不是 MSE
[调包侠] tencent ailab 中文语料 embedding vector(word2vec)
[LLMs 实践] 21 llama2 源码分析 GQA:Grouped Query Attention
[LLMs 实践] 20 llama2 源码分析 cache KV(keys、values cache)加速推理
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[实战kaggle系列] 1. 使用 kaggle 命令行 api,进行数据集的下载
[LLMs 实践] 14 llama2 introduction 及 fine tune llama2(guanaco dataset)
[LLMs 实践] 17 llama2 源码分析(RMSNorm 与 SwiGLU)
[LLMs 实践] 221 llama2 源码分析 generate 的完整过程
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
大模型RAG企业项目实战:手把手带你搭建一套完整的RAG系统,项目实战+部署源码,纯小白都能学明白!LLM大模型_RAG_大模型微调_多模态
[LLMs 实践] 03 LoRA fine-tune 大语言模型(peft、bloom 7b)
[动手写神经网络] 05 使用预训练 resnet18 提升 cifar10 分类准确率及误分类图像可视化分析
[LLMs 实践] 19 llama2 源码分析 RoPE apply_rotary_emb 从绝对位置编码到相对位置编码
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
[LLMs 实践] 09 BPE gpt2 tokenizer 与 train tokenizer
[LLMs tuning] 04 optimizer Trainer 优化细节(AdamW,grad clip、Grad Norm)等
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
[LLMs 实践] 18 llama2 源码分析 RoPE 相对位置编码的复数形式
[pytorch 强化学习] 09 (逐行写代码)CartPole Q learning 基于连续状态离散化(digitize 分桶)
[LLMs inference] hf transformers 中的 KV cache
[Python 机器学习] 深入理解 numpy(ndarray)的 axis(轴/维度)
[LLMs tuning] 01 trl SFTTrainer 中的 formatting_func 与 DataCollatorForCompletion
[工具的使用] 从 jupyter notebook 到 jupyter lab(网页版 vscode?)
[蒙特卡洛方法] 02 重要性采样(importance sampling)及 python 实现
【AI大模型实战】两小时带你彻底掌握提示工程(Prompt Engineering)超详细,草履虫都能听懂!!!(大模型|LLM|多模态|人工智能)
[python nlp] 01 词频分析与 Zipf law 齐夫定律(log-log plot)
[矩阵分析] 分块矩阵的角度理解矩阵运算(独热向量与对角矩阵)
[蒙特卡洛方法] 01 从黎曼和式积分(Reimann Sum)到蒙特卡洛估计(monte carlo estimation)求积分求期望
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像
【大模型实战】深度解析Transformers模型量化!!!
[LLMs 实践] 06 LLaMA,Alpaca LoRA 7B 推理
[LLMs tuning] 05 StackLlama、SFT+DPO(代码组织、数据处理,pipeline)