V
主页
[LLM && AIGC] 04 深入理解 openai tokenizer 及 api 中的 logit_bias 与 logprobs
发布人
本期code:https://github.com/chunhuizhang/bilibili_vlogs/blob/master/llm/tutorials/05_openai_tokenizer_logit_bias_logprobs.ipynb 参考:https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them 动手写 bert 系列:https://space.bilibili.com/59807853/channel/collectiondetail?sid=496538
打开封面
下载高清视频
观看高清视频
视频下载器
[pytorch 模型拓扑结构] 深入理解 nn.BCELoss 计算过程及 backward 及其与 CrossEntropyLoss 的区别与联系
[LLMs 实践] 09 BPE gpt2 tokenizer 与 train tokenizer
[LLM && AIGC] 06 OpenAI whisper 命令行及脚本的使用(生成视频的音频)
[AI Agent] function calling & tool uses 与 argument generation
[LLMs 实践] 03 LoRA fine-tune 大语言模型(peft、bloom 7b)
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[LLMs 实践] 13 gradient checkpointing 显存优化 trick
[bert、t5、gpt] 06 GPT2 整体介绍(tokenizer,model forward)
[LLM && AIGC] 05 OpenAI 长文本(long text,超出 max_tokens)处理及 summary,划分 chunk 处理
[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计(MLE)伯努利分布的参数
[pytorch] 深入理解 torch.gather 及 dim 与 index 的关系
[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程
[diffusion] 生成模型基础 VAE 原理及实现
【爬虫】【豆瓣爬虫】01 豆瓣热门电影/电视,基于 api 爬虫
[pytorch distributed] deepspeed 基本概念、原理(os+g+p)
[PyTorch] Dropout 基本原理(前向计算与自动求导)
[pytorch] 激活函数,从 ReLU、LeakyRELU 到 GELU 及其梯度(gradient)(BertLayer,FFN,GELU)
[bert、t5、gpt] 05 构建 TransformerDecoderLayer(FFN 与 Masked MultiHeadAttention)
[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程(nn.NLLLoss(nn.LogSoftmax))
[pytorch distributed] nccl 集合通信(collective communication)
[pytorch] 激活函数(梯度消失)sigmoid,clamp,relu(sparse representation,dying relu)
[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置
[pytorch] [求导练习] 05 计算图(computation graph)构建细节之 inplace operation(data与detach)
[调包侠] 04 使用预训练模型进行图像特征向量提取(image feature extractor,img2vec)并进行相似性计算
[pytorch 番外] Tensorboard 与计算图初步(算子与 ATen)
[pytorch 网络模型结构] 深入理解 nn.BatchNorm1d/2d 计算过程
[LangChain] 03 LangGraph 基本概念(AgentState、StateGraph,nodes,edges)
[pytorch] torch.nn.Bilinear 计算过程与 einsum(爱因斯坦求和约定)
[实战kaggle系列] 1. 使用 kaggle 命令行 api,进行数据集的下载
[pytorch模型拓扑结构] nn.MultiheadAttention, init/forward, 及 query,key,value 的计算细节
[动手写神经网络] 手动实现 Transformer Encoder
[pytorch distributed] 04 模型并行(model parallel)on ResNet50
[pytorch] Tensor 轴(axis)交换,transpose(转置)、swapaxes、permute
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
[personal chatgpt] gpt-4o tokenizer 及特殊中文tokens(压缩词表),o200k_base
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像
[LLMs 实践] 19 llama2 源码分析 RoPE apply_rotary_emb 从绝对位置编码到相对位置编码
[pytorch 强化学习] 12 逐行写代码实现 DQN 完全体
[pytorch optim] 优化器相关 AdaGrad(adaptive gradient) 与 RMSprop,自适应梯度
[pytorch] Tensor shape 变化 view 与 reshape(contiguous 的理解)