[personal chatgpt] gpt-4o tokenizer 及特殊中文tokens（压缩词表），o200k_base

发布人

本期 code：https://github.com/chunhuizhang/personal_chatgpt/blob/main/tutorials/tokenizer/tokenizer_gpt4o.ipynb
关于 bpe（tokenizer）：https://www.bilibili.com/video/BV1Sk4y1P7LK/?spm_id_from=333.999.0.0

打开封面下载高清视频观看高清视频视频下载器

[personal chatgpt] Llama2 7B vs. Llama3 8B （词表、attention 及 mlp）

[personal chatgpt] instructGPT 中的 reward modeling，概率建模与损失函数性质

[personal chatgpt] peft LoRA merge pipeline（lora inject，svd）

Git Merge vs Rebase vs Squash

[personal chatgpt] 从 RoPE 到 CoPE（绝对位置编码，相对位置编码，Contextual Position Encoding）

[personal chatgpt] trl 基础介绍：reward model，ppotrainer

[personal chatgpt] trl rlhf PPOTrainer，原理分析与代码走读（OpenRLHF framework）

[personal chatgpt] LLAMA 3 整体介绍（与 LLama 2 的不同？）

[bert、t5、gpt] 06 GPT2 整体介绍（tokenizer，model forward）

[personal chatgpt] trl reward model 与 RewardTrainer（奖励模型，分类模型）

[LLMs inference] hf transformers 中的 KV cache

[纳什荐书][生成式AI] 01 《GPT图解》导读

[动手写bert系列] 01 huggingface tokenizer （vocab，encode，decode）原理及细节

[调包侠] tencent ailab 中文语料 embedding vector（word2vec）

零代码构建AI智能体！本地部署n8n+LiteLLM+免费gpt4o！ollama+aya-expanse-8b大模型！GitHub models免费API！

[LLMs 实践] 09 BPE gpt2 tokenizer 与 train tokenizer

[LangChain] 05 LangChain、LangGraph 结构化输出（Structured output），gpt-4o-2024-08-06

[动手写神经网络] 手动实现 Transformer Encoder

Dify实战 - 文件上传，图文理解工作流！

ABAQUS蜂窝压缩有限元分析

[bert、t5、gpt] 11 知识蒸馏（knowledge distill）huggingface trainer pipeline

[动手写神经网络] pytorch 高维张量 Tensor 维度操作与处理，einops

Dify实战 - 基于用户上传文档的问答

3步让AI接管你的电脑【claude最新API使用教程】

[DRL] 从 TRPO 到 PPO（PPO-penalty，PPO-clip）

[[bert、t5、gpt] 02 transformer 架构 scaled dot product self attention（qkv）

伯克利音乐学院《电子音乐制作（制作技术、Ableton Live、音效设计、表演技巧）|Electronic Music Production》中英字幕

WinRAR（压缩解压工具） v7.00 烈火汉化版下载安装激活教程

[蒙特卡洛方法] 04 重要性采样补充，数学性质及 On-policy vs. Off-policy

[强化学习基础 02] MDP价值迭代算法（value iteration，V(s), Q(s,a), pi(s)）

[动手写 Transformer] 从 RNN 到 Transformer，为什么需要位置编码（position encoding）

[动手写 bert 系列] 02 tokenizer encode_plus, token_type_ids（mlm，nsp）

[DRL] 从策略梯度到 TRPO（Lagrange Duality，拉格朗日对偶性）

[动手写 Transformer] 手动实现 Transformer Decoder（交叉注意力，encoder-decoder cross attentio）

[bert、t5、gpt] 07 GPT2 decoding （greedy search, beam search）

[LangChain] 03 LangGraph 基本概念（AgentState、StateGraph，nodes，edges）

[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计（MLE）伯努利分布的参数

[RLHF] 从 PPO rlhf 到 DPO，公式推导与原理分析

Dify / LangChain 识别图片发票 / PDF发票

[LLM && AIGC] 04 深入理解 openai tokenizer 及 api 中的 logit_bias 与 logprobs