V
主页
[personal chatgpt] gpt-4o tokenizer 及特殊中文tokens(压缩词表),o200k_base
发布人
本期 code:https://github.com/chunhuizhang/personal_chatgpt/blob/main/tutorials/tokenizer/tokenizer_gpt4o.ipynb 关于 bpe(tokenizer):https://www.bilibili.com/video/BV1Sk4y1P7LK/?spm_id_from=333.999.0.0
打开封面
下载高清视频
观看高清视频
视频下载器
[personal chatgpt] Llama2 7B vs. Llama3 8B (词表、attention 及 mlp)
[personal chatgpt] instructGPT 中的 reward modeling,概率建模与损失函数性质
[personal chatgpt] peft LoRA merge pipeline(lora inject,svd)
Git Merge vs Rebase vs Squash
[personal chatgpt] 从 RoPE 到 CoPE(绝对位置编码,相对位置编码,Contextual Position Encoding)
[personal chatgpt] trl 基础介绍:reward model,ppotrainer
[personal chatgpt] trl rlhf PPOTrainer,原理分析与代码走读(OpenRLHF framework)
[personal chatgpt] LLAMA 3 整体介绍(与 LLama 2 的不同?)
[bert、t5、gpt] 06 GPT2 整体介绍(tokenizer,model forward)
[personal chatgpt] trl reward model 与 RewardTrainer(奖励模型,分类模型)
[LLMs inference] hf transformers 中的 KV cache
[纳什荐书][生成式AI] 01 《GPT图解》导读
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[调包侠] tencent ailab 中文语料 embedding vector(word2vec)
零代码构建AI智能体!本地部署n8n+LiteLLM+免费gpt4o!ollama+aya-expanse-8b大模型!GitHub models免费API!
[LLMs 实践] 09 BPE gpt2 tokenizer 与 train tokenizer
[LangChain] 05 LangChain、LangGraph 结构化输出(Structured output),gpt-4o-2024-08-06
[动手写神经网络] 手动实现 Transformer Encoder
Dify实战 - 文件上传,图文理解工作流!
ABAQUS蜂窝压缩有限元分析
[bert、t5、gpt] 11 知识蒸馏(knowledge distill)huggingface trainer pipeline
[动手写神经网络] pytorch 高维张量 Tensor 维度操作与处理,einops
Dify实战 - 基于用户上传文档的问答
3步让AI接管你的电脑【claude最新API使用教程】
[DRL] 从 TRPO 到 PPO(PPO-penalty,PPO-clip)
[[bert、t5、gpt] 02 transformer 架构 scaled dot product self attention(qkv)
伯克利音乐学院《电子音乐制作(制作技术、Ableton Live、音效设计、表演技巧)|Electronic Music Production》中英字幕
WinRAR(压缩解压工具) v7.00 烈火汉化版下载安装激活教程
[蒙特卡洛方法] 04 重要性采样补充,数学性质及 On-policy vs. Off-policy
[强化学习基础 02] MDP价值迭代算法(value iteration,V(s), Q(s,a), pi(s))
[动手写 Transformer] 从 RNN 到 Transformer,为什么需要位置编码(position encoding)
[动手写 bert 系列] 02 tokenizer encode_plus, token_type_ids(mlm,nsp)
[DRL] 从策略梯度到 TRPO(Lagrange Duality,拉格朗日对偶性)
[动手写 Transformer] 手动实现 Transformer Decoder(交叉注意力,encoder-decoder cross attentio)
[bert、t5、gpt] 07 GPT2 decoding (greedy search, beam search)
[LangChain] 03 LangGraph 基本概念(AgentState、StateGraph,nodes,edges)
[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计(MLE)伯努利分布的参数
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
Dify / LangChain 识别图片发票 / PDF发票
[LLM && AIGC] 04 深入理解 openai tokenizer 及 api 中的 logit_bias 与 logprobs