V
主页
OpenAI大神Andrej Karpathy教你从零构建GPT系列所使用的分词器 Let's build the GPT Tokenizer(李飞飞高徒)
发布人
https://www.youtube.com/watch?v=zduSFxRajkE&ab_channel=AndrejKarpathy 标记器(Tokenizer)是大型语言模型(LLMs)中一个必要且无处不在的组件,它在字符串和标记(文本块)之间进行转换。标记器是LLM流程中的一个完全独立的阶段:它们有自己的训练集、训练算法(比如字节对编码,Byte Pair Encoding),训练完成后实现两个基本功能:从字符串到标记的`encode()`函数,以及从标记回退到字符串的`decode()`函数。在这次讲座中,我们将从零开始构建OpenAI GPT系列所使用的标记器。在这个过程中,我们将看到LLMs的许多奇怪行为和问题实际上都可以追溯到标记化过程。 Supplementary links: - tiktokenizer https://tiktokenizer.vercel.app - tiktoken from OpenAI: https://github.com/openai/tiktoken - sentencepiece from Google https://github.com/google/sentencepiece
打开封面
下载高清视频
观看高清视频
视频下载器
OpenAI大神Andrej Karpathy讲授大型语言模型入门(2024中英) 李飞飞高徒intro to large language models
【李宏毅2024春最新】第8讲 生成式AI导论(中文)RLHF 大预言模型修炼史(3) by Hung-yi Lee
【Y Combinator】11月8日最新,山姆奥特曼(Sam Altman)对话现任YC掌门人:如何构建未来|OpenAI|2024.11.08
【全网最细】逼自己一周吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)通俗易懂,2024最新版,学完即就业!!
李飞飞:斯坦福计算机视觉公开课
【斯坦福CS231N】(中英|2019秋) 计算视觉 (李飞飞 Justin Johnson)Deep Learning for Computer Vision
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI),3天学完,让你少走99%弯路!
斯坦福李飞飞终于把【计算机视觉】给讲明白了!全程16集,草履虫都能听明白!深度学习cs231n公开课【中英字幕】
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)通俗易懂,学完即就业!拿走不谢,学不会我退出IT圈!!!
【李宏毅】2024秋《生成式人工智能导论》教程!LLM大模型入门到进阶,比刷剧爽多了!--附带课件代码
【李宏毅2024春最新】第7讲 生成式AI导论(中文) 大预言模型修炼史(2) by Hung-yi Lee
2024逼自己一周学会AI大模型(LLM+RAG系统+GPT-4o+OpenAI),全程通俗易懂,别再走弯路了,学不会我退出IT界!
【A16Z播客】李飞飞和贾斯汀·约翰逊(Justin Johnson)访谈:从早期的人工智能寒冬到深度学习崛起及多模态 AI 快速扩展的历程
这可能是B站讲的最好的AI大模型教程,一周吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI) 让你少走99%弯路!(2024最新版)
【Neuro】吊打GPT!点击就看AI女王绝杀ChatGPT
鲨疯了!最适合新手入门的【LLM医疗大模型】教程:医疗大模型LLM应用现状及如何微调一个医疗大模型?我竟然一天就搞懂了!
【李宏毅2024春最新】第6讲 生成式AI导论(中文) 大预言模型修炼史(1) by Hung-yi Lee
【2024版AI大模型教程】这可能是B站唯一能将AI大模型讲明白的教程(LLM+RAG系统+GPT-4o+OpenAI)7天从入门到进阶实战!拿走不谢,允许白嫖
【斯坦福 CS224W】图机器学习( 中英字幕 | 2021秋) Machine Learning with Graphs by Jure Leskovec
【2024】(中英) 视觉大神何恺明教授在MIT的第一堂课:扩展计算视野 Deep Learning Bootcamp: Kaiming He
【AI大模型】3天构建一个AI Chatbot聊天机器人,2025版最系统全面的AI大模型教程(LLM+RAG+Open AI+GPT+生成式AI)
B站讲的最好的AI大模型教程,包含【LLM+RAG系统+GPT-4o+OpenAI】所有核心知识点,一周学完,让你少走99%弯路!
【MIT6.006最新】算法导论(中英|2020春) Introduction to Algorithms 麻省理工
【附学习路线图】2024最新版AI大模型快速进阶实战(LLM+RAG系统+GPT-4o+OpenAI)通俗易懂,逼自己一周刷完,少走99%弯路
【斯坦福CS224N】(2021|中英) 深度自然语言处理Natural Language Processing with Deep Learning
Transformer 很 难 ? 50行代码手撸一个!(上)
超详细手把手教你ChatGPT白嫖攻略!百分之百能用上
【Coze教程】这可能是全网最系统的Coze入门教程了!手把手教你用Coze手搓Agent智能体到搭建Coze工作流,入门到精通!
【李宏毅2024春最新】第5讲 生成式AI导论(中文) 训练不了人工智能可以训练自己 下 by Hung-yi Lee
李飞飞团队新作:空间智能版ImageNet来了!收录NeurIPS 2024!
大语言模型课程Lesson1-1 什么是大语言模型?
2024最新版AI大模型短期训练教程,逼自己一周学完(LLM+RAG系统+GPT-4o+OpenAI)光刷完就赢麻了,通俗易懂|学完即就业!
【Dify开源项目实战 】目前B站最详细的Dify快速入门教程,手把手教你基于Llama 3.1和OpenAI创建聊天机器人与知识库
斯坦福大学《强化学习|Stanford CS234 Reinforcement Learning 2024》deepseek翻译
不看太可惜!又快又准,即插即用!Sage Attention——清华8bit量化Attention
【麻省理工MIT18.06线性代数/矩阵论】(中英|2005) Linear Algebra by Gilbert Strang
CoT不行?Long Context LLM的Hyper-Multi-Step
84、GPT-4o/Moshi实时语音对话多模态算法讲解
Qwen2.5 Coder:文本转 SQL 能力超越对手?实测告诉你!
使用原生 Python 实现 RAG