V
主页
[LLMs 实践] 19 llama2 源码分析 RoPE apply_rotary_emb 从绝对位置编码到相对位置编码
发布人
本期code:https://github.com/chunhuizhang/personal_chatgpt/blob/main/tutorials/llama2_src_03_RoPE_apply_rotary_emb.ipynb
打开封面
下载高清视频
观看高清视频
视频下载器
[LLMs 实践] 18 llama2 源码分析 RoPE 相对位置编码的复数形式
[LLMs 实践] 221 llama2 源码分析 generate 的完整过程
[LLMs 实践] 20 llama2 源码分析 cache KV(keys、values cache)加速推理
[LLMs 实践] 17 llama2 源码分析(RMSNorm 与 SwiGLU)
[LLMs 实践] 09 BPE gpt2 tokenizer 与 train tokenizer
[LLMs 实践] 15 llama2 源码初步(text completion & chat completion)
[LLMs 实践] 03 LoRA fine-tune 大语言模型(peft、bloom 7b)
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[LLMs 实践] 02 LoRA(Low Rank Adaption)基本原理与基本概念,fine-tune 大语言模型
[LLMs 实践] 08 LLM.int8 量化细节 (load_in_8bit)以及 bitsandbytes 库
[personal chatgpt] LLAMA 3 整体介绍(与 LLama 2 的不同?)
[LLMs 实践] 14 llama2 introduction 及 fine tune llama2(guanaco dataset)
ai换脸变脸一张图换脸rope直播版更新帧率显示,以及输入摄像头分辨率调节
[LLMs 实践] 21 llama2 源码分析 GQA:Grouped Query Attention
[LLM & AIGC] 03 openai embedding (text-embedding-ada-002)基于 embedding 的文本语义匹配
[LLMs 实践] 04 PEFT/LoRA 源码分析
[LLMs 实践] 12 LLM SFT training (trl SFTTrainer、alpaca dataset)
[LLMs 实践] 11 gradient accumulation 显存优化 trick
[diffusion] 生成模型基础 VAE 原理及实现
[pytorch distributed] 01 nn.DataParallel 数据并行初步
[矩阵分析] LoRA 矩阵分析基础之 SVD low rank approximation(低秩逼近)
[leetcode reviews] 01 计算思维与刷题方法
[pytorch] torch.einsum 到索引到矩阵运算(index、shape、dimension、axis)
[LLMs 实践] 07 fp16 与自动混合精度训练(amp)显著提升 batch size
[矩阵分析] 旋转矩阵的计算机与应用(复平面,RoPE)
75、Llama源码讲解之RoPE旋转位置编码
【数字图像处理】HoG+SVM+NMS行人检测(pedestrian detection)(python-opencv)
[强化学习基础 01] MDP 基础(概率转移,与POMDP、I-POMDP)
[pytorch 强化学习] 11 逐行写代码实现 DQN(ReplayMemory,Transition,DQN as Q function)
[sbert 01] sentence-transformers pipeline
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像
[工具的使用] python jupyter 环境安装配置拓展(nbextension)(ExcecuteTime:执行时间,Table of Content)
[pytorch distributed] deepspeed 基本概念、原理(os+g+p)
[pytorch] torch.nn.Bilinear 计算过程与 einsum(爱因斯坦求和约定)
【数据分析】成本(固定成本、可变成本)收益利润模型(cost-revenue-profit)、盈亏平衡分析
[蒙特卡洛方法] 04 重要性采样补充,数学性质及 On-policy vs. Off-policy
【会计】个人所得税速算扣除数的计算及推导
[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif(以 CartPole 为例,mode='rgb_array')
[pytorch] [求导练习] 03 计算图(computation graph)及链式法则(chain rule)反向传播过程
[pytorch 强化学习] 05 迷宫环境(maze environment)策略梯度(Policy Gradient)求解