V
主页
[动手写 Transformer] 从 RNN 到 Transformer,为什么需要位置编码(position encoding)
发布人
本期 code:https://github.com/chunhuizhang/bert_t5_gpt/blob/main/tutorials/encoder-decoder/bow_wo_pe.ipynb 位置编码大综述:BV1XS411P7Lc
打开封面
下载高清视频
观看高清视频
视频下载器
[personal chatgpt] 从 RoPE 到 CoPE(绝对位置编码,相对位置编码,Contextual Position Encoding)
超全超简单!一口气刷完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM、DBN等八大深度学习神经网络算法!真的比刷剧还爽!
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
强推!草履虫都能一口气学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM、DBN等八大深度学习神经网络算法!真的比刷剧还爽!
剑指Softmax注意力梯度下降,基于指数变换的注意力实在厉害! 深度学习这下真大升级!
吃透多模态四大模型!计算机大佬带你一口气学会:CLIP BLIP VIT MLLM多模态底层逻辑!真的通俗易懂!带你真正的对话机器人!(人工智能、深度学习)
吹爆!不愧是中科院大佬,7天就把Transformer、RNN、BERT和迁移学习讲透了!整整100集付费,全程干货讲解,这还学不会up直接退出IT圈!
北大新作:傅里叶分析神经网络,填补周期性特征建模缺陷,Transformer重要缺陷被揭示!
【强推】2024最完整版从入门到精通一口气学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络!这不比刷剧爽多了!
【全126集】目前B站最系统的Transformer教程!入门到进阶,全程干货讲解!拿走不谢!(神经网络/NLP/注意力机制/大模型/GPT/RNN)
[BERT 番外] Sin Position Encoding 的简洁实现(RoPE 基础)
简单模型往往泛化更好?上下文学习与奥卡姆剃刀,从元学习视角理解大模型泛化
[动手写神经网络] 手动实现 Transformer Encoder
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
多元时间序列创新断崖式增长:联合混合并不是最优!3种xLSTM高级改进教你速提精度
小波变换+注意力机制新突破! 再登Nature!附15种创新思路
强推!从入门到精通CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络一口气全部学完!比刷剧还爽!
【数值计算】牛顿迭代法(Newton's method,Newton-Raphson method,牛顿-拉夫逊(拉弗森))计算二次方根(sqrt)三次方根
绝了!用降噪耳机原理升级注意力? 微软亚研&清华独创Transformer
这也太全了!目前为止我在B站看到过最完整最系统的【时间序列预测模型】教程!(LSTM/Informer/ARIMA/Pandas/Transformer)
不看太可惜!又快又准,即插即用!Sage Attention——清华8bit量化Attention
【统计学】从置信水平(confidence level,置信区间)、Z值到最小采样数(最小抽样数)
眼观六路 手感八方,机器手识别万物,登Science子刊封面
【深度学习零基础篇】从入门到精通一口气学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络!
[LLMs 实践] 19 llama2 源码分析 RoPE apply_rotary_emb 从绝对位置编码到相对位置编码
[LLMs 实践] 18 llama2 源码分析 RoPE 相对位置编码的复数形式
[调包侠] 使用 PyTorch Swin Transformer 完成图像分类
[模型拓扑接口] 经典 RNN 模型(一)模型参数及训练参数的介绍
【手推公式】从二分类到多分类,从sigmoid到softmax,从最大似然估计到 cross entropy
[personal chatgpt] peft LoRA merge pipeline(lora inject,svd)
[LangChain] 03 LangGraph 基本概念(AgentState、StateGraph,nodes,edges)
[python 多进程、多线程] 03 GIL、threading、多进程,concurrent.futures
[矩阵分析] LoRA 矩阵分析基础之 SVD low rank approximation(低秩逼近)
太...完整了!终于有人能把【Transformer】入门到精通这么通俗的讲清楚了,最新前沿方向均有涉猎!-人工智能/深度学习
超全超简单!同济大佬53集带你零基础吃透GNN图神经网络:GCN图卷积、PYG、图注意力机制、图相似度、轨迹预测实战一口气学完!-人工智能/神经网络/深度学习
[蒙特卡洛方法] 01 从黎曼和式积分(Reimann Sum)到蒙特卡洛估计(monte carlo estimation)求积分求期望
[Python 机器学习] 深入理解 numpy(ndarray)的 axis(轴/维度)
[蒙特卡洛方法] 03 接受/拒绝采样(accept/reject samping)初步 cases 分析
[DRL] 从 TRPO 到 PPO(PPO-penalty,PPO-clip)
[leetcode reviews] 01 计算思维与刷题方法