V
主页
大模型全栈–transformer原理-embedding原理-增量预训练技巧
发布人
1.介绍了transformer的流程步骤 2.transformer各个组件拆分详解:decoder encoder块,self-attion,mutihead-attention,FFN 3.当前主流模型架构:decoder-only,encoder-decoder encoder-only 4.开源模型:llama系列以及moe模型介绍 5.增量与训练技巧以及每个步骤关键技术点
打开封面
下载高清视频
观看高清视频
视频下载器
大模型全栈总览-tokenizer
强到离谱!解决Transformer的根本缺陷,2024年最热门论文之CoPE位置编码方法:所有大模型都能获得巨大改进!LLM
我愿称之为【Huggingface+BERT+Transformer】新手入门教程天花板,中文模型实战实例讲解,快速上手自然语言处理神器!!!
大模型全栈–微调02-PEFT高效参数微调技术速览lora等技术、lora应用场景、lora调优经验
【谷歌统计模型】基于条件自回归扩散模型的图像超分辨率放大16倍效果绝绝子
大模型全栈-数据介绍
09大模型全栈-强化学习02-RLHF前言LLM强化学习
15大模型全栈-强化学习08-DPO变体:IPO、KTO:无需偏好数据实现对齐
我TM吹爆!这才是B站最系统的transformer!中科院大佬亲讲200集,全程干货满满!学不会自我反省!(自然语言处理/深度学习/神经网络/ChatGPT)
【时间序列论文】解决Transformer的训练不稳定性:SAMformer
11大模型全栈-强化学习04-RLHF实战-deepspeed-chat实战
大模型全栈–微调01-微调前置-内含openAI垂直大模型生成方案介绍
12大模型全栈-强化学习05-RLHF实战-端到端全流程解决方案-轩辕大模型强化学习完整流程介绍(数据+奖励模型+强化学习调参经验)
chatglm4微调以及部署介绍
不讲废话!这才是科研人该学的Pytorch框架!从入门到精通一口气讲完CNN、RNN、LSTM、transformer等神经网络算法!存下吧 这不比啃书好多了!
大模型全栈总览
吹爆!使用Huggingface预训练模型解决80%的NLP问题!建议NLP方向的同学重点学习!(安装+讲解+实战)一步到位!
NLP自然语言处理必学基础!NLP入门到进阶全程干货讲解,绝对通俗易懂,学完即可就业!---人工智能_NLP预训练模型_Transformer模型_深度学习
真的太全了!这可能是目前为止我在B站看到过最全最系统的【时间序列预测模型】教程!(LSTM/Informer/ARIMA/PandasTransformer)
8小时快速上手【Huggingface+BERT+Transformer】自然语言处理处理神器,中文模型实战实例讲解,datasets类库,简单高效!!!
Transformer实战代码原理(源码Pytorch版本)从零解读(Pytorch版本)
接chatglm4微调以及部署介绍实操测试多模态以及文档分析部分
YOLOv8.9.10.word.detr代码详解之加载预处理数据并前向传播,代码模块逐行调试,小白赶紧看,彻底搞明白!!
10大模型全栈-强化学习03-RLHF原理以及流程介绍
08大模型全栈-强化学习01-RLHF前言传统强化学习
研究生必看!8个小时搞懂【Huggingface+BERT+Transformer】,中文模型实战实例讲解datasets类库,不愧是自然语言处理神器!!!
发论文神器!搞深度学习神经网络必知的7个注意力模块!
75、Llama源码讲解之RoPE旋转位置编码
如何理解Transformer的位置编码,PositionalEncoding详解
当前计算机行业热度超高的就业方向!北大博士后手把手带你从零到一掌握大模型预训练及微调,简直不要太好懂!
Mamba-2模型原理解读-1模型
自适应分层特征融合模块HFF,适用于图像分类、图像分割任务,深度学习即插即用模块
基于YOLO的A+B+C式论文还能发论文吗,可以发什么水平的论文?进来获得自信心!【深度学习】
论文还没方向?建议试试这两个“万能模块”:GNN图神经网络+Transformer模型,计算机大佬从零到一讲解算法基础及代码实战!
大模型全栈总览-训练总览
大模型全栈-提词工程
从零解读Transformer代码(源码Pytorch版本)这可能是你见过最通俗易懂的讲解
清华大佬终于把AI大模型(LLM)讲清楚了!通俗易懂!绝对是B站目前为止讲解最透彻的教程了!建议收藏!(人工智能、深度学习、机器学习、神经网络)
B站首推!不愧是李宏毅老师讲的【强化学习】简直太详细!!!2024公认最通俗易懂的【强化学习教程】小白也能信手拈来(人工智能|机器学习|深度学习|强化学习)
13大模型全栈-强化学习06-DPO流程、代码以及损失函数介绍