V
主页
Alibi模型原理分析
发布人
本课程主要讲解Attention with linear biases模型核心原理并分析模型实现的具体代码
打开封面
下载高清视频
观看高清视频
视频下载器
【黑马】AI大模型训练营2期
思维链:COT/TOT/GOT大模型原理介绍
llama2开源大模型原理介绍与分析
flashattention原理深入分析
transformer模型机制
AI产业发展现状分析
GPT原理介绍
大模型训练:MOE模型架构
AI训练中解决样本不平衡问题
RLHF大模型加强学习机制原理介绍
万能大模型:Google T5模型结构和原理介绍
GLU模型算法介绍与代码分析
实操教学,AI写小说进阶提示词框架,让写作更进一步
多头注意力(Multi-Head Attention)
AI算法面试题:word2vec训练方法
深入分析baichuan2(百川)大模型
QLORA大模型微调算法分析
AI算法面试:LR与SVM和DNN模型间的区别与联系
多头注意力机制算法介绍
LORA大模型微调算法原理解析
Deepspeed大模型分布式框架精讲
[动手写 Transformer] 手动实现 Transformer Decoder(交叉注意力,encoder-decoder cross attentio)
大模型幻觉破解方法(贝叶斯序列估计)
跨模态大模型实现时间序列预测
AI算法面试:过拟合与欠拟合问题如何解决
三分钟一键部署Ollama!解压即用!从安装到微调,只要五步,免费开源 AI 助手 Ollama ,带你从零到精通,保姆级新手教程,100%保证成功!
多模态模型: visual chatgpt原理分析
思维链大模型应用代码实例讲解
知识蒸馏:小模型向大模型学习
语言模型评价指标介绍
AI 发展大激辩:星辰大海与跟随战术,谁能主宰未来?大模型发展
AutoModel的lazy加载方式原理解读
【2024最新】大模型Agent智能体保姆级教程(应用解读+项目实战)手把手带你搭建一套属于你的智能体,原理讲解+代码解析,超通俗易懂的教学!
SentenceBert模型:文本语义去重
这4款最强AI视频总结神器竟然全都免费!【建议收藏】看视频必备!支持B站、YouTube、本地视频等
AI算法面试: LR使用交叉熵不用MSE作为损失函数?
AI算法面试:异常值检测方法与区别
GPT-o2推理超神,GPT-o1为何被 “冷落”? 大模型训练
Open AI 下一代模型深陷泥沼!进步龟速,成本飙升,数据危机来袭!大模型微调
FlashAttention与标准注意力机制模型比较