V
主页
深入分析baichuan2(百川)大模型
发布人
百川2官方论文内容核心分析包括:语料内容,如何训练,GPU集群搭建,模型校准,模型安全防控
打开封面
下载高清视频
观看高清视频
视频下载器
大模型训练:MOE模型架构
flashattention原理深入分析
Deepspeed大模型分布式框架精讲
更快更强的Transformer升级模型:Transformer-XL
知识蒸馏:小模型向大模型学习
Alibi模型原理分析
VLLM ——高效GPU训练框架
BERT模型介绍
Normalization归一化:batch normalization vs layer nomalization
SentencePiece大模型编码工具和相关算法介绍
RLHF大模型加强学习机制原理介绍
SentenceBert模型:文本语义去重
transformer模型机制
盘古大模型
VAE变分自编码器模型
AI产业发展现状分析
【全200集】AI大模型公开课:从大模型入门到项目实战,北大博士带你变身AI大佬!涵盖大模型原理 基础框架 模型优化及chatglm agent大模型代码实战!
ToolFormer模型:会调用API解决问题的大模型训练方法
多模态模型: visual chatgpt原理分析
GLU模型算法介绍与代码分析
语言模型评价指标介绍
llama2开源大模型原理介绍与分析
OpenDelta大模型微调算法代码实现分析
人类文明的加速器:如何训练大模型求解推导数学问题?
go语言并发编程-singleflight优化缓存雪崩和击穿
大模型幻觉破解方法(贝叶斯序列估计)
华为云全新CloudMatrix架构,如何成为人工智能的“发电机”?
LangChain初学者指南:通过动画解析!
QLORA大模型微调算法分析
AI算法面试:LR与SVM和DNN模型间的区别与联系
【大模型入门教程】AIGC与大模型核心知识与应用案例(大模型训练/微调)
AI训练中解决样本不平衡问题
GPT原理介绍
FlashAttention与标准注意力机制模型比较
Ollama一键本地部署!解压即用!免费开源 AI 助手 Ollama 从安装到微调,保姆级新手教程,100%保证成功,完全零代码轻松实现!
【AI大模型】使用Ollama+Dify搭建一个全能知识库!专属自己!支持多种文件类型,实现本地化大型模型部署,效果非凡!
如果人工智能AI 取代了所有工作,社会将变成这样!人工智能技术
Pytorch加强学习Qlearning算法介绍
Pytorch的分布式训练工具torchrun原理与应用
如何提高Llama模型中文综合运用能力???