V
主页
京东 11.11 红包
ChatGLM 130B大模型训练教训总结
发布人
千亿规模大模型ChatGLM训练中有那些问题?怎么解决?如何加速训练?
打开封面
下载高清视频
观看高清视频
视频下载器
LORA大模型微调算法原理解析
吴恩达同步最新AI课,第56讲:Llama 3.2多模态综合开发--Introducing Multimodal Llama 3.2
B站强推!手把手教你如何选取RAG中的embedding模型,模型讲解+代码解析,看完就能学明白!LLM大模型_RAG_大模型微调_多模态
ChatGLM与ChatGPT什么区别??
大模型训练:MOE模型架构
QLORA大模型微调算法分析
RLHF大模型加强学习机制原理介绍
FlashAttention与标准注意力机制模型比较
ROPE-NEXT-骑士版来啦支持DFL模型直播飞起使用TENSORRT显存占用大幅降低
SentenceBert模型:文本语义去重
大模型落地,你必须要懂的Milvus向量数据库
ToolFormer模型:会调用API解决问题的大模型训练方法
知识蒸馏:小模型向大模型学习
思维链:COT/TOT/GOT大模型原理介绍
3D游戏到底是怎么做出来的?
Deepspeed大模型分布式框架精讲
flashattention原理深入分析
从谣言到“有图有真相”,我们该怎么对抗AI的深度伪造?
大模型幻觉破解方法(贝叶斯序列估计)
人类寿命即将翻倍?!【诺贝尔奖2024】
万能大模型:Google T5模型结构和原理介绍
AI算法面试:交叉熵为什么可以作为分类的损失函数???
大模型与隐私计算的MPC计算框架
BERT模型介绍
VLLM ——高效GPU训练框架
miniGPT4:多模态图文理解训练
如何提高Llama模型中文综合运用能力???
streamingLLM:提示词上下文长度超过大模型长度限制怎么办?
通义千问大模型全家桶-技术分析
【硬核】工科生苦傅里叶久矣!傅里叶变换原理究极入门,工科生的必修课,看不懂的来找我算账!【喵星考拉】傅里叶变换究极入门课程
思维链大模型应用代码实例讲解
基于大模型做信息抽取方法介绍
DetectGPT:检测文本是否GPT生成的算法
多头注意力机制算法介绍
transformer模型机制
人类文明的加速器:如何训练大模型求解推导数学问题?
Pytorch的分布式训练工具torchrun原理与应用
VAE变分自编码器模型
语言模型评价指标介绍
GPT原理介绍