V
主页
怎么计算模型推理需要多少GPU?
发布人
想让模型支持10个并发,需要多少GPU呢?
打开封面
下载高清视频
观看高清视频
视频下载器
推荐四种落地 Agent 的方案
大模型为什么会有幻觉?怎么解决幻觉问题?
知识库效果评估方案推荐
搞大模型必备的4种开源工具
落地RAG的技术栈推荐
阿里重磅发布!Spring AI Alibaba 开发框架
十分钟部署本地大模型!
微调一个模型核心关注哪些点?
我们为什么需要Agent?
大模型总体技术选型总结
搞大模型为什么需要GPU?
大模型的参数指的是什么?
推荐4个好用的大模型微调平台
大模型应用开发框架推荐
大白话解释Scaling Law
RAG 和 Agent 的本质区别是什么?
我们为什么需要向量?
不同开发语言的大模型开发框架推荐
做大模型应用有哪4个坑?
大白话解释什么是Agent
基于大模型构建知识库,怎么评估需要多少资源?
AI模型技术架构全景图
10 手推Transformer之多头掩码自注意力机制
09 手推Transformer之解码器
3分钟讲清楚大模型预训练和微调
vllm 0.6.0开源大模型推理加速服务的部署和测试
分享落地RAG的一个坑之相似度不准(1)
07 手推Transformer之前馈网络的作用是什么?
降低大模型幻觉的5种方案
经典RAG落地中的关键问题总结
落地RAG,用ES?还是用知识图谱?
一键提取PDF内容和一键生成知识图谱
02 手推Transformer之词嵌入
你的知识库的准确率为什么低于95%?
05 手推Transformer之用线性代数解释自注意力
RAG 架构演进之路
00 Transformer横空出世
落地 AI Agent 的技术方案有哪些?
06 手推Tansformer之多头自注意力机制
知识图谱是什么?和大模型的关系是什么?