V
主页
理解向量数据库与文本向量检索效率
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
RAG(检索增强)从入门到精通 Raptor
向量数据库是什么?为啥AI大模型离不开它?
RAG增强检索是如何工作的?
Faiss 向量检索库
微调一个模型需要多少GPU显存?
【上集】向量数据库技术鉴赏
大模型项目选择RAG还是微调:八个判断依据
向量数据库介绍,Vector和Embedding关系 #大模型 #向量数据库
通俗易懂理解自注意力机制(Self-Attention)
经典RAG结构的问题以及几点解决思路
动手学RAG:Part1 什么是RAG?
通俗易懂理解大模型预训练和微调
什么是大模型量化和蒸馏?
什么是大模型幻觉?为什么会产生幻觉?
RAG实战中常见的问题
吴恩达《向量数据库:从嵌入到应用》Vector Databases: from Embeddings to Applications中英字幕
如何搭建自己的文本向量数据库
什么是混合专家模型(MoE)?
大模型项目落地中的五个坑
什么是灾难性遗忘?为什么要重视它?
如何把RAG和知识图谱结合
模型微调中最不需要关注的应该是GPU成本
当前大模型技术能否走向AGI?
通俗易懂理解提示工程、RAG和微调
从零开始学习大语言模型(一)
大模型是如何生成回复的?背后逻辑又是怎样?
最近火爆的GraphRAG是什么? 真的那么有用吗?
部署本地大模型和知识库,最简单的方法
在大模型项目中构造好Benchmark的重要性
通俗理解大模型领域关键术语以及它们之间的关系
什么是端到端(End-to-End)模型?
通俗易懂理解全量微调和LoRA微调
使用大模型时可调节的TopK、TopP到底是什么意思?
大模型成功背后的RLHF到底是什么?
什么是生成式AI?生成AI不等于大模型,判别模型和生成模型
LORA大模型微调算法原理解析
作者亲自讲解:LoRA 是什么?
本地跑大模型,需要什么配置
关于Llama3.1模型简要总结&启示
大模型项目选择RAG还是微调:三个案例