V
主页
RAG 已经过时了吗?如何配合长上下文优化 RAG
发布人
RAG在长上下文大语言模型(LLM)中的应用探讨 这是@rlancemartin最近在几个聚会上关于在长上下文LLM时代使用RAG的讲座。随着上下文窗口增至超过100万Token,很多人质疑RAG是否已经过时。我们结合几个最新的项目成果来分析这个问题。我们讨论了长上下文LLM在事实推理和信息检索方 面现有的限制(采用多针索引分析法),同时也探讨了上下文窗口扩展可能带来的RAG应用场景的变化,如文档中心的索引技术和RAG的流程优化。 幻灯片展示:[查看详情](https://docs.google.com/presentation/d/1mJUiPBdtf58NfuSEQ7pVSEQ2Oqmek7F1i4gBwR6JDss/edit#slide=id.g26c0cb8dc66_0_0) 重点参考文献: 1/ 多针索引分析,合作研究者@GregKamradt [阅读更多](https://blog.langchain.dev/multi-needle-in-a-haystack/) 2/ RAPTOR研究项目,主要研究者包括@parthsarthi03 [项目首页](https://github.com/parthsarthi03/raptor/tree/master) [视频介绍](https://www.youtube.com/watch?v=jbGchdTL7d0&t=0s) 3/ Dense-X / 多维数据索引技术,主要研究者@tomchen0 [学术论文](https://arxiv.org/pdf/2312.06648.pdf) [相关博客](https://blog.langchain.dev/semi-structured-multi-modal-rag/) 4/ 长期上下文数据嵌入技术,研究者包括@JonSaadFalcon, @realDanFu, @simran_s_arora [研究概览](https://hazyresearch.stanford.edu/blog/2024-01-11-m2-bert-retrieval) [技术教程](https://www.together.ai/blog/rag-tutorial-langchain) 5/ 自适应RAG (@AkariAsai等),及C-RAG (Shi-Qi Yan等) [论文一](https://arxiv.org/abs/2310.11511) [论文二](https://arxiv.org/abs/2401.15884) [研究动态](https://blog.langchain.dev/agentic-rag-with-langgraph/) 0:20 - 上下文窗口正逐渐增大 2:10 - 多针索引挑战 9:30 - RAG的未来变革 12:00 - 查询机制分析 13:07 - 以文档为中心的索引技术 16:23 - 自我反思的RAG模式 19:40 - 会议总结
打开封面
下载高清视频
观看高清视频
视频下载器
马克·扎克伯格的形象大转变
【Ollama+RAGFlow】快速搭建本地知识库,免费、无限制、保护隐私、无需网络~小白入门必看的保姆级教程!
20分钟学会Qwen2-7b本地部署GraphRAG,无需Ollama,从环境搭建到报错解决全流程,草履虫都能学会~
盘点一周AI大事(11月17日)|Grok证明黎曼猜想?
【GraphRAG 小白技术系列漫画教程】—三上悠亚 GraphRAG 学习记,跟电脑F盘的女神展开一场甜甜的恋爱吧——17
Geoffrey Hinton 对 AI 未来的见解(双语字幕)
陶哲轩在2024年国际数学奥林匹克(IMO)的演讲:AI 与数学
如何写好提示词4
Flowise重磅更新,零代码实现多文件检索增强生成和AI智能体!支持JinaAI嵌入模型+ministral 8b模型轻松打造RAG知识库!打造专属AI助手
让 OpenAI o1 写一个贪吃蛇的网页游戏,这不算什么,但是后面让它在网格中添加障碍物,并且连在一起是 A I 两个字母,这确实有了一点智能的样子了
AI 视频:两小儿辩日
如何写好提示词2
Mistral 入门指南 —— 如何从头实现一个简单的检索增强生成(RAG)
使用RAGFlow+Ollama搭建超好用的中文知识库!基于OCR和文档解析的RAG,多模态大模型、人工智能
升级到 GPT-4o 后使用提示词的五项调整
OpenAI 邀请了可汗学院的可汗和他儿子一起使用了 GPT-4o 辅导孩子在可汗学院上做数学题
【自学AI Agent】绝对是我在B站见过最全的Agent智能体行业落地应用实战教程!MOE模型、LORA、RAG
AGI真的只是幻想吗?(双语字幕)
# LLM基础常见面试题(十三) -- RAG专题
(超爽中英!) 2024最好的【吴恩达RAG】教程!更适合程序员,全程干货无废话,学完成为AGI大佬!(附课件+代码)
震惊!AI教父李开复最新演讲曝光:GPT-4已过时,未来手表能听懂人话?
使用原生 Python 实现 RAG
冒死上传!目前B站最完整的大模型微调教程,适应于所有大模型微调实战!微调|量化|部署|应用
谷歌发现RAG缩放定律 释放LLM长上下文潜力 提升RAG准确率 #小工蚁
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)全程干货,拿走不谢,允许白嫖!!
15分钟快速上手,如何为RAG选择一款合适的embedding模型?(附教程)
AI证明黎曼猜想?AI巅峰时刻真到了吗?
Sam:我们究竟是创造了一个工具还是一个生物?
7 个帮助最小化 RAG 模型风险的指标
马云对话马斯克:人工智能对人类是机遇还是威胁?(双语字幕)
Mistral 入门指南 —— 介绍
来看看ChatGPT如何回答多年前马科长的这段采访。
大语言模型微调之道3——微调在训练过程中的位置
以后不用担心一个人过生日太孤单,让 GPT-4o 给你唱首生日歌!🎂
【喂饭教程】10分钟学会用Ollama+Dify搭建一个专属私有知识库!支持多种文件类型,本地部署大模型,效果惊人的好!
如何写好提示词?(上)
【小白福音】Ollama + AnythingLLM,有手就行本地知识库部署,从安装到部署,手把手教你玩转知识库!
【AI大模型】十分钟博士教你使用RAGFlow+Ollama搭建超实用中文知识库!基于OCR和文档解析的RAG
全面解析!LightRAG 和 GraphRAG,哪个速度更快,效果更好,部署更方便!从本地模型部署到源码解读
Agent+RAG大模型落地应用实践经验分享(超级干货)