V
主页
知识斗地主:解析RAG大模型中复杂的知识冲突
发布人
嘉宾 许融武,清华大学交叉信息院二年级硕士生。研究方向为自然语言处理和社会计算。最近的主要关注点包括:大模型的评测,大模型与知识,大模型的安全对齐和大模型的可解释性等。以第一/共同第一作者身份,在 ACL等国际会议发表多篇论文。个人主页请见:https://rongwuxu.site 祁泽涵,清华大学交叉信息院一年级博士生。研究方向为自然语言处理和大模型智能体。最近的主要关注点包括:大模型评测,大模型推理和大模型智能体等。 主持人 王鸿儒 香港中文大学博士生 内容 一. 背景 1. 知识冲突的定义,研究历史,为什么在 RAG 大模型时代受到了更大的关注 二. 三种知识冲突 1. 上下文和参数化知识冲突:产生,分析,缓解方式和 remark a. 上下文和参数化知识冲突是对于 RAG 模型来说面临最主要的一种冲突,也是目前研究界最关注的一种冲突。 b. 面对复杂的知识冲突,模型会更加相信上下文中的知识,还是参数化记忆中的知识?模型对于知识的选择是否与实际的场景有关系呢? c. “正确”而非“先验”的缓解措施,应当是什么?是否存在一个明确的缓解措施呢? 2. 上下文之间的知识冲突:产生,分析,缓解方式和 remark a. RAG 检索到的文档之间的冲突,应该如何处理。 b. 面对相互冲突的文档,具有什么特征的文档可以更加赢得模型的倾向?这一倾向性体现出模型自身的什么特征? 3. 参数化知识内部的知识冲突:产生,分析,缓解方式和 remark a. 如果我们不局限于 RAG 模型,而考虑大模型本身掌握的知识就是存在冲突的呢?这种冲突又是如何影响它们的表现。 b. 从成因角度来说,参数化知识内部的冲突可能是模型自己学到的数据就有冲突。这与幻觉的联系是什么? c. 从行为角度来说,参数化知识内部的冲突的体现是自我矛盾的行为,我们该如何解决? 三. 现有研究的不足和未来方向 1. 知识冲突方面还可以做哪些研究: a. 知识冲突测评的真实性和粒度 b. 知识冲突的缓解方式 c. 多语言的知识冲突 d. 多模态的(知识)冲突 e. 探讨知识冲突对下游任务的影响 f. 从可解释性为切入点,重新审视知识冲突, 2. survey 中没纳入的最新 paper。例如:真实RAG 场景下的知识冲突,可解释性与知识冲突相结合的工作等等 四. 延伸讨论 1. 知识冲突和大模型幻觉的联系 2. 知识捷径和幻觉、冲突等问题的联系 3. 关于 RAG 的讨论:面对知识冲突,如何进行 RAG 4. 如何消除预训练数据中的知识冲突,从数据角度解读知识冲突带来的影响 引言 检索增强生成(Retrieval-Augmented Generation, RAG)已成为大型语言模型生成文本的一种主要范式。这种技术的代表——检索增强的大型语言模型(Retrieval-Augmented Large Language Model, RALM)——能够直接利用检索得到的文档信息进行内容生成,无需进行额外的训练,这一优势使其在工业界得到了广泛应用,例如New Bing搜索引擎。 然而,自2023年起,RALM在处理知识冲突方面面临的问题逐渐成为研究的焦点。知识冲突不仅严重影响了模型在知识密集型任务上的性能,也暴露了其在面对错误信息时的脆弱性,进而对模型的安全性构成威胁,尤其是在那些对事实准确性有着严格要求的应用场景中。知识冲突主要表现在模型内部的参数化知识与外部上下文信息之间,以及外部上下文信息内部的不一致性。此外,研究者还观察到模型内部参数化知识之间存在冲突,即出现自相矛盾的现象,这可能源于模型在预训练阶段学习到了相互矛盾的信息。
打开封面
下载高清视频
观看高清视频
视频下载器
从零开始训练大模型
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)通俗易懂,学完即就业!拿走不谢,学不会我退出IT圈!!!
EMNLP2024分享会之NER、模型微调
大语言模型的知识编辑:问题,方法与挑战
LLM推理加速新范式!推测解码(Speculative Decoding)最新综述
迈向可信的AI:探索安全、负责的大语言模型
评估中文大模型中的幻觉
田渊栋博士:传统符号推理和大模型推理的融合之路
在上下文学习中,语言模型究竟学到了什么? 探索结构化任务假说
Transformer的无限之路:位置编码视角下的长度外推
2024逼自己一周学会AI大模型(LLM+RAG系统+GPT-4o+OpenAI),全程通俗易懂,别再走弯路了,学不会我退出IT界!
蛋白质交流的艺术:ProLLM用'思维链'重新定义蛋白质相互作用预测!
30分钟教会你使用Llama Factory微调一个专属自己的中文llama3
大模型做 OCR? Llama OCR 和 Zerox 介绍
15分钟手把手教你在RAG中如何选择合适的embedding模型!附解析代码!
【Agent+RAG】10小时博士精讲AI Agent(人工智能体)系列—提示工程、文本大模型、GPT...
EMNLP2024分享会之模型安全主题
【一小时掌握RAG】从0到1搭建一套完整的RAG系统,知识讲解+部署源码+实战项目+代码解析,大模型RAG企业项目实战教程!
WarAgent多智能体理解人类历史和预防未来国际冲突
【NICE一期】张子殷:代码大模型综述
墙裂推荐!大模型RAG项目实战,基于LlamaIndex构建企业级私有知识库
【超低成本】Fine-Tuning基于Qwen2.5-7B大模型从零微调行业大模型,过程可视化呈现,小白也能轻松学会!
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI),3天学完,让你少走99%弯路!
【大模型应用框架】LangChain系统教程,从零基础入门到实战!全程干货讲解,通俗易懂!(LLM/大模型/LangChain/RAG)
“显微镜”下的RAG:通过 RAGChecker 进行细粒度诊断评估
全栈大模型微调框架LLaMA Factory:从预训练到RLHF的高效实现
RNN卷土重来:基于门控记忆槽的线性注意力机制
【保姆级教程】使用LLaMA-Factory,实现Llama3中文增强模型微调+法律大模型微调
【整整11集】全B站最用心的知识图谱零基础教程-《基于知识图谱的智能问答项目实战》,2024最新版,带你3小时学会构建智能问答系统,附开源项目!
【Coze教程】这可能是全网最系统的Coze入门教程了!手把手教你用Coze手搓Agent智能体到搭建Coze工作流,入门到精通!
关于LLaMA & Alpaca 微调、代码生成、RAM配置等,更多你的疑问都在这里
从0到1搭建一个医疗知识问答系统!基于RAG的的医疗问答系统,用中华药典做数据库,理论+实战超详细解析包括代码实战、具体讲解、rag增强检索原理,附源码!
大模型LangChain+RAG企业级实战教程!从0到1!全程干货无废话,学完成为AGI大佬!(附课件+代码)
EMNLP2024分享会之模型编辑主题
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)全程干货,拿走不谢,允许白嫖!!
大语言模型多选题评估的偏见与鲁棒性
全程干货!低成本手把手教你Fine-Tuning基于Qwen2.5-7B大模型从零微调行业大模型,过程可视化呈现
(超爽中英!) 2024公认最全的【吴恩达大模型LLM】系列教程!附代码_LangChain_微调ChatGPT提示词_RAG模型应用_agent_生成式AI
【全100集】清华大佬终于把AI大模型(LLM)讲清楚了!通俗易懂,2024最新内部版!拿走不谢,学不会我退出IT圈!
吹爆!这可能是唯一能将搭建私有化应用讲清楚的教程了,环境搭建-模型准备-模型部署-api调用-知识库构建一条龙解读!草履虫都能学得会!人工智能|大模型