大语言模型编辑中的崩溃研究

发布人

主题
大语言模型编辑中的崩溃研究

分享内容
论文1：The Butterfly Effect of Model Editing: Few Edits Can Trigger Large Language Models Collapse
链接：https://aclanthology.org/2024.findings-acl.322.pdf
论文2：The Fall of ROME: Understanding the Collapse of LLMs in Model Editing
链接：https://aclanthology.org/2024.findings-emnlp.236.pdf代码：https://github.com/WLYangICT/Collapse-in-Model-Editing
项目主页：https://yangwl.site/collapse-in-model-editing

引言
模型编辑（Model Editing）技术在修正大语言模型的知识中展现出极大的潜力。然而，现有工作却忽视了它对语言模型固有能力的影响。我们深入研究了这一问题，并产出了两篇论文。第一篇论文揭示了少量编辑即可能导致语言模型崩溃的现象，并提出采用困惑度（Perplexity）作为诊断工具。该工作已被ACL2024 Findings收录。第二篇论文探讨了由最先进的编辑方法ROME触发的语言模型崩溃的根本原因，并提出了一个简单有效的解决方案。该工作已被EMNLP2024 Findings收录。

嘉宾
杨万里，本科毕业于南开大学，现为中国科学院计算技术研究所一年级博士生，由刘欣然教授和孙飞副研究员共同指导。研究兴趣包括：自然语言处理，知识编辑，可信AI等。在ACL和EMNLP上发表论文3篇，其中2篇作为第一作者发表。个人主页：https://yangwl.site

主持人
华文越 UCSB博后

打开封面下载高清视频观看高清视频视频下载器

大语言模型编辑中的崩溃研究

EMNLP2024分享会之Agent主题

EMNLP2024分享会之多模态主题

2024吃透AI大模型（LLM+RAG系统+GPT-4o+OpenAI）通俗易懂，学完即就业!拿走不谢，学不会我退出IT圈！！！

【全374集】2024最新清华内部版！终于把AI大模型（LLM）讲清楚了！全程干货讲解，通俗易懂，拿走不谢！

从零开始训练大模型

迈向可信的AI：探索安全、负责的大语言模型

蛋白质交流的艺术：ProLLM用'思维链'重新定义蛋白质相互作用预测！

EMNLP2024分享会之模型编辑主题

当心环境内容的干扰：大模型GUI智能体的忠实度研究

脆弱的不确定性：大模型的可信度如何被操控

bitnet.cpp 推理，速度超越 llama.cpp，内存最高降低 16 倍 | 附 BitNet b1.58 模型安装演示

EMNLP2024分享会之模型对齐主题

这可能是B站讲的最好的AI大模型教程，一周吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI) 让你少走99%弯路！（2024最新版）

如何训练你自己的o1模型？TPO？？

2025版AI大模型全套视频 (LLM+RAG系统+GPT-4o+OpenAI）这绝对是ai大模型教程天花板！

30分钟学会Qwen2.5-3B本地部署LightRAG，完胜GraphRAG！从模型部署到源码解读，带你全流程解析，速度快，效果好，落地部署更方便！！！

【NICE一期】周厚全：大模型会句法吗？

【精华35分钟】这应该是全网AI Agent讲解得最透彻的教程了，从什么是Agent到创建自己的Agent智能体！一次搞懂！大模型/LLM

自然语言处理BERT模型实战教程：基于BERT模型的文本分类、感分析及中文命名实体识别实战教程！真的通俗易懂！（人工智能、深度学习、机器学习、机器学习算法）

【AI项目实战】全网最适合新手入门的【RAG医疗问答系统】教程：如何搭建一个基于RAG的医疗问答系统，我竟30分钟就搞懂了？

在上下文学习中，语言模型究竟学到了什么? 探索结构化任务假说

“显微镜”下的RAG：通过 RAGChecker 进行细粒度诊断评估

Transformer模型能否进行隐式的推理？一个关于Grokking和泛化的深入探索

2024吃透AI大模型（LLM+RAG系统+GPT-4o+OpenAI），3天学完，让你少走99%弯路！

大模型事实性综述

【Coze教程】这可能是全网最系统的Coze入门教程了！手把手教你用Coze手搓Agent智能体到搭建Coze工作流，入门到精通！

【大模型面试】Flash Attention面试连环炮，淘汰80%面试竞争者

【零基础学AI】清华大佬200集讲完的AI人工智能从入门到精通全套教程，全程干货无废话！看完绝对让你少走弯路！研一研零必看！机器学习-深度学习-opencv

全栈大模型微调框架LLaMA Factory：从预训练到RLHF的高效实现

【NICE一期】张子殷：代码大模型综述

【NICE一期】冯兆鹏：文本表征模型能区分“猫追老鼠”和“老鼠追猫”吗？一项实证研究

大模型时代下非自回归模型的多层次能力提升：媲美自回归模型的探索之路

ChatGPT PLUS快速充值教程，简单一键升级畅用GPT4，保姆级教程。

知识斗地主：解析RAG大模型中复杂的知识冲突

2024逼自己一周学会AI大模型(LLM+RAG系统+GPT-4o+OpenAI)，全程通俗易懂，别再走弯路了，学不会我退出IT界！

【Agent+RAG】10小时博士精讲AI Agent(人工智能体)系列—提示工程、文本大模型、GPT...

【一小时掌握RAG】从0到1搭建一套完整的RAG系统，知识讲解+部署源码+实战项目+代码解析，大模型RAG企业项目实战教程！

【大模型应用框架】LangChain系统教程，从零基础入门到实战！全程干货讲解，通俗易懂！（LLM/大模型/LangChain/RAG）

(超爽中英!) 2024公认最全的【吴恩达大模型LLM】系列教程！附代码_LangChain_微调ChatGPT提示词_RAG模型应用_agent_生成式AI

LLM推理加速新范式！推测解码（Speculative Decoding）最新综述