V
主页
大语言模型编辑中的崩溃研究
发布人
主题 大语言模型编辑中的崩溃研究 分享内容 论文1:The Butterfly Effect of Model Editing: Few Edits Can Trigger Large Language Models Collapse 链接:https://aclanthology.org/2024.findings-acl.322.pdf 论文2:The Fall of ROME: Understanding the Collapse of LLMs in Model Editing 链接:https://aclanthology.org/2024.findings-emnlp.236.pdf代码:https://github.com/WLYangICT/Collapse-in-Model-Editing 项目主页:https://yangwl.site/collapse-in-model-editing 引言 模型编辑(Model Editing)技术在修正大语言模型的知识中展现出极大的潜力。然而,现有工作却忽视了它对语言模型固有能力的影响。我们深入研究了这一问题,并产出了两篇论文。第一篇论文揭示了少量编辑即可能导致语言模型崩溃的现象,并提出采用困惑度(Perplexity)作为诊断工具。该工作已被ACL2024 Findings收录。第二篇论文探讨了由最先进的编辑方法ROME触发的语言模型崩溃的根本原因,并提出了一个简单有效的解决方案。该工作已被EMNLP2024 Findings收录。 嘉宾 杨万里,本科毕业于南开大学,现为中国科学院计算技术研究所一年级博士生,由刘欣然教授和孙飞副研究员共同指导。研究兴趣包括:自然语言处理,知识编辑,可信AI等。在ACL和EMNLP上发表论文3篇,其中2篇作为第一作者发表。个人主页:https://yangwl.site 主持人 华文越 UCSB博后
打开封面
下载高清视频
观看高清视频
视频下载器
EMNLP2024分享会之Agent主题
EMNLP2024分享会之多模态主题
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)通俗易懂,学完即就业!拿走不谢,学不会我退出IT圈!!!
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
从零开始训练大模型
迈向可信的AI:探索安全、负责的大语言模型
蛋白质交流的艺术:ProLLM用'思维链'重新定义蛋白质相互作用预测!
EMNLP2024分享会之模型编辑主题
当心环境内容的干扰:大模型GUI智能体的忠实度研究
脆弱的不确定性:大模型的可信度如何被操控
bitnet.cpp 推理,速度超越 llama.cpp,内存最高降低 16 倍 | 附 BitNet b1.58 模型安装演示
EMNLP2024分享会之模型对齐主题
这可能是B站讲的最好的AI大模型教程,一周吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI) 让你少走99%弯路!(2024最新版)
如何训练你自己的o1模型?TPO??
2025版AI大模型全套视频 (LLM+RAG系统+GPT-4o+OpenAI)这绝对是ai大模型教程天花板!
30分钟学会Qwen2.5-3B本地部署LightRAG,完胜GraphRAG!从模型部署到源码解读,带你全流程解析,速度快,效果好,落地部署更方便!!!
【NICE一期】周厚全:大模型会句法吗?
【精华35分钟】这应该是全网AI Agent讲解得最透彻的教程了,从什么是Agent到创建自己的Agent智能体!一次搞懂!大模型/LLM
自然语言处理BERT模型实战教程:基于BERT模型的文本分类、感分析及中文命名实体识别实战教程!真的通俗易懂!(人工智能、深度学习、机器学习、机器学习算法)
【AI项目实战】全网最适合新手入门的【RAG医疗问答系统】教程:如何搭建一个基于RAG的医疗问答系统,我竟30分钟就搞懂了?
在上下文学习中,语言模型究竟学到了什么? 探索结构化任务假说
“显微镜”下的RAG:通过 RAGChecker 进行细粒度诊断评估
Transformer模型能否进行隐式的推理?一个关于Grokking和泛化的深入探索
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI),3天学完,让你少走99%弯路!
大模型事实性综述
【Coze教程】这可能是全网最系统的Coze入门教程了!手把手教你用Coze手搓Agent智能体到搭建Coze工作流,入门到精通!
【大模型面试】Flash Attention面试连环炮,淘汰80%面试竞争者
【零基础学AI】清华大佬200集讲完的AI人工智能从入门到精通全套教程,全程干货无废话!看完绝对让你少走弯路!研一研零必看!机器学习-深度学习-opencv
全栈大模型微调框架LLaMA Factory:从预训练到RLHF的高效实现
【NICE一期】张子殷:代码大模型综述
【NICE一期】冯兆鹏:文本表征模型能区分“猫追老鼠”和“老鼠追猫”吗?一项实证研究
大模型时代下非自回归模型的多层次能力提升:媲美自回归模型的探索之路
ChatGPT PLUS快速充值教程,简单一键升级畅用GPT4,保姆级教程。
知识斗地主:解析RAG大模型中复杂的知识冲突
2024逼自己一周学会AI大模型(LLM+RAG系统+GPT-4o+OpenAI),全程通俗易懂,别再走弯路了,学不会我退出IT界!
【Agent+RAG】10小时博士精讲AI Agent(人工智能体)系列—提示工程、文本大模型、GPT...
【一小时掌握RAG】从0到1搭建一套完整的RAG系统,知识讲解+部署源码+实战项目+代码解析,大模型RAG企业项目实战教程!
【大模型应用框架】LangChain系统教程,从零基础入门到实战!全程干货讲解,通俗易懂!(LLM/大模型/LangChain/RAG)
(超爽中英!) 2024公认最全的【吴恩达大模型LLM】系列教程!附代码_LangChain_微调ChatGPT提示词_RAG模型应用_agent_生成式AI
LLM推理加速新范式!推测解码(Speculative Decoding)最新综述