V
主页
EMNLP 2023杰出论文奖-保持知识不变性:反思开放信息抽取的鲁棒性验证
发布人
讲者及报告简介: 齐济:清华大学计算机科学与技术系,知识工程实验室(KEG)博士四年级研究生,导师为许斌研究员、李涓子教授。主要研究方向为信息抽取和视觉语言理解,曾在CIKM、EMNLP等学术会议上发表论文。目前的研究兴趣为多模态视觉语言模型训练。 报告题目:《保持知识不变性:反思开放信息抽取的鲁棒性验证》 Preserving Knowledge Invariance: Rethinking Robustness Evaluation of Open Information Extraction 论文聚焦开放信息抽取模型在现实世界场景下的准确性和鲁棒性,首次提出了一个模拟现实世界场景鲁棒性验证的开放信息抽取评测基准,在该基准中具有相同知识含义的句子可能在句法和表述上发生迁移。 论文提出了一种新的样本数据结构——知识不变团 (Knowledge-Invariant Clique),由知识含义相同但句法和表述形式均出现迁移的多个句子组成;设计并标注了一个大规模的试验平台以及一个鲁棒性指标的计算方法,只有当一个模型在知识不变团内全部样本上均准确时才能被判定为鲁棒。通过对过去十年开放信息抽取的典型模型以及一个具有代表性的大语言模型进行实验,结果表明论文所提出的基准能够有效验证开放信息抽取模型在现实世界场景下的准确性和鲁棒性。 该论文相关的数据、算法、标注指南和分析工具均已开源。
打开封面
下载高清视频
观看高清视频
视频下载器
【ICLR杰出论文荣誉提名奖】元持续学习:基于二阶优化信息视角的理解与探索
【喂饭教程】ollama+FastGPT快速搭建本地知识库,免费、无限制、保护隐私、无需网络~小白入门必看的保姆级教程!
AgentReview: 利用 LLM Agents 探究同行评审机制 |EMNLP oral 靳轶乔
NAACL 2024杰出论文奖:解锁大语言模型中自发涌现的模块性
ACL'24杰出论文|LM-Steer: 词向量是语言模型的方向盘
GLM大模型技术前沿与应用探索 世界人工智能大会2023
导师推荐的数据库!4个神级代码复现网站,里面99%的论文都能找到!
【AAAI 2023杰出论文】DropMessage:图神经网络随机删减方法的归并统一
ACL 2023 自然语言处理顶会-大模型专题:MVP、超关系知识图谱、CFSum、大模型文本生成等
[NAACL杰出论文奖]LM-Infinite: 大语言模型的零样本极限长度推广
EMNLP 2024预讲会|10月19日上午场 自然语言处理应用等方向
【微调实战】30分钟学会微调大模型,通义千问1.8B大模型微调从0到1,实现天气预报功能,进行结构化信息提取
大模型RAG企业项目实战:手把手带你基于Langchain搭建一套完整的RAG系统,原理讲解+代码解析,看完就能跑通!LLM大模型_RAG_大模型微调_多模态
【2024最新】轻松掌握提示词工程Prompt Engineering,超简单详细,包教会的!!!
以语言为核心多模态大模型探索-户保田老师|EMNLP 2024预讲会特邀报告
【LLM前沿】6小时精讲四大多模态大模型CLIP BLIP VIT MLLM及对话机器人办公助手!绝对的通俗易懂的大模型应用教程!
ChatGLM大模型应用构建——解决方案技术总监手把手教你如何结合大模型设计产品
大模型智能体驱动的社会行为模拟-魏忠钰老师|EMNLP 2024预讲会特邀报告
NeurIPS'24预讲会|AI 4 Sceience 6篇工作:全局优化控制、自动化细胞分类、3D半监督对比学习等
GPT-o2推理超神,GPT-o1为何被 “冷落”? 大模型训练
ChatGLM: 智能体时代下的长文本模型探索【ChatGLM干货技术分享】
【大模型面试】Flash Attention面试连环炮,淘汰80%面试竞争者
(超爽中英!) 2024公认最好的【Agent智能体】系列教程!带你从0到1构建自己的智能体!
“会说话”的推荐系统大模型|EMNLP 2024 港大马琦尧
你的知识库的准确率为什么低于95%?
CodeGeeX:更强大的代码大模型与项目级编程助手
直接带你把Transformer手搓一遍,这次总能学会Transformer了吧!
【2024最新版】Agent企业级项目实战:从零到一搭建AI智能客服系统,理论讲解+实战演练!!!AI大模型|知识库|智能体
大模型知识机理与编辑
KDD CUP 2024开放学术图谱挑战赛赛题解析
AI时代我们该如何学习
研究生基本代码复现基本功!3分钟教会你如何跑通官方模型代码,再替换为自己的数据集跑通!人工智能|计算机技术|github
温和的走进深度学习(下)
从指令微调到数学推理能力,探索大模型潜力-来自清华、上交大、USC、UCB、达摩院的五位一作
6篇NeurIPS'24|浙江大学软件学院专场
ACL 2023—大模型的安全与可靠性、复杂逻辑查询、情感分析等
ChatGLM大模型应用构建和指令工程
ECCV24 10篇工作|3D视觉理解、雨滴消除、快速生成、模型蒸馏等
孙爱欣教授: 推荐系统研究现状的理解|AI 2000学者专场
MiniLLM、RAM、MERT等大模型前沿分享-来自清华、复旦、曼彻斯特的三位大模型论文一作