V
主页
大语言模型的时间魔法:从共时推理到框架优化
发布人
主题 大语言模型的时间魔法:从共时推理到框架优化 Living in the Moment: Can Large Language Models Grasp Co-Temporal Reasoning? - ACL2024 Timo: Towards Better Temporal Reasoning for Language Models 嘉宾 苏肇辰,苏州大学二年级硕士,目前在上海人工智能实验室实习。以第一作者在ACL、EMNLP等国际会议发表多篇论文,同时担任ACL、MM、NAACL等会议和期刊审稿人。他的研究方向主要解决语言模型时间相关的问题,涵盖了模型的时间适应与泛化、时间知识动态对模型的影响以及大语言模型的时间推理能力的提升,个人主页:https://zhaochen0110.github.io 主持人 薛博阳 香港中文大学 内容 时间推理简要介绍和相关工作 大模型能否理解共时推理? 统一框架的时间推理框架探索 总结与展望 Q&A 引言 时间推理在语言模型的能力中扮演着至关重要的角色。无论是对事件顺序的理解,还是对时间间隔的计算,时间推理都在我们日常生活和各种复杂任务中发挥着重要作用。然而,当前的语言模型在处理时间推理任务时仍然面临许多挑战。本次汇报的目标是探讨语言模型在共时推理和统一框架下提升时间推理能力的研究进展。我们将重点介绍我们近期两篇研究工作:一篇探究语言模型的共时推理能力,另一篇提出了一个通用框架以提升时间推理能力。通过对这两篇研究的介绍,我们希望能为未来的时间推理研究提供新的视角和方法。
打开封面
下载高清视频
观看高清视频
视频下载器
从零开始训练大模型
EMNLP2024分享会之Agent主题
语言模型如何确保无害性?通过推理过程中的隐状态解析越狱和安全对齐
迈向可信的AI:探索安全、负责的大语言模型
终于找到最系统的时间序列模型教程了,LSTM时间序列任务项目实战,从入门到精通-让数据预测变得简单!(附课件+源码)
大语言模型编辑中的崩溃研究
LLM推理加速新范式!推测解码(Speculative Decoding)最新综述
知识斗地主:解析RAG大模型中复杂的知识冲突
FacTool: 生成人工智能中的事实检测 - 用于多任务和多领域场景的工具增强框架
Deita: 用高质量数据在微调中“四两拨千斤”
让我们一起构建ChatGPT,用代码,拼出来
比刷剧还爽!学完这50套【机器学习+深度学习+计算机视觉+自然语言处理】实战项目!你的毕业设计基本就不用慌了!(AI人工智能丨CV丨NLP丨数据分析)
EMNLP2024分享会之多模态主题
关于LLaMA & Alpaca 微调、代码生成、RAM配置等,更多你的疑问都在这里
大语言模型的知识编辑:问题,方法与挑战
【NICE一期】张子殷:代码大模型综述
大语言模型多选题评估的偏见与鲁棒性
RNN卷土重来:基于门控记忆槽的线性注意力机制
【2024年11月最新chatgpt】无需翻墙,无需账号,直接使用chatgpt4.0!
生成式搜索引擎能否取代检索技术?
EMNLP2024分享会之可解释性、资源与评估
EMNLP2024分享会之模型对齐主题
Transformer本质上在解决什么事?迪哥手把手带你从零基础开始搭建Transformer!论文解读+源码复现,草履虫都能学会!-人工智能/深度学习/大模型
全栈大模型微调框架LLaMA Factory:从预训练到RLHF的高效实现
EMNLP2024分享会之模型/推理加速主题
什么是扩散模型?
为什么神经网络可以学习几乎任何东西?
【李宏毅】浅谈图像生成模型 Diffusion Model 原理
如何加速大语言模型推理?万字长文综述大语言模型高效推理技术
【NICE一期】周厚全:大模型会句法吗?
国内最新免费ChatGPT4.0免费使用教程,打工人和学生党的最爱!
在上下文学习中,语言模型究竟学到了什么? 探索结构化任务假说
还是太全面了!NLP十天起飞,一口气学完文本分类、文本摘要、机器翻译、知识图谱、情感分析等十大技术点!算法原理+论文解读,草履虫都能学会!大模型|机器学习
评估中文大模型中的幻觉
Transformer模型能否进行隐式的推理?一个关于Grokking和泛化的深入探索
LLaMA-MoE:基于参数复用的混合专家模型构建方法探索
EMNLP2024分享会之模型安全主题
【从零开始打造专属大模型】60小时自学大模型原理基础到实战!提示工程、 LangChain、NLP、神经网络、数据预处理、LLM生成模型
冷暖LLM知?大语言模型对物理概念的理解能力探究
氯化钠的提纯(苏州大学)