V
主页
京东 11.11 红包
论文分享 | NeurIPS-22 | Diffusion-LM:用于提升可控生成的扩散语言模型
发布人
论文名称:Diffusion-LM Improves Controllable Text Generation 论文链接:https://arxiv.org/abs/2205.14217 可控性是自然语言生成中一项重要的能力。当前的可控方法在一些简单的控制任务取得了不错的表现,但是无法处理条件复杂的控制生成任务。在这篇文章中,作者提出将扩散模型应用到可控生成任务中来,通过从一系列高斯噪声向量中逐渐去噪,从而产生句子的表示向量,并解码为真实的文本。扩散模型的连续且多层的性质使其可以执行简单的梯度下降的优化方式,因此可以处理复杂的控制场景。作者在六种细粒度的控制任务上进行了实验,结果表明,扩散语言模型大幅度超越了现有的工作。
打开封面
下载高清视频
观看高清视频
视频下载器
论文分享 | ACL-20 | CasRel:解决关系重叠问题,大幅提升SOTA分数
Diffusion model (4) 概述:另一种形式下VDM的推导
Diffusion model (5) 概述:Score based Model
论文分享 | ACL-22 | PELT:一个简单而有效的用于预训练语言模型的可插拔实体查询表
论文分享 | arXiv-22 | Tailor:基于prompt的多属性可控文本生成方法
Diffusion model (6) 概述:VDM视角下的score base model
Qwen大模型本地部署教程!教你本地微调一个法律大模型,无需GPU,只要5G内存!附安装包和微调文档!
Diffusion model (3) 概述:VDM相关公式推导
Diffusion model (1) 概述:从VAE谈起
论文分享 | ICLR21 | CoCon:文本内容控制的自监督可控文本生成
论文分享|ArXiv-23|一滴墨水引发百万思考:大语言模型中错误信息的传播
论文分享 | Arxiv-23 | LLaMA:开放高效的基础语言模型
论文分享 | arXiv-22 | 怎样打破文本生成中的循环
论文分享|ArXiv-23|BLIP-2:基于冻结的视觉模型和大规模语言模型进行视觉-语言预训练
论文分享 | ACL-22 | 基于动态自注意力内容规划的长文本生成
【AI知识分享】扩散模型入门学习看这一个系列的视频就够了!EDM论文讲解之扩散模型通用框架超详细解读第六回:通用随机微分方程,如懂可不行,要真懂!
揣摩工作 | NeurIPS-21 | 提升模型去偏性能,教你一招超简单的方法
论文分享 | NeurIPS21 | BEIR: 用于检测检索模型零样本学习能力的基准
论文分享 | NeurIPS21 | 多约束条件下基于连续优化的可控文本生成
在科研过程中,把相关论文都仔细研究了很多遍,还是没有具体思路怎么办?
论文分享 | SIGIR21 | 面向跨模态检索的动态交互建模
论文分享 | NeurIPS-21 | 对抗性GLUE:一种用于语言模型鲁棒性评估的多任务基准测试
【睡前小分享】扩散模型流匹配(Flow Matching)真实面目揭秘
论文分享 | ACL-20 | 学习为低资源场景下的对话生成任务定制模型结构
论文分享 | CVPR-22 | 动态梯度调整的多模态平衡学习
论文分享 | ACL-22 | 好的组合是成功的一半!用于多样化条件文本生成的组合采样
论文分享 | ACL-22 | 用于开放域稠密向量检索的文档多角度表示学习
论文分享 | ACL-22 | 模型自动生成的数据增强方法
论文分享 | ACL-22 | Prompt可以探测预训练的语言模型吗?从因果关系看隐形风险
论文分享 | NeurIPS-21 | ALBEF: 先对齐再融合:利用动量蒸馏学习图文表示
论文分享 | CVPR21 | 反事实 VQA——如何用因果推断的方法消除视觉问答中的语言偏差
论文分享 | ACL-22 | 感知世界:用于文本游戏的问题引导的强化学习
论文分享|ArXiv-23|通过多智能体辩论鼓励大型语言模型中的发散思维
Diffusion Model(扩散模型)!2024年公认最通俗易懂的扩散模型来了!3小时入门到精通!建议收藏!(人工智能/深度学习/机器学习/神经网络/AI)
Diffusion model (2) 概述:从VAE出发推导VDM
论文分享 | ACL-22 | Mix&Match:使用能量语言模型的无需训练的可控文本生成方法
论文分享 | ICLR-22 | 通过随机过程进行语言建模
论文分享 | NAACL-22 | 在文本中忠实的更新知识:一个新的文本更新任务
论文分享 | ACL-21 | 通过生成性证据融合和往返预测回答模糊问题
论文分享 | ACL-22 | 使用对比前缀的可控文本生成模型