V
主页
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-背景及意义-01
发布人
近些年说话人识别取得了巨大的发展,但是由于相关数据的缺乏,很少有人关注跨年龄声纹识别。本篇文章基于VoxCeleb数据集挖掘跨年龄测试集并提出一种学习年龄不变的说话人表征(Age-invariant speaker representation, AISR)方法。由于VoxCeleb数据是从YouTube平台上采集下来,因此这个数据天然的就是跨年龄数据的场景。然而数据集提供的原始信息并不包含说话人的年龄信息。因此,我们采用一种人脸估计年龄的方法,通过识别视频数据来预测估计每个音频段的说话人年龄。由此,我们构建了基于VoxCeleb的跨年龄测试集(Vox-CA),其中正样本对有意选择较大年龄跨度的数据。此外,在选择负样本对时参照Vox-H集,考虑国籍和性别的影响。经过测试发现,基线系统性能从Vox-H集上的1.939%EER下降到Vox-CA20集的10.419%,这一结果表明跨年龄场景的困难程度。因此,我们提出了一种年龄解耦对抗学习(ADAL)方法,以缓解年龄差距的负面影响,减少类内方差。我们的方法在Vox-CA20测试集上的相关EER降低超过10%,优于基线系统。相关资源已经在Github上开源。
打开封面
下载高清视频
观看高清视频
视频下载器
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-实验结果
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征
SH-SSS丨跨年龄声纹识别:学习年龄不变的说话人特征 — 覃晓逸
基于语音识别预训练的说话人识别方法
面向复杂场景的高可靠性声纹识别及其关联任务研究!-02
面向复杂场景的高可靠性声纹识别及其关联任务研究!-05
厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-前沿技术01
【声纹识别入门】远场说话人识别
2021年声纹识别研究与应用学术研讨会
说话人分割聚类研究进展与展望
感知难度的说话人识别数据增强
对抗噪声标签的鲁棒说话人识别
厦门大学教授洪青阳老师带你学习声纹识别研究现状和开源工具
基于伪孪生网络的音色保留的说话人识别黑盒对抗攻击
基于元学习的声纹识别研究进展-王龙标
鲁棒说话人识别高级池化方法-MAK Man-Wai
基于预训练的伪造语音检测研究进展-张鹏远
论文解读丨CUSIDE:分块、模拟未来、解码的流式语音识别新框架 -方法介绍
鲁棒说话人识别中的深度伪造与迁移学习-谢磊
2022年声纹识别研究与应用学术研讨会
在说话人验证中识别基于语音转换欺诈攻击的源说话人
如何工程化一个语音开源项目: 手把手带你实现开源声纹分割聚类项目 pyannote-audio 的工程化
1周年撞上618!价格真的很划算!
论文解读丨CUSIDE:分块、模拟未来、解码的流式语音识别新框架 -结论
【声纹识别入门】ASV-Subtools工具环境配置
HI-MIA 唤醒词识别实战终于上线啦|玩转HI-MIA数据库,轻松实现语音唤醒的训练与推理,掌握语音唤醒工程实战能力
通过扬声器提示调优和适配器表示的双参数高效微调【香港理工大学】
超划算的语音课程,确定不来了解下?
声纹识别与语音防伪技术前沿及工作进展
厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-开源工具
声纹识别工具ASV-Subtools-江涛
基于深度聚类和图网络的声纹识别-何亮、许敏强
厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-厦大团队研究进展
基于音频辨别的对比学习在连续语音中的可定制关键词检测
【声纹识别入门】声纹识别系统的评价指标-基于语音对的实现方法
基于角空间中类感知注意机制对比学习的区分性说话人表征
VoxBlink:短视频上的大规模说话人验证数据集
【声纹识别入门】ASV-Subtools工具runtime实现-frontend
【声纹识别入门】数据准备
基于多目标渐进聚类的半监督说话人识别域自适应