论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-背景及意义-01

发布人

近些年说话人识别取得了巨大的发展，但是由于相关数据的缺乏，很少有人关注跨年龄声纹识别。本篇文章基于VoxCeleb数据集挖掘跨年龄测试集并提出一种学习年龄不变的说话人表征(Age-invariant speaker representation, AISR)方法。由于VoxCeleb数据是从YouTube平台上采集下来，因此这个数据天然的就是跨年龄数据的场景。然而数据集提供的原始信息并不包含说话人的年龄信息。因此，我们采用一种人脸估计年龄的方法，通过识别视频数据来预测估计每个音频段的说话人年龄。由此，我们构建了基于VoxCeleb的跨年龄测试集（Vox-CA），其中正样本对有意选择较大年龄跨度的数据。此外，在选择负样本对时参照Vox-H集，考虑国籍和性别的影响。经过测试发现，基线系统性能从Vox-H集上的1.939%EER下降到Vox-CA20集的10.419%，这一结果表明跨年龄场景的困难程度。因此，我们提出了一种年龄解耦对抗学习（ADAL）方法，以缓解年龄差距的负面影响，减少类内方差。我们的方法在Vox-CA20测试集上的相关EER降低超过10%，优于基线系统。相关资源已经在Github上开源。

打开封面下载高清视频观看高清视频视频下载器

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-背景及意义-01

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-实验结果

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征

SH-SSS丨跨年龄声纹识别：学习年龄不变的说话人特征 — 覃晓逸

基于语音识别预训练的说话人识别方法

面向复杂场景的高可靠性声纹识别及其关联任务研究！-02

面向复杂场景的高可靠性声纹识别及其关联任务研究！-05

厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-前沿技术01

【声纹识别入门】远场说话人识别

2021年声纹识别研究与应用学术研讨会

说话人分割聚类研究进展与展望

感知难度的说话人识别数据增强

对抗噪声标签的鲁棒说话人识别

厦门大学教授洪青阳老师带你学习声纹识别研究现状和开源工具

基于伪孪生网络的音色保留的说话人识别黑盒对抗攻击

基于元学习的声纹识别研究进展-王龙标

鲁棒说话人识别高级池化方法-MAK Man-Wai

基于预训练的伪造语音检测研究进展-张鹏远

论文解读丨CUSIDE：分块、模拟未来、解码的流式语音识别新框架 -方法介绍

鲁棒说话人识别中的深度伪造与迁移学习-谢磊

2022年声纹识别研究与应用学术研讨会

在说话人验证中识别基于语音转换欺诈攻击的源说话人

如何工程化一个语音开源项目： 手把手带你实现开源声纹分割聚类项目 pyannote-audio 的工程化

1周年撞上618！价格真的很划算！

论文解读丨CUSIDE：分块、模拟未来、解码的流式语音识别新框架 -结论

【声纹识别入门】ASV-Subtools工具环境配置

HI-MIA 唤醒词识别实战终于上线啦|玩转HI-MIA数据库，轻松实现语音唤醒的训练与推理，掌握语音唤醒工程实战能力

通过扬声器提示调优和适配器表示的双参数高效微调【香港理工大学】

超划算的语音课程，确定不来了解下？

声纹识别与语音防伪技术前沿及工作进展

厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-开源工具

声纹识别工具ASV-Subtools-江涛

基于深度聚类和图网络的声纹识别-何亮、许敏强

厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-厦大团队研究进展

基于音频辨别的对比学习在连续语音中的可定制关键词检测

【声纹识别入门】声纹识别系统的评价指标-基于语音对的实现方法

基于角空间中类感知注意机制对比学习的区分性说话人表征

VoxBlink:短视频上的大规模说话人验证数据集

【声纹识别入门】ASV-Subtools工具runtime实现-frontend

【声纹识别入门】数据准备

基于多目标渐进聚类的半监督说话人识别域自适应

如何工程化一个语音开源项目：手把手带你实现开源声纹分割聚类项目 pyannote-audio 的工程化