SH-SSS丨跨年龄声纹识别：学习年龄不变的说话人特征

SH-SSS丨跨年龄声纹识别：学习年龄不变的说话人特征 — 覃晓逸

发布人

SH Symposium Series on Speech (SH SSS 2022) ，SH SSS 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台。 来自AI语音技术领域的优秀论文作者、专家学者，用最精炼的表达来解读最新的高质量论文。

近些年说话人识别取得了巨大的发展，但是由于相关数据的缺乏，很少有人关注跨年龄声纹识别。本篇文章基于VoxCeleb数据集挖掘跨年龄测试集并提出一种学习年龄不变的说话人表征(Age-invariant speaker representation, AISR)方法。由于VoxCeleb数据是从YoutuBe平台上采集下来，因此这个数据天然的就是跨年龄数据的场景。然而数据集提供的原始信息并不包含说话人的年龄信息。因此，我们采用一种人脸估计年龄的方法，通过识别视频数据来预测估计每个音频段的说话人年龄。由此，我们构建了基于VoxCeleb的跨年龄测试集（Vox-CA），其中正样本对有意选择较大年龄跨度的数据。此外，在选择负样本对时参照Vox-H集，考虑国籍和性别的影响。经过测试发现，基线系统性能从Vox-H集上的1.939%EER下降到Vox-CA20集的10.419%，这一结果表明跨年龄场景的困难程度。因此，我们提出了一种年龄解耦对抗学习（ADAL）方法，以缓解年龄差距的负面影响，减少类内方差。我们的方法在Vox-CA20测试集上的相关EER降低超过10%，优于基线系统。相关资源已经在Github上开源。

打开封面下载高清视频观看高清视频视频下载器

SH-SSS丨跨年龄声纹识别：学习年龄不变的说话人特征 — 覃晓逸

SH-SSS丨从人设到音色——基于说话人属性特征的语音合成 — 杨智涵

SH-SSS丨面向有声读物的跨说话人语音风格迁移 — 李翔

SH-SSS丨CUSIDE：分块、模拟未来、解码的流式语音识别新框架 — 安柯宇

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-测试集构造01

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-背景及意义-02

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-测试集构造02

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-实验结果

SH-SSS丨JSA-TOD：一种新型半监督对话系统，20%标注即接近全监督效果 — 蔡予诚

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-背景及意义-01

SH-SSS丨ISSD: 基于迭代式语音分离的说话人日志系统 — 牛树同

语音之家公开课 —《ASV-Subtools 声纹识别实战》课程交流

多说话人交互场景中的目标说话人提取

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-讨论与结果

【语音识别】声学特征提取

【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍

说话人识别模型的可解释性-王东

语音之家公开课 — 语音分离的神经网络方法 Speech Separation with Neural Network（邹月娴）

【秒懂】语音识别是什么

鲁棒说话人识别高级池化方法-MAK Man-Wai

【语音之家】AI技术沙龙—语音增强

家居场景下音视频说话人日志和语音识别评测介绍（MISP 2022）-杜俊

基于伪孪生网络的音色保留的说话人识别黑盒对抗攻击

语音之家公开课 —《语音识别服务实战》交流

【实操】通过NVIDIA NEMO 训练语音AI模型（上）

CCF语音对话与听觉专委会2021学术年会

语音之家公开课 —《WeNet语音识别实战》课程交流

【语音之家】AI技术沙龙- -说话人日志

【语音之家】AI技术沙龙-声纹识别

鲁棒说话人识别中的深度伪造与迁移学习-谢磊

2021 SpeechHome 语音技术研讨会

【语音之家】AI产业沙龙— 网易语音AI技术：从内容安全到内容品质

【语音之家】AI产业沙龙——站在未来思考下一代人工智能基础框架

用于大规模说话人验证的动态全连接层

基于语音识别预训练的说话人识别方法

【语音之家】AI产业沙龙—智能语音技术在智能客服的落地实践

【语音之家】AI产业沙龙—视频译制场景中的语音翻译、语音合成和唇形生成技术

语音之家公开课 — 交流语音合成中的情感强度建模研究（刘瑞）

【语音之家】走进企业系列沙龙-语音技术在58同城的应用

语音之家公开课 —《Kaldi语音识别理论与实践》课程交流

基于共振峰和基频缩放的可区分说话人匿名化