V
主页
SH-SSS丨跨年龄声纹识别:学习年龄不变的说话人特征 — 覃晓逸
发布人
SH Symposium Series on Speech (SH SSS 2022) ,SH SSS 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台。 来自AI语音技术领域的优秀论文作者、专家学者,用最精炼的表达来解读最新的高质量论文。 近些年说话人识别取得了巨大的发展,但是由于相关数据的缺乏,很少有人关注跨年龄声纹识别。本篇文章基于VoxCeleb数据集挖掘跨年龄测试集并提出一种学习年龄不变的说话人表征(Age-invariant speaker representation, AISR)方法。由于VoxCeleb数据是从YoutuBe平台上采集下来,因此这个数据天然的就是跨年龄数据的场景。然而数据集提供的原始信息并不包含说话人的年龄信息。因此,我们采用一种人脸估计年龄的方法,通过识别视频数据来预测估计每个音频段的说话人年龄。由此,我们构建了基于VoxCeleb的跨年龄测试集(Vox-CA),其中正样本对有意选择较大年龄跨度的数据。此外,在选择负样本对时参照Vox-H集,考虑国籍和性别的影响。经过测试发现,基线系统性能从Vox-H集上的1.939%EER下降到Vox-CA20集的10.419%,这一结果表明跨年龄场景的困难程度。因此,我们提出了一种年龄解耦对抗学习(ADAL)方法,以缓解年龄差距的负面影响,减少类内方差。我们的方法在Vox-CA20测试集上的相关EER降低超过10%,优于基线系统。相关资源已经在Github上开源。
打开封面
下载高清视频
观看高清视频
视频下载器
SH-SSS丨从人设到音色——基于说话人属性特征的语音合成 — 杨智涵
SH-SSS丨面向有声读物的跨说话人语音风格迁移 — 李翔
SH-SSS丨CUSIDE:分块、模拟未来、解码的流式语音识别新框架 — 安柯宇
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-测试集构造01
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-背景及意义-02
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-测试集构造02
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-实验结果
SH-SSS丨JSA-TOD:一种新型半监督对话系统,20%标注即接近全监督效果 — 蔡予诚
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-背景及意义-01
SH-SSS丨ISSD: 基于迭代式语音分离的说话人日志系统 — 牛树同
语音之家公开课 —《ASV-Subtools 声纹识别实战》课程交流
多说话人交互场景中的目标说话人提取
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-讨论与结果
【语音识别】声学特征提取
【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍
说话人识别模型的可解释性-王东
语音之家公开课 — 语音分离的神经网络方法 Speech Separation with Neural Network(邹月娴)
【秒懂】语音识别是什么
鲁棒说话人识别高级池化方法-MAK Man-Wai
【语音之家】AI技术沙龙—语音增强
家居场景下音视频说话人日志和语音识别评测介绍(MISP 2022)-杜俊
基于伪孪生网络的音色保留的说话人识别黑盒对抗攻击
语音之家公开课 —《语音识别服务实战》交流
【实操】通过NVIDIA NEMO 训练语音AI模型(上)
CCF语音对话与听觉专委会2021学术年会
语音之家公开课 —《WeNet语音识别实战》课程交流
【语音之家】AI技术沙龙- -说话人日志
【语音之家】AI技术沙龙-声纹识别
鲁棒说话人识别中的深度伪造与迁移学习-谢磊
2021 SpeechHome 语音技术研讨会
【语音之家】AI产业沙龙— 网易语音AI技术:从内容安全到内容品质
【语音之家】AI产业沙龙——站在未来思考下一代人工智能基础框架
用于大规模说话人验证的动态全连接层
基于语音识别预训练的说话人识别方法
【语音之家】AI产业沙龙—智能语音技术在智能客服的落地实践
【语音之家】AI产业沙龙—视频译制场景中的语音翻译、语音合成和唇形生成技术
语音之家公开课 — 交流语音合成中的情感强度建模研究(刘瑞)
【语音之家】走进企业系列沙龙-语音技术在58同城的应用
语音之家公开课 —《Kaldi语音识别理论与实践》课程交流
基于共振峰和基频缩放的可区分说话人匿名化