V
主页
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-讨论与结果
发布人
近些年说话人识别取得了巨大的发展,但是由于相关数据的缺乏,很少有人关注跨年龄声纹识别。本篇文章基于VoxCeleb数据集挖掘跨年龄测试集并提出一种学习年龄不变的说话人表征(Age-invariant speaker representation, AISR)方法。由于VoxCeleb数据是从YouTube平台上采集下来,因此这个数据天然的就是跨年龄数据的场景。然而数据集提供的原始信息并不包含说话人的年龄信息。因此,我们采用一种人脸估计年龄的方法,通过识别视频数据来预测估计每个音频段的说话人年龄。由此,我们构建了基于VoxCeleb的跨年龄测试集(Vox-CA),其中正样本对有意选择较大年龄跨度的数据。
打开封面
下载高清视频
观看高清视频
视频下载器
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-实验结果
SH-SSS丨跨年龄声纹识别:学习年龄不变的说话人特征 — 覃晓逸
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-测试集构造01
【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍
基于语音识别预训练的说话人识别方法
【声纹识别入门】远场说话人识别
面向复杂场景的高可靠性声纹识别及其关联任务研究!-02
基于自监督学习的高性能鲁棒说话人识别-钱彦旻
面向复杂场景的高可靠性声纹识别及其关联任务研究!-05
基于元学习的声纹识别研究进展-王龙标
面向复杂场景的高可靠性声纹识别及其关联任务研究!-06
【声纹识别入门】ASV-Subtools工具环境配置
基于角空间中类感知注意机制对比学习的区分性说话人表征
基于伪孪生网络的音色保留的说话人识别黑盒对抗攻击
深伪音频鉴别研究进展
鲁棒说话人识别高级池化方法-MAK Man-Wai
基于共振峰和基频缩放的可区分说话人匿名化
面向复杂场景的高可靠性声纹识别及其关联任务研究!-01
【唤醒词识别】特征提取
通过扬声器提示调优和适配器表示的双参数高效微调【香港理工大学】
基于噪声解耦度量学习的鲁棒声纹识别
HI-MIA 唤醒词识别实战终于上线啦|玩转HI-MIA数据库,轻松实现语音唤醒的训练与推理,掌握语音唤醒工程实战能力
标签噪声干扰下的说话人识别关键技术研究
【实操】通过NVIDIA NEMO 训练语音AI模型(上)
厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-前沿技术02
面向复杂场景的高可靠性声纹识别及其关联任务研究!-07
【声纹识别入门】声纹识别系统的评价指标-基于语音对的实现方法
基于自监督学习表示的具有持久性口音记忆的口音识别
对抗噪声标签的鲁棒说话人识别
1MB内存下移动说话人验证系统的极低比特量化
【声纹识别入门】ASV-Subtools工具 系统框架-关键技术
【声纹识别入门】损失函数的设计方法
2022年声纹识别研究与应用学术研讨会
手把手教你分析识别!和田玉且末料,青海料,俄料身份特征!
具有目标说话人吸引子的端到端神经说话人分类的基于注意力的编解码器网络
【ICASSP】超短注册时间的目标说话人提取模型
说话人分割聚类研究进展与展望
适应多语言ASR模型,以处理多个说话人
【声纹识别入门】ASV-Subtools工具 损失函数
【声纹识别入门】数据增强(wav层面)