论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-测试集构造01 - 视频下载 Video Downloader

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-测试集构造01

发布人

近些年说话人识别取得了巨大的发展，但是由于相关数据的缺乏，很少有人关注跨年龄声纹识别。本篇文章基于VoxCeleb数据集挖掘跨年龄测试集并提出一种学习年龄不变的说话人表征(Age-invariant speaker representation, AISR)方法。由于VoxCeleb数据是从YouTube平台上采集下来，因此这个数据天然的就是跨年龄数据的场景。然而数据集提供的原始信息并不包含说话人的年龄信息。因此，我们采用一种人脸估计年龄的方法，通过识别视频数据来预测估计每个音频段的说话人年龄。由此，我们构建了基于VoxCeleb的跨年龄测试集（Vox-CA），其中正样本对有意选择较大年龄跨度的数据。

打开封面下载高清视频观看高清视频视频下载器

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-背景及意义-01

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-背景及意义-02

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-测试集构造02

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-实验结果

多说话人交互场景中的目标说话人提取

【清华】从0开始学Kaldi，丝滑入门语音识别，语音识别原来如此简单

【声纹识别入门】远场说话人识别

基于多通道时空特征和知识蒸馏的鲁棒目标说话人提取研究

基于语音预训练模型的无监督说话人识别方法-李琳

说话人识别中的Hard Trials初步探索

基于伪孪生网络的音色保留的说话人识别黑盒对抗攻击

鲁棒说话人识别高级池化方法-MAK Man-Wai

Xi-vector嵌入空间中的说话人识别与表征

面向复杂场景的高可靠性声纹识别及其关联任务研究！-05

基于自监督学习的高性能鲁棒说话人识别-钱彦旻

感知难度的说话人识别数据增强

面向复杂场景的高可靠性声纹识别及其关联任务研究！-03

标签噪声干扰下的说话人识别关键技术研究

面向文本无关说话人识别的跨模态视听协同学习

【声纹识别入门】ASV-Subtools工具环境配置

厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-前沿技术01

通过扬声器提示调优和适配器表示的双参数高效微调【香港理工大学】

说话人分割聚类研究进展与展望

2022年声纹识别研究与应用学术研讨会

家居场景下音视频说话人日志和语音识别评测介绍（MISP 2022）-杜俊

基于多目标渐进聚类的半监督说话人识别域自适应

基于预训练的伪造语音检测研究进展-张鹏远

声纹识别可视化研究分析

1周年撞上618！价格真的很划算！

基于共振峰和基频缩放的可区分说话人匿名化

声纹识别中的鲁棒性学习方法研究

在说话人验证中识别基于语音转换欺诈攻击的源说话人

【ICML 2024】一作论文解读！——《On the Nonlinearity of Layer Normalization》

老实人真的什么都好、除了性缩力比较强、除了女生不喜欢

少走99%的弯路！0基础快速入门语音识别

用于大规模说话人验证的动态全连接层

1MB内存下移动说话人验证系统的极低比特量化

【三维重建】IROS 2024论文解读MonoPlane单目几何知识引导的可泛化三维平面重建

面向复杂场景的说话人日志

AI语音面试常见问题：端到端模型与传统模型的区别