V
主页
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-测试集构造01
发布人
近些年说话人识别取得了巨大的发展,但是由于相关数据的缺乏,很少有人关注跨年龄声纹识别。本篇文章基于VoxCeleb数据集挖掘跨年龄测试集并提出一种学习年龄不变的说话人表征(Age-invariant speaker representation, AISR)方法。由于VoxCeleb数据是从YouTube平台上采集下来,因此这个数据天然的就是跨年龄数据的场景。然而数据集提供的原始信息并不包含说话人的年龄信息。因此,我们采用一种人脸估计年龄的方法,通过识别视频数据来预测估计每个音频段的说话人年龄。由此,我们构建了基于VoxCeleb的跨年龄测试集(Vox-CA),其中正样本对有意选择较大年龄跨度的数据。
打开封面
下载高清视频
观看高清视频
视频下载器
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-背景及意义-01
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-背景及意义-02
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-测试集构造02
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-实验结果
多说话人交互场景中的目标说话人提取
【清华】从0开始学Kaldi,丝滑入门语音识别,语音识别原来如此简单
【声纹识别入门】远场说话人识别
基于多通道时空特征和知识蒸馏的鲁棒目标说话人提取研究
基于语音预训练模型的无监督说话人识别方法-李琳
说话人识别中的Hard Trials初步探索
基于伪孪生网络的音色保留的说话人识别黑盒对抗攻击
鲁棒说话人识别高级池化方法-MAK Man-Wai
Xi-vector嵌入空间中的说话人识别与表征
面向复杂场景的高可靠性声纹识别及其关联任务研究!-05
基于自监督学习的高性能鲁棒说话人识别-钱彦旻
感知难度的说话人识别数据增强
面向复杂场景的高可靠性声纹识别及其关联任务研究!-03
标签噪声干扰下的说话人识别关键技术研究
面向文本无关说话人识别的跨模态视听协同学习
【声纹识别入门】ASV-Subtools工具环境配置
厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-前沿技术01
通过扬声器提示调优和适配器表示的双参数高效微调【香港理工大学】
说话人分割聚类研究进展与展望
2022年声纹识别研究与应用学术研讨会
家居场景下音视频说话人日志和语音识别评测介绍(MISP 2022)-杜俊
基于多目标渐进聚类的半监督说话人识别域自适应
基于预训练的伪造语音检测研究进展-张鹏远
声纹识别可视化研究分析
1周年撞上618!价格真的很划算!
基于共振峰和基频缩放的可区分说话人匿名化
声纹识别中的鲁棒性学习方法研究
在说话人验证中识别基于语音转换欺诈攻击的源说话人
【ICML 2024】一作论文解读!——《On the Nonlinearity of Layer Normalization》
老实人真的什么都好、除了性缩力比较强、除了女生不喜欢
少走99%的弯路!0基础快速入门语音识别
用于大规模说话人验证的动态全连接层
1MB内存下移动说话人验证系统的极低比特量化
【三维重建】IROS 2024论文解读MonoPlane单目几何知识引导的可泛化三维平面重建
面向复杂场景的说话人日志
AI语音面试常见问题:端到端模型与传统模型的区别