V
主页
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征
发布人
近些年说话人识别取得了巨大的发展,但是由于相关数据的缺乏,很少有人关注跨年龄声纹识别。本篇文章基于VoxCeleb数据集挖掘跨年龄测试集并提出一种学习年龄不变的说话人表征(Age-invariant speaker representation, AISR)方法。由于VoxCeleb数据是从YouTube平台上采集下来,因此这个数据天然的就是跨年龄数据的场景。然而数据集提供的原始信息并不包含说话人的年龄信息。因此,我们采用一种人脸估计年龄的方法,通过识别视频数据来预测估计每个音频段的说话人年龄。由此,我们构建了基于VoxCeleb的跨年龄测试集(Vox-CA),其中正样本对有意选择较大年龄跨度的数据。
打开封面
下载高清视频
观看高清视频
视频下载器
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-测试集构造02
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-实验结果
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-讨论与结果
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-测试集构造01
SH-SSS丨跨年龄声纹识别:学习年龄不变的说话人特征 — 覃晓逸
基于语音预训练模型的无监督说话人识别方法-李琳
2022年声纹识别研究与应用学术研讨会
【声纹识别入门】远场说话人识别
鲁棒说话人识别高级池化方法-MAK Man-Wai
【声纹识别】什么是声纹识别?声纹识别发展历程怎样?
基于多通道时空特征和知识蒸馏的鲁棒目标说话人提取研究
面向复杂场景的高可靠性声纹识别及其关联任务研究!-06
在说话人验证中识别基于语音转换欺诈攻击的源说话人
通过扬声器提示调优和适配器表示的双参数高效微调【香港理工大学】
感知难度的说话人识别数据增强
深伪音频鉴别研究进展
基于元学习的声纹识别研究进展-王龙标
说话人分割聚类研究进展与展望
基于伪孪生网络的音色保留的说话人识别黑盒对抗攻击
Xi-vector嵌入空间中的说话人识别与表征
对抗噪声标签的鲁棒说话人识别
1MB内存下移动说话人验证系统的极低比特量化
声纹识别可视化研究分析
【课程推荐】声纹识别与音频处理-王泉
SH-SSS丨面向有声读物的跨说话人语音风格迁移 — 李翔
具有目标说话人吸引子的端到端神经说话人分类的基于注意力的编解码器网络
上新了 语音之家 | 声纹识别与音频处理实战课—王泉
【声纹识别入门】ASV-Subtools工具runtime实现-frontend
中文连续视觉语音识别挑战赛
基于噪声解耦度量学习的鲁棒声纹识别
【实操】通过NVIDIA NEMO 训练语音AI模型(上)
用于语音情感识别的多尺度时空Transformer模型
AI语音面试常见问题:端到端模型与传统模型的区别
面向复杂场景的说话人日志
HI-MIA 唤醒词识别实战终于上线啦|玩转HI-MIA数据库,轻松实现语音唤醒的训练与推理,掌握语音唤醒工程实战能力
厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-开源工具
超划算的语音课程,确定不来了解下?
超全超简单!一口气刷完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM、DBN等八大深度学习神经网络算法!真的比刷剧还爽!
【语音之家】AI技术沙龙-声纹识别
基于自监督学习前端特征的通用歌唱语音语种识别方法