V
主页
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-测试集构造02
发布人
近些年说话人识别取得了巨大的发展,但是由于相关数据的缺乏,很少有人关注跨年龄声纹识别。本篇文章基于VoxCeleb数据集挖掘跨年龄测试集并提出一种学习年龄不变的说话人表征(Age-invariant speaker representation, AISR)方法。由于VoxCeleb数据是从YouTube平台上采集下来,因此这个数据天然的就是跨年龄数据的场景。然而数据集提供的原始信息并不包含说话人的年龄信息。因此,我们采用一种人脸估计年龄的方法,通过识别视频数据来预测估计每个音频段的说话人年龄。由此,我们构建了基于VoxCeleb的跨年龄测试集(Vox-CA),其中正样本对有意选择较大年龄跨度的数据。
打开封面
下载高清视频
观看高清视频
视频下载器
论文解读丨跨年龄声纹识别:学习年龄不变的说话人特征-实验结果
SH-SSS丨从人设到音色——基于说话人属性特征的语音合成 — 杨智涵
基于语音识别预训练的说话人识别方法
面向复杂场景的高可靠性声纹识别及其关联任务研究!-02
感知难度的说话人识别数据增强
标签噪声干扰下的说话人识别关键技术研究
对抗噪声标签的鲁棒说话人识别
SH-SSS丨端到端音视频说话人日志网络 — 何茂奎
多说话人交互场景中的目标说话人提取
面向复杂场景的高可靠性声纹识别及其关联任务研究!-07
基于自监督学习的高性能鲁棒说话人识别-钱彦旻
面向复杂场景的高可靠性声纹识别及其关联任务研究!-05
SH-SSS丨面向有声读物的跨说话人语音风格迁移 — 李翔
基于多通道时空特征和知识蒸馏的鲁棒目标说话人提取研究
说话人识别中的Hard Trials初步探索
鲁棒说话人识别高级池化方法-MAK Man-Wai
基于角空间中类感知注意机制对比学习的区分性说话人表征
【Wenet语音识别】功能架构和模型结构
实现选择性听觉注意的单耳语音分离和说话人识别的深度学习解决方案-李海洲
基于预训练的伪造语音检测研究进展-张鹏远
用于大规模说话人验证的动态全连接层
基于离散动作表示的说话手势生成
基于共振峰和基频缩放的可区分说话人匿名化
面向复杂场景的高可靠性声纹识别及其关联任务研究!-06
深伪音频鉴别研究进展
【声纹识别入门】ASV-Subtools工具 特征提取
家居场景下音视频说话人日志和语音识别评测介绍(MISP 2022)-杜俊
【声纹识别入门】ASV-Subtools工具 损失函数
具有目标说话人吸引子的端到端神经说话人分类的基于注意力的编解码器网络
【实操】从零搭建声纹识别框架
基于自然语言描述的跨说话人语音风格转换
【唤醒词识别】实战代码讲解
HI-MIA 唤醒词识别实战终于上线啦|玩转HI-MIA数据库,轻松实现语音唤醒的训练与推理,掌握语音唤醒工程实战能力
【课程推荐】ASV-Subtools声纹识别实战 | AVS-Subtoos发布者亲自带您掌握当下最流行声纹识别工具,助力开发者从0到1轻松上手声纹技术!
鲁棒说话人表征技术
在基于多因素约束的低资源语音转换中传递源语音说话风格
厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-前沿技术02
利用基于帧级跨模态注意力的音视频Confomer的鲁棒音视频唤醒词识别
上新了 语音之家 | 声纹识别与音频处理实战课—王泉
厦门大学教授洪青阳老师带你学习声纹识别研究现状和开源工具