面向复杂场景的高可靠性声纹识别及其关联任务研究！-04

发布人

昆山杜克大学电子与计算机工程副教授李明教授，首先描述面向复杂场景的声纹识别这一具有挑战性的任务；其次介绍实验室在远场声纹识别领域的近期研究成果；最后，扩展到多个使用声纹编码的语音关联任务的工作，如特定人唤醒，特定人合成与变声，特定人分离等。

打开封面下载高清视频观看高清视频视频下载器

面向复杂场景的高可靠性声纹识别及其关联任务研究！-05

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-背景及意义-02

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-测试集构造02

【语音识别】声学特征提取

厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-前沿技术01

复杂声学场景下基于复数谱的语音增强和去混技术研究

标签噪声干扰下的说话人识别关键技术研究

鲁棒说话人识别中的深度伪造与迁移学习-谢磊

超划算的语音课程，确定不来了解下？

Sherpa:新一代 Kaldi 部署框架

2021年声纹识别研究与应用学术研讨会

论文解读丨CUSIDE：分块、模拟未来、解码的流式语音识别新框架 -实验设置

少走99%的弯路！0基础快速入门语音识别

面向复杂场景的说话人日志

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征

感知难度的说话人识别数据增强

面向文本无关说话人识别的跨模态视听协同学习

基于多通道时空特征和知识蒸馏的鲁棒目标说话人提取研究

【声纹识别入门】损失函数的设计方法

【清华】从0开始学Kaldi，丝滑入门语音识别，语音识别原来如此简单

利用基于帧级跨模态注意力的音视频Confomer的鲁棒音视频唤醒词识别

厦门大学教授洪青阳老师带你学习声纹识别研究现状和开源工具

【入门语音识别】WFST理论

TF-SepNet：一种用于低复杂度声学场景分类的卷积神经网络中的高效一维核设计

声纹识别工具ASV-Subtools-江涛

【声纹识别入门】声纹技术就是声纹识别吗？

面向通用语音离散标记：ASR和TTS的一个案例研究

[转载] 沉默哥的雷明顿纸模型各阶段汇报

【科普】语音识别分类大科普！你真的知道所有语音识别分类吗？

基于自监督学习的高性能鲁棒说话人识别-钱彦旻

1MB内存下移动说话人验证系统的极低比特量化

面向表现力语音合成的多尺度风格建模与生成-吴志勇

声纹识别中的鲁棒性学习方法研究

基于伪孪生网络的音色保留的说话人识别黑盒对抗攻击

论文解读丨CUSIDE：分块、模拟未来、解码的流式语音识别新框架 -结论

【实操】通过NVIDIA NEMO 训练语音AI模型（上）

家居场景下音视频说话人日志和语音识别评测介绍（MISP 2022）-杜俊

【实操】使用wenet搭建云端语音识别系统

在说话人验证中识别基于语音转换欺诈攻击的源说话人

CCF语音对话与听觉专委会2021学术年会

面向复杂场景的高可靠性声纹识别及其关联任务研究！-04

面向复杂场景的高可靠性声纹识别及其关联任务研究！-05

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-背景及意义-02

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-测试集构造02

【语音识别】声学特征提取

厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-前沿技术01

复杂声学场景下基于复数谱的语音增强和去混技术研究

标签噪声干扰下的说话人识别关键技术研究

鲁棒说话人识别中的深度伪造与迁移学习-谢磊

超划算的语音课程，确定不来了解下？

Sherpa:新一代 Kaldi 部署框架

2021年声纹识别研究与应用学术研讨会

论文解读丨CUSIDE：分块、模拟未来、解码的流式语音识别新框架 -实验设置

少走99%的弯路！0基础快速入门语音识别

面向复杂场景的说话人日志

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征

感知难度的说话人识别数据增强

面向文本无关说话人识别的跨模态视听协同学习

基于多通道时空特征和知识蒸馏的鲁棒目标说话人提取研究

【声纹识别入门】损失函数的设计方法

【清华】从0开始学Kaldi，丝滑入门语音识别，语音识别原来如此简单

利用基于帧级跨模态注意力的音视频Confomer的鲁棒音视频唤醒词识别

厦门大学教授洪青阳老师带你学习声纹识别研究现状和开源工具

【入门语音识别】WFST理论

TF-SepNet：一种用于低复杂度声学场景分类的卷积神经网络中的高效一维核设计

声纹识别工具ASV-Subtools-江涛

【声纹识别入门】声纹技术就是声纹识别吗？

面向通用语音离散标记：ASR和TTS的一个案例研究

[转载] 沉默哥 的 雷明顿 纸模型 各阶段汇报

【科普】语音识别分类大科普！你真的知道所有语音识别分类吗？

基于自监督学习的高性能鲁棒说话人识别-钱彦旻

1MB内存下移动说话人验证系统的极低比特量化

面向表现力语音合成的多尺度风格建模与生成-吴志勇

声纹识别中的鲁棒性学习方法研究

基于伪孪生网络的音色保留的说话人识别黑盒对抗攻击

论文解读丨CUSIDE：分块、模拟未来、解码的流式语音识别新框架 -结论

【实操】通过NVIDIA NEMO 训练语音AI模型（上）

家居场景下音视频说话人日志和语音识别评测介绍（MISP 2022）-杜俊

【实操】使用wenet搭建云端语音识别系统

在说话人验证中识别基于语音转换欺诈攻击的源说话人

CCF语音对话与听觉专委会2021学术年会

[转载] 沉默哥的雷明顿纸模型各阶段汇报