面向复杂场景的高可靠性声纹识别及其关联任务研究！-02

发布人

昆山杜克大学电子与计算机工程副教授李明教授，首先描述面向复杂场景的声纹识别这一具有挑战性的任务；其次介绍实验室在远场声纹识别领域的近期研究成果；最后，扩展到多个使用声纹编码的语音关联任务的工作，如特定人唤醒，特定人合成与变声，特定人分离等。

打开封面下载高清视频观看高清视频视频下载器

面向复杂场景的高可靠性声纹识别及其关联任务研究！-04

面向复杂场景的高可靠性声纹识别及其关联任务研究！-06

面向复杂场景的高可靠性声纹识别及其关联任务研究！-03

面向复杂场景的高可靠性声纹识别及其关联任务研究！-07

多说话人交互场景中的目标说话人提取

家居场景下音视频说话人日志和语音识别评测介绍（MISP 2022）-杜俊

面向文本无关说话人识别的跨模态视听协同学习

基于元学习的声纹识别研究进展-王龙标

基于语音预训练模型的无监督说话人识别方法-李琳

TF-SepNet：一种用于低复杂度声学场景分类的卷积神经网络中的高效一维核设计

基于预训练的伪造语音检测研究进展-张鹏远

感知难度的说话人识别数据增强

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-讨论与结果

厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-实验室介绍&答疑

对抗噪声标签的鲁棒说话人识别

声纹识别中的鲁棒性学习方法研究

声纹识别工具ASV-Subtools-江涛

厦门大学教授洪青阳老师带你学习声纹识别研究现状和开源工具

实现选择性听觉注意的单耳语音分离和说话人识别的深度学习解决方案-李海洲

面向表现力语音合成的多尺度风格建模与生成-吴志勇

ICASSP 2023 E-Prevention竞赛分享基于可穿戴设备数据的用户身份识别系统

【ICASSP】超短注册时间的目标说话人提取模型

【声纹识别入门】ASV-Subtools工具系统框架-关键技术

【课程推荐】声纹识别与音频处理-王泉

【声纹识别入门】ASV-Subtools工具特征提取

利用基于熵的融合以及基于剪枝的网络架构优化改进多模态情感识别

超划算的语音课程，确定不来了解下？

通过特征解纠缠技术进行跨城市和设备的声学场景分类

Xi-vector嵌入空间中的说话人识别与表征

面向神经声码器训练的一种合成语料生成方法

论文解读丨CUSIDE：分块、模拟未来、解码的流式语音识别新框架 -实验设置

面向通用语音离散标记：ASR和TTS的一个案例研究

基于多通道时空特征和知识蒸馏的鲁棒目标说话人提取研究

鲁棒声纹识别与安全-张晓雷

面向神经声码器训练的一种合成语料生成方法

厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-开源工具

基于音频辨别的对比学习在连续语音中的可定制关键词检测

基于多目标渐进聚类的半监督说话人识别域自适应

中文连续视觉语音识别挑战赛

【声纹识别入门】ASV-Subtools工具runtime实现-frontend

面向复杂场景的高可靠性声纹识别及其关联任务研究！-02

面向复杂场景的高可靠性声纹识别及其关联任务研究！-04

面向复杂场景的高可靠性声纹识别及其关联任务研究！-06

面向复杂场景的高可靠性声纹识别及其关联任务研究！-03

面向复杂场景的高可靠性声纹识别及其关联任务研究！-07

多说话人交互场景中的目标说话人提取

家居场景下音视频说话人日志和语音识别评测介绍（MISP 2022）-杜俊

面向文本无关说话人识别的跨模态视听协同学习

基于元学习的声纹识别研究进展-王龙标

基于语音预训练模型的无监督说话人识别方法-李琳

TF-SepNet：一种用于低复杂度声学场景分类的卷积神经网络中的高效一维核设计

基于预训练的伪造语音检测研究进展-张鹏远

感知难度的说话人识别数据增强

论文解读丨跨年龄声纹识别：学习年龄不变的说话人特征-讨论与结果

厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-实验室介绍&答疑

对抗噪声标签的鲁棒说话人识别

声纹识别中的鲁棒性学习方法研究

声纹识别工具ASV-Subtools-江涛

厦门大学教授洪青阳老师带你学习声纹识别研究现状和开源工具

实现选择性听觉注意的单耳语音分离和说话人识别的深度学习解决方案-李海洲

面向表现力语音合成的多尺度风格建模与生成-吴志勇

ICASSP 2023 E-Prevention竞赛分享基于可穿戴设备数据的用户身份识别系统

【ICASSP】超短注册时间的目标说话人提取模型

【声纹识别入门】ASV-Subtools工具 系统框架-关键技术

【课程推荐】声纹识别与音频处理-王泉

【声纹识别入门】ASV-Subtools工具 特征提取

利用基于熵的融合以及基于剪枝的网络架构优化改进多模态情感识别

超划算的语音课程，确定不来了解下？

通过特征解纠缠技术进行跨城市和设备的声学场景分类

Xi-vector嵌入空间中的说话人识别与表征

面向神经声码器训练的一种合成语料生成方法

论文解读丨CUSIDE：分块、模拟未来、解码的流式语音识别新框架 -实验设置

面向通用语音离散标记：ASR和TTS的一个案例研究

基于多通道时空特征和知识蒸馏的鲁棒目标说话人提取研究

鲁棒声纹识别与安全-张晓雷

面向神经声码器训练的一种合成语料生成方法

厦门大学教授洪青阳老师带你学习|声纹识别研究现状和开源工具-开源工具

基于音频辨别的对比学习在连续语音中的可定制关键词检测

基于多目标渐进聚类的半监督说话人识别域自适应

中文连续视觉语音识别挑战赛

【声纹识别入门】ASV-Subtools工具runtime实现-frontend

【声纹识别入门】ASV-Subtools工具系统框架-关键技术

【声纹识别入门】ASV-Subtools工具特征提取