京东在监督对比学习语音识别中的实践

发布人

京东在监督对比学习语音识别中的实践，完整沙龙请移步 https://www.bilibili.com/video/BV1E44y1Q7UE/?share_source=copy_web&amp;vd_source=7fe75e9eae52142fef10581ac7f5dcdb

打开封面下载高清视频观看高清视频视频下载器

Kaldi安装与样例流程介绍

【语音之家】AI产业沙龙—京东在AI语音方向的技术探索与实践

开源语音识别工具wenet 简介张彬彬

【Wenet语音识别】功能架构和模型结构

基于音频辨别的对比学习在连续语音中的可定制关键词检测

具有目标说话人吸引子的端到端神经说话人分类的基于注意力的编解码器网络

西工大ASLP实验室语音生成模型新进展-西北工业大学谢磊老师

基于多目标渐进聚类的半监督说话人识别域自适应

端到端语音到语音翻译中的零样本风格迁移

【声纹识别】什么是声纹识别？声纹识别发展历程怎样？

基于语音识别预训练的说话人识别方法

基于语音噪声双流谱改善网络使用语音失真损失函数的鲁棒语音识别

基于角空间中类感知注意机制对比学习的区分性说话人表征

【新书资讯】语音识别领域又添一本新书！洪青阳李琳《语音识别：原理与应用》第二版！

【科普】语音识别评估方法

ICASSP 2023 论文预讲会第九期天津大学天津市认知计算与应用重点实验室专场

多说话人交互场景中的目标说话人提取

【干货】语音识别入门有哪些值得推荐的书籍论文及开源库

针对病理性发音的语音技术研究进展秦勇南开大学

开源语音和 wenet-e2e 社区

入门语音合成，听这个课真的可以哦

中文连续视觉语音识别挑战赛

基于数据增强的语音编辑改进ASR中的代码转换和命名实体识别

腾讯会议的实时音频技术介绍和展望腾讯天籁实验室余涛

kaldi语音识别：GMM训练

多语言和代码转换语音识别的语言路由专家混合

唤醒你的贾维斯，该从哪里开始学？ 5分钟让你了解语音识别技术

【揭秘】人工智能变人工智障？准确的语音识别为何这么难？

1MB内存下移动说话人验证系统的极低比特量化

基于多任务学习保留背景音的语音转换

AI语音面试常见问题：语音是怎么来的？

世界杯无障碍字幕直播间背后的流式语音技术火山语音

ICASSP 2023 论文预讲会第六期新加坡南洋理工大学语音实验室专场（DSP Lab）

文本到音频的生成:技术和应用-刘豪赫(Haohe LIU)

Kaldi之父 Daniel-Povey亲述：K2的最新进展和即将展开的工作

2021年声纹识别研究与应用学术研讨会

【语音合成】什么是语音合成？

面向L3DAS23挑战赛的通道流注意力机制网络

【Wenet语音识别】预训练模型-流式和非流式模型

圆桌：音频与大模型（欧智坚何磊钱彦旻易江燕栾剑张超）

京东在监督对比学习语音识别中的实践

Kaldi安装与样例流程介绍

【语音之家】AI产业沙龙—京东在AI语音方向的技术探索与实践

开源语音识别工具wenet 简介 张彬彬

【Wenet语音识别】功能架构和模型结构

基于音频辨别的对比学习在连续语音中的可定制关键词检测

具有目标说话人吸引子的端到端神经说话人分类的基于注意力的编解码器网络

西工大ASLP实验室语音生成模型新进展-西北工业大学谢磊老师

基于多目标渐进聚类的半监督说话人识别域自适应

端到端语音到语音翻译中的零样本风格迁移

【声纹识别】什么是声纹识别？声纹识别发展历程怎样？

基于语音识别预训练的说话人识别方法

基于语音噪声双流谱改善网络使用语音失真损失函数的鲁棒语音识别

基于角空间中类感知注意机制对比学习的区分性说话人表征

【新书资讯】语音识别领域又添一本新书！洪青阳 李琳《语音识别：原理与应用》第二版！

【科普】语音识别评估方法

ICASSP 2023 论文预讲会 第九期 天津大学天津市认知计算与应用重点实验室专场

多说话人交互场景中的目标说话人提取

【干货】语音识别入门有哪些值得推荐的书籍论文及开源库

针对病理性发音的语音技术研究进展 秦勇 南开大学

开源语音和 wenet-e2e 社区

入门语音合成，听这个课真的可以哦

中文连续视觉语音识别挑战赛

基于数据增强的语音编辑改进ASR中的代码转换和命名实体识别

腾讯会议的实时音频技术介绍和展望 腾讯天籁实验室 余涛

kaldi语音识别：GMM训练

多语言和代码转换语音识别的语言路由专家混合

唤醒你的贾维斯，该从哪里开始学？ 5分钟让你了解语音识别技术

【揭秘】人工智能变人工智障？准确的语音识别为何这么难？

1MB内存下移动说话人验证系统的极低比特量化

基于多任务学习保留背景音的语音转换

AI语音面试常见问题：语音是怎么来的？

世界杯无障碍字幕直播间背后的流式语音技术 火山语音

ICASSP 2023 论文预讲会 第六期 新加坡南洋理工大学语音实验室专场（DSP Lab）

文本到音频的生成:技术和应用-刘豪赫(Haohe LIU)

Kaldi之父 Daniel-Povey亲述：K2的最新进展和即将展开的工作

2021年声纹识别研究与应用学术研讨会

【语音合成】什么是语音合成？

面向L3DAS23挑战赛的通道流注意力机制网络

【Wenet语音识别】预训练模型-流式和非流式模型

圆桌：音频与大模型（欧智坚 何磊 钱彦旻 易江燕 栾剑 张超）

开源语音识别工具wenet 简介张彬彬

【新书资讯】语音识别领域又添一本新书！洪青阳李琳《语音识别：原理与应用》第二版！

ICASSP 2023 论文预讲会第九期天津大学天津市认知计算与应用重点实验室专场

针对病理性发音的语音技术研究进展秦勇南开大学

腾讯会议的实时音频技术介绍和展望腾讯天籁实验室余涛

世界杯无障碍字幕直播间背后的流式语音技术火山语音

ICASSP 2023 论文预讲会第六期新加坡南洋理工大学语音实验室专场（DSP Lab）

圆桌：音频与大模型（欧智坚何磊钱彦旻易江燕栾剑张超）