【免费赠书】新书速递《语音识别：原理与应用》（第2版）

发布人

本期留言互动主题：
聊聊第一次写的代码是什么~~~
欢迎在评论区互动，截止到2023年2月17日12:00，评论点赞最多的小伙伴将获得《语音识别：原理与应用》（第2版）1本。

打开封面下载高清视频观看高清视频视频下载器

基于新一代kaldi项目的语音识别应用实例-郭理勇小米

开源语音识别工具wenet 简介张彬彬

实时多人会话的语音识别-微软首席应用科学家-陈卓

Whisper终结者：Reverb ASR 语音识别和说话人分离方面新标杆在前所未有的20万小时人工转录数据上进行训练支持可定制的逐字转录

基于音频辨别的对比学习在连续语音中的可定制关键词检测

【语音之家】AI产业沙龙—语音技术在国音智能的应用

多说话人交互场景中的目标说话人提取

喜马拉雅语音识别技术和应用介绍

【闲话AI】语音识别的发展陈果果

Kaldi安装与样例流程介绍

【科普】语音识别评估方法

交互式AI中语音技术实践与探索-万玉龙

面向L3DAS23挑战赛的通道流注意力机制网络

Daniel Povey|Zipformer:一种改进的语音识别编码器

ReFlow-TTS：一个用于高保真的文本到语音的校正流模型

多语言和代码转换语音识别的语言路由专家混合

深伪音频鉴别研究进展

【语音之家】AI产业沙龙—腾讯AI Lab语音技术进展分享报告

【闲话AI】什么是自动语音识别？

开源语音和 wenet-e2e 社区

Kaldi中的神经网络

白玉兰开源:面向人工智能应用的开放数据集构建及许可协议-金耀辉上海交通大学

浙大清华发布语音伪造检测框架SafeEar，内容隐私保护，语音造假无处遁形

【Wenet语音识别】环境配置

跨语言语音识别中基于联合语音表征学习的音素到词转码器

BS-PLCNet：基于多任务学习和多判别器的频带分解丢包隐藏网络

多说话人语音识别中可感知边界的序列化输出训练

用于大规模说话人验证的动态全连接层

语音识别基础：从声音到语音

天津大学天津市认知计算与应用重点实验室言语交互意图理解方向的研究思路及进展

声纹识别与语音防伪技术前沿及工作进展

ICASSP 2023 论文预讲会第八期西北工业大学音频语音与语言处理研究组（NPU-ASLP）专场（下）

MLCA-AVSR：基于多层交叉注意力融合的视听语音识别

Panel ：语音技术新时代

kaldi语音识别：GMM训练

都开第三期了！广受好评的端到端语音识别实战课

【语音识别入门】kaldi的安装

【Wenet语音识别】实时长语音听写

PromptVC：基于自然语言提示的潜在空间灵活风格语音转换

深度生成固定滤波器的有源噪声控制

【免费赠书】新书速递《语音识别：原理与应用》（第2版）

基于新一代kaldi项目的语音识别应用实例-郭理勇 小米

开源语音识别工具wenet 简介 张彬彬

实时多人会话的语音识别-微软首席应用科学家-陈卓

Whisper终结者：Reverb ASR 语音识别和说话人分离方面新标杆 在前所未有的20万小时人工转录数据上进行训练 支持可定制的逐字转录

基于音频辨别的对比学习在连续语音中的可定制关键词检测

【语音之家】AI产业沙龙—语音技术在国音智能的应用

多说话人交互场景中的目标说话人提取

喜马拉雅语音识别技术和应用介绍

【闲话AI】语音识别的发展 陈果果

Kaldi安装与样例流程介绍

【科普】语音识别评估方法

交互式AI中语音技术实践与探索-万玉龙

面向L3DAS23挑战赛的通道流注意力机制网络

Daniel Povey|Zipformer:一种改进的语音识别编码器

ReFlow-TTS：一个用于高保真的文本到语音的校正流模型

多语言和代码转换语音识别的语言路由专家混合

深伪音频鉴别研究进展

【语音之家】AI产业沙龙—腾讯AI Lab语音技术进展分享报告

【闲话AI】什么是自动语音识别？

开源语音和 wenet-e2e 社区

Kaldi中的神经网络

白玉兰开源:面向人工智能应用的开放数据集构建及许可协议-金耀辉 上海交通大学

浙大清华发布语音伪造检测框架SafeEar，内容隐私保护，语音造假无处遁形

【Wenet语音识别】环境配置

跨语言语音识别中基于联合语音表征学习的音素到词转码器

BS-PLCNet：基于多任务学习和多判别器的频带分解丢包隐藏网络

多说话人语音识别中可感知边界的序列化输出训练

用于大规模说话人验证的动态全连接层

语音识别基础：从声音到语音

天津大学天津市认知计算与应用重点实验室言语交互意图理解方向的研究思路及进展

声纹识别与语音防伪技术前沿及工作进展

ICASSP 2023 论文预讲会 第八期 西北工业大学音频语音与语言处理研究组（NPU-ASLP）专场（下）

MLCA-AVSR：基于多层交叉注意力融合的视听语音识别

Panel ：语音技术新时代

kaldi语音识别：GMM训练

都开第三期了！广受好评的端到端语音识别实战课

【语音识别入门】kaldi的安装

【Wenet语音识别】实时长语音听写

PromptVC：基于自然语言提示的潜在空间灵活风格语音转换

深度生成固定滤波器的有源噪声控制

基于新一代kaldi项目的语音识别应用实例-郭理勇小米

开源语音识别工具wenet 简介张彬彬

Whisper终结者：Reverb ASR 语音识别和说话人分离方面新标杆在前所未有的20万小时人工转录数据上进行训练支持可定制的逐字转录

【闲话AI】语音识别的发展陈果果

白玉兰开源:面向人工智能应用的开放数据集构建及许可协议-金耀辉上海交通大学

ICASSP 2023 论文预讲会第八期西北工业大学音频语音与语言处理研究组（NPU-ASLP）专场（下）