【语音合成】声学模型数据（试听）

发布人

视频内容节选自《AISHELL-3语音合成实战》https://xjw.xet.tech/s/tgv9C
课程可以带你了解语音合成算法并实践，掌握多说话人合成系统的设计，基于AISHELL-3开源数据库，自主实现语音合成系统的工程搭建。

打开封面下载高清视频观看高清视频视频下载器

【语音合成】Tacotron-2 的实现实战试听

【声纹识别入门】ASV-Subtools工具环境配置

自定义语音唤醒中的关键词自适应声学模型剪枝

【声纹识别入门】数据准备

【清华】从0开始学Kaldi，丝滑入门语音识别，语音识别原来如此简单

通过NVIDIA NEMO 训练语音AI模型（下）

【Wenet语音识别】Transformer和Conformer

说话人识别模型的可解释性-王东

SELM：基于离散标记和语言模型的语音增强方法

【声纹识别入门】基于ResNet的模型实现

通过特征解纠缠技术进行跨城市和设备的声学场景分类

【声纹识别入门】声纹识别系统的评价指标-基于语音对的实现方法

仅需40个Token，高质量重建音频

VISinger：高保真端到端歌声合成模型

用对比学习增强流式与非流式模型

高速高质量零资源歌声合成-雪巍

面向表现力语音合成的多尺度风格建模与生成-吴志勇

【声纹识别入门】损失函数的设计方法

基于混合预测编码与知识蒸馏的双模语音转换模型

2022年声纹识别研究与应用学术研讨会

【ICASSP2024】基于记忆感知和Seq2Seq架构的说话人日志系统

基于conformer的热词增强方法

【Wenet语音识别】wenet中的语音模型方案

基于多级域适配器的鲁棒跨域说话人验证技术

基于多目标渐进聚类的半监督说话人识别域自适应

【唤醒词识别】数据预处理代码

基于多任务学习的异常感知的内群点建模及多尺度的异常值打分

K2的介绍及应用

VoiceFlow:高效的文本到语音的纠正流量匹配

利用文本-语音对比学习提出针对语音合成的韵律文本表征-叶振辉（火山语音）

【声纹识别入门】ASV-Subtools工具迁移学习的核心代码

音乐和音频数据的学习方法-Emmanouil-BENETOS

感知难度的说话人识别数据增强

基于无监督学习的端到端无分层生成固定滤波器主动噪声控制

基于距离的权重转移，用于从近场到远场的说话人验证模型的微调

HIMIA-预训练（测试集）

陈果果语音识别的发展: A Dataset and Benchmark Perspective【语音之家公开课】

用于声学信号内容理解的机器学习算法前瞻 -李圣辰 -西交利物浦大学

【AI音色克隆】超强AI音色克隆，CosyVoice，最新模型，速度超级快！附上本地安装教程！

ICASSP 2023 E-Prevention竞赛分享基于可穿戴设备数据的用户身份识别系统

【语音合成】声学模型数据（试听）

【语音合成】Tacotron-2 的实现实战 试听

【声纹识别入门】ASV-Subtools工具环境配置

自定义语音唤醒中的关键词自适应声学模型剪枝

【声纹识别入门】数据准备

【清华】从0开始学Kaldi，丝滑入门语音识别，语音识别原来如此简单

通过NVIDIA NEMO 训练语音AI模型（下）

【Wenet语音识别】Transformer和Conformer

说话人识别模型的可解释性-王东

SELM：基于离散标记和语言模型的语音增强方法

【声纹识别入门】基于ResNet的模型实现

通过特征解纠缠技术进行跨城市和设备的声学场景分类

【声纹识别入门】声纹识别系统的评价指标-基于语音对的实现方法

仅需40个Token，高质量重建音频

VISinger：高保真端到端歌声合成模型

用对比学习增强流式与非流式模型

高速高质量零资源歌声合成-雪巍

面向表现力语音合成的多尺度风格建模与生成-吴志勇

【声纹识别入门】损失函数的设计方法

基于混合预测编码与知识蒸馏的双模语音转换模型

2022年声纹识别研究与应用学术研讨会

【ICASSP2024】基于记忆感知和Seq2Seq架构的说话人日志系统

基于conformer的热词增强方法

【Wenet语音识别】wenet中的语音模型方案

基于多级域适配器的鲁棒跨域说话人验证技术

基于多目标渐进聚类的半监督说话人识别域自适应

【唤醒词识别】数据预处理代码

基于多任务学习的异常感知的内群点建模及多尺度的异常值打分

K2的介绍及应用

VoiceFlow:高效的文本到语音的纠正流量匹配

利用文本-语音对比学习提出针对语音合成的韵律文本表征-叶振辉（火山语音）

【声纹识别入门】ASV-Subtools工具 迁移学习的核心代码

音乐和音频数据的学习方法-Emmanouil-BENETOS

感知难度的说话人识别数据增强

基于无监督学习的端到端无分层生成固定滤波器主动噪声控制

基于距离的权重转移，用于从近场到远场的说话人验证模型的微调

HIMIA-预训练（测试集）

陈果果 语音识别的发展: A Dataset and Benchmark Perspective【语音之家公开课】

用于声学信号内容理解的机器学习算法前瞻 -李圣辰 -西交利物浦大学

【AI音色克隆】超强AI音色克隆，CosyVoice，最新模型，速度超级快！附上本地安装教程！

ICASSP 2023 E-Prevention竞赛分享基于可穿戴设备数据的用户身份识别系统

【语音合成】Tacotron-2 的实现实战试听

【声纹识别入门】ASV-Subtools工具迁移学习的核心代码

陈果果语音识别的发展: A Dataset and Benchmark Perspective【语音之家公开课】