当前语音信号处理面临的挑战 - 视频下载 Video Downloader

当前语音信号处理面临的挑战

发布人

打开封面下载高清视频观看高清视频视频下载器

【清华】从0开始学Kaldi，丝滑入门语音识别，语音识别原来如此简单

基于原地卷积网络的前端信号处理算法张学良内蒙古大学

ICASSP 2023 论文预讲会第七期西北工业大学音频语音与语言处理研究组（NPU-ASLP）专场（上）

基于新一代kaldi项目的语音识别应用实例-郭理勇小米

当告诉AI我不会续费！它疯了的样子太可怕了（GPT4o高级语音模式）

Kaldi安装与样例流程介绍

开源语音和 wenet-e2e 社区

【语音识别】语音的采样与量化

Kaldi中的神经网络

SlideSpeech：大规模幻灯片丰富的语音-视频语料库

语音识别发展历程：从模式匹配到统计模型

【闲话AI】语音识别的发展陈果果

跨语言语音识别中基于联合语音表征学习的音素到词转码器

一个使用单事件声音的详细的音频-文本数据模拟管道

基于faster_whisper的实时语音识别 | 可对接大模型的实时语音识别 | 实时语音识别 | 一句话识别

【科普】语音识别分类大科普！你真的知道所有语音识别分类吗？

【语音】浅谈端到端语音识别

针对部分篡改音频的波形边界检测系统

面向所有语音任务的通用语音模型-李宏毅(Hung-yi-LEE)

2021年声纹识别研究与应用学术研讨会

【语音识别】语音文件分析

【语音之家】 AI技术沙龙- -语音合成

Trimtail：语音识别延迟优化中的暴利美学

基于音频辨别的对比学习在连续语音中的可定制关键词检测

语音识别发展历程：深度学习时代

语音合成中的情感建模研究

低资源小语种自动语音识别：清华THUEE队伍在OpenASR20的系统描述

基于热词短语预测网络的热词语音识别

世界杯无障碍字幕直播间背后的流式语音技术火山语音

基于自监督学习前端特征的通用歌唱语音语种识别方法

太强了！AI 语音进入全新时代！完美模仿人类情绪语调！

利用唤醒词参考语音的高效个人语音活动检测

【语音识别入门】kaldi的安装

一种端到端脑电图通道选择的脑辅助语音增强方法

faster_whisper对接大模型进行语音对话 | 人机对话 | 语音识别 | 大模型 | faster whisper实时语音识别 | 实时语音识别

语音之家公开课 —《WeNet语音识别实战》课程交流

RaD-Net：一种用于语音信号改善的修复与降噪网络

京东在监督对比学习语音识别中的实践

【课程推荐】kaldi语音识别实战 | 0基础适用

BS-PLCNet：基于多任务学习和多判别器的频带分解丢包隐藏网络