V
主页
当前语音信号处理面临的挑战
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
【清华】从0开始学Kaldi,丝滑入门语音识别,语音识别原来如此简单
基于原地卷积网络的前端信号处理算法 张学良 内蒙古大学
ICASSP 2023 论文预讲会 第七期 西北工业大学音频语音与语言处理研究组(NPU-ASLP)专场(上)
基于新一代kaldi项目的语音识别应用实例-郭理勇 小米
当告诉AI我不会续费!它疯了的样子太可怕了(GPT4o高级语音模式)
Kaldi安装与样例流程介绍
开源语音和 wenet-e2e 社区
【语音识别】语音的采样与量化
Kaldi中的神经网络
SlideSpeech:大规模幻灯片丰富的语音-视频语料库
语音识别发展历程:从模式匹配到统计模型
【闲话AI】语音识别的发展 陈果果
跨语言语音识别中基于联合语音表征学习的音素到词转码器
一个使用单事件声音的详细的音频-文本数据模拟管道
基于faster_whisper的实时语音识别 | 可对接大模型的实时语音识别 | 实时语音识别 | 一句话识别
【科普】语音识别分类大科普!你真的知道所有语音识别分类吗?
【语音】浅谈端到端语音识别
针对部分篡改音频的波形边界检测系统
面向所有语音任务的通用语音模型-李宏毅(Hung-yi-LEE)
2021年声纹识别研究与应用学术研讨会
【语音识别】语音文件分析
【语音之家】 AI技术沙龙- -语音合成
Trimtail:语音识别延迟优化中的暴利美学
基于音频辨别的对比学习在连续语音中的可定制关键词检测
语音识别发展历程:深度学习时代
语音合成中的情感建模研究
低资源小语种自动语音识别:清华THUEE队伍在OpenASR20的系统描述
基于热词短语预测网络的热词语音识别
世界杯无障碍字幕直播间背后的流式语音技术 火山语音
基于自监督学习前端特征的通用歌唱语音语种识别方法
太强了!AI 语音进入全新时代!完美模仿人类情绪语调!
利用唤醒词参考语音的高效个人语音活动检测
【语音识别入门】kaldi的安装
一种端到端脑电图通道选择的脑辅助语音增强方法
faster_whisper对接大模型进行语音对话 | 人机对话 | 语音识别 | 大模型 | faster whisper实时语音识别 | 实时语音识别
语音之家公开课 —《WeNet语音识别实战》课程交流
RaD-Net:一种用于语音信号改善的修复与降噪网络
京东在监督对比学习语音识别中的实践
【课程推荐】kaldi语音识别实战 | 0基础适用
BS-PLCNet:基于多任务学习和多判别器的频带分解丢包隐藏网络