V
主页
基于特征选择和文本嵌入的自发性粤语痴呆检测
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
【科普】语音识别评估方法
少走99%的弯路!0基础快速入门语音识别
【Wenet语音识别】功能架构和模型结构
基于语音噪声双流谱改善网络使用语音失真损失函数的鲁棒语音识别
【清华】从0开始学Kaldi,丝滑入门语音识别,语音识别原来如此简单
【声纹识别】什么是声纹识别?声纹识别发展历程怎样?
将子词发音与唇形联合嵌入感知视听语音增强
【闲话AI】什么是自动语音识别?
当前语音信号处理面临的挑战
适应多语言ASR模型,以处理多个说话人
开源语音和 wenet-e2e 社区
【干货】语音识别入门有哪些值得推荐的书籍论文及开源库
基于新一代kaldi项目的语音识别应用实例-郭理勇 小米
低延迟非自回归语音识别方法
京东在监督对比学习语音识别中的实践
好课免费学丨Kaldi语音识别理论与实践课(视频末尾有惊喜)
【秒懂】智能语音技术范畴
ReFlow-TTS:一个用于高保真的文本到语音的校正流模型
SlideSpeech:大规模幻灯片丰富的语音-视频语料库
基于注意力融合瓶颈与扰动特征的高表现力语音转换模型
低资源小语种自动语音识别:清华THUEE队伍在OpenASR20的系统描述
语音识别发展历程:从模式匹配到统计模型
多说话人语音识别中可感知边界的序列化输出训练
语音之家公开课 —《语音识别服务实战》交流
交互式AI中语音技术实践与探索-万玉龙
特定人合成及变声与录音回放语音攻击检测
ICASSP 2023 论文预讲会 第九期 天津大学天津市认知计算与应用重点实验室专场
我实现了语音流式转录翻译!(win11实时字幕+Luna Translator hook)
【实操】从零搭建声纹识别框架
喜马拉雅语音识别技术和应用介绍
基于Transducer的流式自适应热词语音识别
【科普】语音识别分类大科普!你真的知道所有语音识别分类吗?
MLCA-AVSR:基于多层交叉注意力融合的视听语音识别
语音之家公开课 —《WeNet语音识别实战》课程交流
深伪音频鉴别研究进展
跨语种的语音转换-武执正
【ICASSP】加入预训练模型的半监督声音事件检测
基于距离的权重转移,用于从近场到远场的说话人验证模型的微调
【Wenet语音识别】预训练模型-流式和非流式模型
语音识别基础:从声音到语音