V
主页
kaldi语音识别:GMM训练
发布人
完整课程(完整免费版):https://www.bilibili.com/video/BV1PA41197Mk/
打开封面
下载高清视频
观看高清视频
视频下载器
基于新一代kaldi项目的语音识别应用实例-郭理勇 小米
Sherpa:新一代 Kaldi 部署框架
用于声学信号内容理解的机器学习算法前瞻 -李圣辰 -西交利物浦大学
【语音识别】声学特征提取
SlideSpeech:大规模幻灯片丰富的语音-视频语料库
Kaldi中的神经网络
低延迟非自回归语音识别方法
喜马拉雅语音识别技术和应用介绍
基于热词短语预测网络的热词语音识别
基于平行语料的可逆变声
kaldi之父 Daniel-Povey:Next-Gen Kaldi: Status and Near-term Plans
面向表现力语音合成的多尺度风格建模与生成-吴志勇
语音识别发展历程:深度学习时代
基于多通道训练和交叉信息融合的低资源端到端口音识别
都开第三期了!广受好评的端到端语音识别实战课
低资源小语种自动语音识别:清华THUEE队伍在OpenASR20的系统描述
101 新一代Kaldi+WebAssembly+SenseVoice+VAD: 浏览器本地中英文语音识别
唤醒你的贾维斯,该从哪里开始学? 5分钟让你了解语音识别技术
以目标语音识别为例,弱监督语音预训练
【ICASSP】加入预训练模型的半监督声音事件检测
提升Conformer-Transducer ASR系统的语音辅助多目标单元建模
圆桌:音频与大模型(欧智坚 何磊 钱彦旻 易江燕 栾剑 张超)
深度生成固定滤波器的有源噪声控制
Daniel Povey|Zipformer:一种改进的语音识别编码器
什么是语音信号?
低数据资源语音识别系统构建工作进展——上海交大钱彦旻课题组
第五届kaldi技术交流会
【Wenet语音识别】功能架构和模型结构
【秒懂】语音识别是什么
语音识别发展历程:从模式匹配到统计模型
【课程推荐】kaldi语音识别实战 | 0基础适用
ICASSP 2023 论文预讲会 第七期 西北工业大学音频语音与语言处理研究组(NPU-ASLP)专场(上)
【语音之家】AI产业沙龙—如何应用k2开发语音识别系统
如何工程化一个语音开源项目: 手把手带你实现开源声纹分割聚类项目 pyannote-audio 的工程化
实时多人会话的语音识别-微软首席应用科学家-陈卓
基于Transducer的流式自适应热词语音识别
UniSplice:面向低资源ASR的通用跨语言数据拼接
【ICASSP】超短注册时间的目标说话人提取模型
K2的介绍及应用
通过扬声器提示调优和适配器表示的双参数高效微调【香港理工大学】