V
主页
基于自监督学习表示的具有持久性口音记忆的口音识别
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
Sherpa:新一代 Kaldi 部署框架
基于新一代kaldi项目的语音识别应用实例-郭理勇 小米
说话人识别模型的可解释性-王东
基于自监督学习前端特征的通用歌唱语音语种识别方法
【秒懂】语音识别是什么
Daniel Povey|Zipformer:一种改进的语音识别编码器
对抗噪声标签的鲁棒说话人识别
具有目标说话人吸引子的端到端神经说话人分类的基于注意力的编解码器网络
基于语音预训练模型的无监督说话人识别方法-李琳
ModelScope语音开源现状和语音语义多模态大模型研究进展 张仕良
多说话人语音识别中可感知边界的序列化输出训练
少走99%的弯路!0基础快速入门语音识别
声纹识别可视化研究分析
语音情感识别中自监督特征的下游迁移研究
基于语音识别预训练的说话人识别方法
深度生成固定滤波器的有源噪声控制
打造低延时、高精度的腾讯会议智能语音识别系统
基于音频辨别的对比学习在连续语音中的可定制关键词检测
什么是语音信号?
Trimtail:语音识别延迟优化中的暴利美学
低延迟非自回归语音识别方法
京东智能语音交互技术进展及应用
【聘】语音识别算法工程师
【荐】已经开到第四期了,端到端语音识别好课,新增语音大模型内容
开源语音识别工具wenet 简介 张彬彬
面向表现力语音合成的多尺度风格建模与生成-吴志勇
【Wenet语音识别】环境配置
基于共振峰和基频缩放的可区分说话人匿名化
基于SepFormer的交叉注意力音视频目标说话人语音提取方法
【闲话AI】语音识别的发展 陈果果
深伪音频鉴别研究进展
突破SSL语音表示中无监督单元发现的极限
语音识别发展历程:深度学习时代
标签噪声干扰下的说话人识别关键技术研究
通过扬声器提示调优和适配器表示的双参数高效微调【香港理工大学】
【语音之家公开课】多说话人语音识别的前沿进展
适应多语言ASR模型,以处理多个说话人
实时多人会话的语音识别-微软首席应用科学家-陈卓
基于自监督学习的高性能鲁棒说话人识别-钱彦旻
基于距离的权重转移,用于从近场到远场的说话人验证模型的微调