V
主页
基于自监督学习前端特征的通用歌唱语音语种识别方法
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
基于语音预训练模型的无监督说话人识别方法-李琳
跨语种的语音转换-武执正
说话人识别模型的可解释性-王东
Kaldi安装与样例流程介绍
具有目标说话人吸引子的端到端神经说话人分类的基于注意力的编解码器网络
端到端语音到语音翻译中的零样本风格迁移
【清华】从0开始学Kaldi,丝滑入门语音识别,语音识别原来如此简单
语音之家公开课 — 音频模式识别(秦勇教授)
【语音之家公开课】表现力语音与歌唱合成
【科普】语音识别分类大科普!你真的知道所有语音识别分类吗?
【科普】语音识别评估方法
基于语音噪声双流谱改善网络使用语音失真损失函数的鲁棒语音识别
基于新一代kaldi项目的语音识别应用实例-郭理勇 小米
都开第三期了!广受好评的端到端语音识别实战课
基于距离的权重转移,用于从近场到远场的说话人验证模型的微调
基于热词短语预测网络的热词语音识别
用于语音情感识别的多尺度时空Transformer模型
Panel :语音技术新时代
【语音之家】AI产业沙龙—京东在AI语音方向的技术探索与实践
基于多通道训练和交叉信息融合的低资源端到端口音识别
基于GAN的无监督机器音频异常检测与定位
【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍
基于自然语言描述的跨说话人语音风格转换
多说话人语音识别中可感知边界的序列化输出训练
跨语言语音识别中基于联合语音表征学习的音素到词转码器
适应多语言ASR模型,以处理多个说话人
基于自监督学习的高性能鲁棒说话人识别-钱彦旻
【揭秘】人工智能变人工智障?准确的语音识别为何这么难?
实时多人会话的语音识别-微软首席应用科学家-陈卓
在说话人验证中识别基于语音转换欺诈攻击的源说话人
多分辨率频率编码器和解码器辅助的时域语音增强
Daniel Povey|Zipformer:一种改进的语音识别编码器
ICASSP 2023 论文预讲会 第九期 天津大学天津市认知计算与应用重点实验室专场
域移下异常声音检测的分层元数据信息约束自监督学习
【闲话AI】语音识别发展史
多说话人交互场景中的目标说话人提取
【语音之家】AI产业沙龙——语音&音乐技术在字节跳动平台的应用
通过NVIDIA NEMO 训练语音AI模型(下)
声音成分分析及其下游应用
复杂声学场景下基于复数谱的语音增强和去混技术研究