V
主页
【声纹识别入门】数据准备
发布人
节选自《HIMIA声纹识别实战》https://xjw.xet.tech/s/3pHVzU
打开封面
下载高清视频
观看高清视频
视频下载器
【Wenet语音识别】环境配置
【声纹识别入门】ASV-Subtools工具runtime实现-frontend
【声纹识别入门】损失函数的设计方法
【声纹识别入门】ASV-Subtools工具 数据合并 & vad计算
【声纹识别入门】声纹识别系统的评价指标-基于语音对的实现方法
【声纹识别入门】ASV-Subtools工具 迁移学习的核心代码
【声纹识别入门】什么是短时分析(Short Time Analysis)?
【Wenet语音识别】预训练模型-流式和非流式模型
【声纹识别入门】远场说话人识别
【入门语音识别】WFST理论
2022年声纹识别研究与应用学术研讨会
入门语音合成,听这个课真的可以哦
感知难度的说话人识别数据增强
多说话人交互场景中的目标说话人提取
说话人识别模型的可解释性-王东
【唤醒词识别】数据预处理代码
【清华】从0开始学Kaldi,丝滑入门语音识别,语音识别原来如此简单
声纹识别工具ASV-Subtools-江涛
【Wenet语音识别】热词增强在语音识别中的应用
【声纹识别】什么是声纹识别?声纹识别发展历程怎样?
论文解读丨CUSIDE:分块、模拟未来、解码的流式语音识别新框架 -方法介绍
VoxBlink:短视频上的大规模说话人验证数据集
【科普】语音识别分类大科普!你真的知道所有语音识别分类吗?
用对比学习增强流式与非流式模型
基于深度聚类和图网络的声纹识别-何亮、许敏强
域移下异常声音检测的分层元数据信息约束自监督学习
声音成分分析及其下游应用
【语音合成】Tacotron-2 的实现实战 试听
【实操】从零搭建声纹识别框架
【ICASSP】超短注册时间的目标说话人提取模型
【语音识别】声学特征提取
论文解读丨CUSIDE:分块、模拟未来、解码的流式语音识别新框架 -实验设置
【语音识别入门】AISHELL-1数据的介绍和下载
【语音合成】什么是语音合成?
【秒懂】智能语音技术范畴
基于多目标渐进聚类的半监督说话人识别域自适应
基于热词短语预测网络的热词语音识别
【秒懂】语音识别是什么
【语音之家】AI产业沙龙—自动语音识别利器 - NVIDIA NeMo
如何用开源工具实现一个完整的语音识别系统?