【声纹识别入门】数据准备 - 视频下载 Video Downloader

【声纹识别入门】数据准备

发布人

节选自《HIMIA声纹识别实战》https://xjw.xet.tech/s/3pHVzU

打开封面下载高清视频观看高清视频视频下载器

【Wenet语音识别】环境配置

【声纹识别入门】ASV-Subtools工具runtime实现-frontend

【声纹识别入门】损失函数的设计方法

【声纹识别入门】ASV-Subtools工具数据合并 & vad计算

【声纹识别入门】声纹识别系统的评价指标-基于语音对的实现方法

【声纹识别入门】ASV-Subtools工具迁移学习的核心代码

【声纹识别入门】什么是短时分析（Short Time Analysis）？

【Wenet语音识别】预训练模型-流式和非流式模型

【声纹识别入门】远场说话人识别

【入门语音识别】WFST理论

2022年声纹识别研究与应用学术研讨会

入门语音合成，听这个课真的可以哦

感知难度的说话人识别数据增强

多说话人交互场景中的目标说话人提取

说话人识别模型的可解释性-王东

【唤醒词识别】数据预处理代码

【清华】从0开始学Kaldi，丝滑入门语音识别，语音识别原来如此简单

声纹识别工具ASV-Subtools-江涛

【Wenet语音识别】热词增强在语音识别中的应用

【声纹识别】什么是声纹识别？声纹识别发展历程怎样？

论文解读丨CUSIDE：分块、模拟未来、解码的流式语音识别新框架 -方法介绍

VoxBlink:短视频上的大规模说话人验证数据集

【科普】语音识别分类大科普！你真的知道所有语音识别分类吗？

用对比学习增强流式与非流式模型

基于深度聚类和图网络的声纹识别-何亮、许敏强

域移下异常声音检测的分层元数据信息约束自监督学习

声音成分分析及其下游应用

【语音合成】Tacotron-2 的实现实战试听

【实操】从零搭建声纹识别框架

【ICASSP】超短注册时间的目标说话人提取模型

【语音识别】声学特征提取

论文解读丨CUSIDE：分块、模拟未来、解码的流式语音识别新框架 -实验设置

【语音识别入门】AISHELL-1数据的介绍和下载

【语音合成】什么是语音合成？

【秒懂】智能语音技术范畴

基于多目标渐进聚类的半监督说话人识别域自适应

基于热词短语预测网络的热词语音识别

【秒懂】语音识别是什么

【语音之家】AI产业沙龙—自动语音识别利器 - NVIDIA NeMo

如何用开源工具实现一个完整的语音识别系统？