【声纹识别入门】声纹技术就是声纹识别吗？ - 视频下载 Video Downloader

【声纹识别入门】声纹技术就是声纹识别吗？

发布人

视频内容节选自王泉老师《声纹识别与音频处理》实战课https://xjw.xet.tech/s/24qeal
从最基本的声学基础和音频信号处理开始介绍，学习声纹识别技术中的基本概念和核心算法，深入理解语音和声纹的本质，所以即使是没有任何语音方面基础的同学，也可以从熟悉相关工具和代码库的使用，到实际动手搭建声纹识别系统。

打开封面下载高清视频观看高清视频视频下载器

【声纹识别入门】ASV-Subtools工具runtime实现-frontend

【声纹识别入门】ASV-Subtools工具特征提取

【声纹识别入门】损失函数的设计方法

【声纹识别入门】声纹识别系统的评价指标-基于语音对的实现方法

【Wenet语音识别】预训练模型-流式和非流式模型

【声纹识别入门】什么是短时分析（Short Time Analysis）？

【秒懂】语音识别是什么

【语音识别】声学特征提取

【声纹识别入门】ASV-Subtools工具音素标签获取-特征提取

【声纹识别入门】ASV-Subtools工具迁移学习的核心代码

声纹识别与语音防伪技术前沿及工作进展

基于conformer的热词增强方法

Whisper终结者：Reverb ASR 语音识别和说话人分离方面新标杆在前所未有的20万小时人工转录数据上进行训练支持可定制的逐字转录

入门语音合成，听这个课真的可以哦

【语音合成】什么是语音合成？

ReFlow-TTS：一个用于高保真的文本到语音的校正流模型

4块GPU、不到3天训练出「开源版GPT-4o」基于LLaMA-3.1-8B，羊驼家族再添大将，实现低延迟/高质量的语音互动

多通道声信号感知与处理:原理、现状与挑战陈景东西北工业大学

什么是语音信号？

语音识别基础：从声音到语音

声纹识别可视化研究分析

基于音频辨别的对比学习在连续语音中的可定制关键词检测

通过特征解纠缠技术进行跨城市和设备的声学场景分类

仅需40个Token，高质量重建音频

超划算的语音课程，确定不来了解下？

【声纹识别入门】数据增强（wav层面）

【语音之家】AI技术沙龙-声纹识别

自定义语音唤醒中的关键词自适应声学模型剪枝

【Wenet语音识别】Transformer和Conformer

【声纹识别入门】ASV-Subtools工具损失函数

基于语音识别预训练的说话人识别方法

RaD-Net：一种用于语音信号改善的修复与降噪网络

Kaldi安装与样例流程介绍

【声纹识别入门】ASV-Subtools工具数据合并 & vad计算

HIMIA-预训练（测试集）

一种端到端脑电图通道选择的脑辅助语音增强方法

说话人识别模型的可解释性-王东

利用基于帧级跨模态注意力的音视频Confomer的鲁棒音视频唤醒词识别

声纹识别工具ASV-Subtools-江涛

复杂声学场景下基于复数谱的语音增强和去混技术研究