V
主页
【声纹识别入门】声纹技术就是声纹识别吗?
发布人
视频内容节选自王泉老师《声纹识别与音频处理》实战课https://xjw.xet.tech/s/24qeal 从最基本的声学基础和音频信号处理开始介绍,学习声纹识别技术中的基本概念和核心算法,深入理解语音和声纹的本质,所以即使是没有任何语音方面基础的同学,也可以从熟悉相关工具和代码库的使用,到实际动手搭建声纹识别系统。
打开封面
下载高清视频
观看高清视频
视频下载器
【声纹识别入门】ASV-Subtools工具runtime实现-frontend
【声纹识别入门】ASV-Subtools工具 特征提取
【声纹识别入门】损失函数的设计方法
【声纹识别入门】声纹识别系统的评价指标-基于语音对的实现方法
【Wenet语音识别】预训练模型-流式和非流式模型
【声纹识别入门】什么是短时分析(Short Time Analysis)?
【秒懂】语音识别是什么
【语音识别】声学特征提取
【声纹识别入门】ASV-Subtools工具 音素标签获取-特征提取
【声纹识别入门】ASV-Subtools工具 迁移学习的核心代码
声纹识别与语音防伪技术前沿及工作进展
基于conformer的热词增强方法
Whisper终结者:Reverb ASR 语音识别和说话人分离方面新标杆 在前所未有的20万小时人工转录数据上进行训练 支持可定制的逐字转录
入门语音合成,听这个课真的可以哦
【语音合成】什么是语音合成?
ReFlow-TTS:一个用于高保真的文本到语音的校正流模型
4块GPU、不到3天训练出「开源版GPT-4o」 基于LLaMA-3.1-8B,羊驼家族再添大将,实现低延迟/高质量的语音互动
多通道声信号感知与处理:原理、现状与挑战 陈景东 西北工业大学
什么是语音信号?
语音识别基础:从声音到语音
声纹识别可视化研究分析
基于音频辨别的对比学习在连续语音中的可定制关键词检测
通过特征解纠缠技术进行跨城市和设备的声学场景分类
仅需40个Token,高质量重建音频
超划算的语音课程,确定不来了解下?
【声纹识别入门】数据增强(wav层面)
【语音之家】AI技术沙龙-声纹识别
自定义语音唤醒中的关键词自适应声学模型剪枝
【Wenet语音识别】Transformer和Conformer
【声纹识别入门】ASV-Subtools工具 损失函数
基于语音识别预训练的说话人识别方法
RaD-Net:一种用于语音信号改善的修复与降噪网络
Kaldi安装与样例流程介绍
【声纹识别入门】ASV-Subtools工具 数据合并 & vad计算
HIMIA-预训练(测试集)
一种端到端脑电图通道选择的脑辅助语音增强方法
说话人识别模型的可解释性-王东
利用基于帧级跨模态注意力的音视频Confomer的鲁棒音视频唤醒词识别
声纹识别工具ASV-Subtools-江涛
复杂声学场景下基于复数谱的语音增强和去混技术研究