多通道声信号感知与处理:原理、现状与挑战陈景东西北工业大学 - 视频下载 Video Downloader

多通道声信号感知与处理:原理、现状与挑战陈景东西北工业大学

发布人

打开封面下载高清视频观看高清视频视频下载器

Whisper终结者：Reverb ASR 语音识别和说话人分离方面新标杆在前所未有的20万小时人工转录数据上进行训练支持可定制的逐字转录

多通道、多人及非基于声纹编码向量的特定人语音抽取-李明

西工大ASLP实验室语音生成模型新进展-西北工业大学谢磊老师

自定义语音唤醒中的关键词自适应声学模型剪枝

现代数字信号处理II【中科院大学·研究生课程】

【台大李宏毅】公开课迈向语音版ChatGPT

在 MATLAB 和 Python 中解决的信号处理问题

语音识别基础：从声音到语音

【MATLAB论文复现】研一研二必看！MATLAB论文如何从代码到公式完整复现？看完这个你就彻底懂了！草履虫都能学会！

【音乐与音频处理】在学术计算规模上再现大型预训练语音模型-Shinji-WATANABE

圆桌：音频与大模型（欧智坚何磊钱彦旻易江燕栾剑张超）

ICASSP 2023 论文预讲会第七期西北工业大学音频语音与语言处理研究组（NPU-ASLP）专场（上）

2022年声纹识别研究与应用学术研讨会

基于预训练的伪造语音检测研究进展-张鹏远

2024吹爆【斯坦福出版】人工智能导论我在B站上大学！

【语音合成】Tacotron-2 的实现实战试听

ICASSP 2023 论文预讲会第八期西北工业大学音频语音与语言处理研究组（NPU-ASLP）专场（下）

交互式AI中语音技术实践与探索-万玉龙

ModelScope语音开源现状和语音语义多模态大模型研究进展张仕良

ESPnet-SE开源工具介绍-钱彦旻上海交通大学

ICASSP 2023 论文预讲会第一期清华大学语音与音频技术实验室专场

2021 SpeechHome 语音技术研讨会

多说话人交互场景中的目标说话人提取

【声纹识别入门】ASV-Subtools工具特征提取

【语音之家】AI技术沙龙-声纹识别

基于音频辨别的对比学习在连续语音中的可定制关键词检测

三角形薄板共振低频陷阱吸声测试，74Hz直减10dB

适应多语言ASR模型，以处理多个说话人

卷积的可视化

【聘】语音合成算法研究员计算机、信号处理等专业硕士上海

面向神经声码器训练的一种合成语料生成方法

揭秘DeepShip：水声识别领域的突破性数据集大规模的真实世界水下录音数据集

西北工业大学矩阵论2-3

【双语字幕】比尔·盖茨谈 AI、医学、能源与教育

复杂场景下鲁棒伪造音检测及变声溯源-李明

【实操】通过NVIDIA NEMO 训练语音AI模型（上）

【2024完整版-麻省理工-线性代数】全34讲+配套教材

【科普】语音识别分类大科普！你真的知道所有语音识别分类吗？

基于跨模态对齐的从语音到歌声转换-李瑞琪火山语音

Sherpa:新一代 Kaldi 部署框架