V
主页
多通道声信号感知与处理:原理、现状与挑战 陈景东 西北工业大学
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
Whisper终结者:Reverb ASR 语音识别和说话人分离方面新标杆 在前所未有的20万小时人工转录数据上进行训练 支持可定制的逐字转录
多通道、多人及非基于声纹编码向量的特定人语音抽取-李明
西工大ASLP实验室语音生成模型新进展-西北工业大学谢磊老师
自定义语音唤醒中的关键词自适应声学模型剪枝
现代数字信号处理II【中科院大学·研究生课程】
【台大李宏毅】公开课 迈向语音版ChatGPT
在 MATLAB 和 Python 中解决的信号处理问题
语音识别基础:从声音到语音
【MATLAB论文复现】研一研二必看!MATLAB论文如何从代码到公式完整复现?看完这个你就彻底懂了!草履虫都能学会!
【音乐与音频处理】在学术计算规模上再现大型预训练语音模型-Shinji-WATANABE
圆桌:音频与大模型(欧智坚 何磊 钱彦旻 易江燕 栾剑 张超)
ICASSP 2023 论文预讲会 第七期 西北工业大学音频语音与语言处理研究组(NPU-ASLP)专场(上)
2022年声纹识别研究与应用学术研讨会
基于预训练的伪造语音检测研究进展-张鹏远
2024吹爆【斯坦福出版】人工智能导论 我在B站上大学!
【语音合成】Tacotron-2 的实现实战 试听
ICASSP 2023 论文预讲会 第八期 西北工业大学音频语音与语言处理研究组(NPU-ASLP)专场(下)
交互式AI中语音技术实践与探索-万玉龙
ModelScope语音开源现状和语音语义多模态大模型研究进展 张仕良
ESPnet-SE开源工具介绍-钱彦旻 上海交通大学
ICASSP 2023 论文预讲会 第一期 清华大学语音与音频技术实验室专场
2021 SpeechHome 语音技术研讨会
多说话人交互场景中的目标说话人提取
【声纹识别入门】ASV-Subtools工具 特征提取
【语音之家】AI技术沙龙-声纹识别
基于音频辨别的对比学习在连续语音中的可定制关键词检测
三角形薄板共振低频陷阱吸声测试,74Hz直减10dB
适应多语言ASR模型,以处理多个说话人
卷积的可视化
【聘】语音合成算法研究员 计算机、信号处理等专业硕士 上海
面向神经声码器训练的一种合成语料生成方法
揭秘DeepShip:水声识别领域的突破性数据集 大规模的真实世界水下录音数据集
西北工业大学矩阵论2-3
【双语字幕】比尔·盖茨谈 AI、医学、能源与教育
复杂场景下鲁棒伪造音检测及变声溯源-李明
【实操】通过NVIDIA NEMO 训练语音AI模型(上)
【2024完整版-麻省理工-线性代数】全34讲+配套教材
【科普】语音识别分类大科普!你真的知道所有语音识别分类吗?
基于跨模态对齐的从语音到歌声转换-李瑞琪 火山语音
Sherpa:新一代 Kaldi 部署框架