Panel ：语音技术新时代 - 视频下载 Video Downloader

京东 11.11 红包

Panel ：语音技术新时代

发布人

打开封面下载高清视频观看高清视频视频下载器

Sherpa:新一代 Kaldi 部署框架

【Wenet语音识别】功能架构和模型结构

【语音之家】AI产业沙龙—语音技术在贝壳的应用

【语音之家】 AI技术沙龙- -语音合成

ModelScope语音开源现状和语音语义多模态大模型研究进展张仕良

语音之家公开课 —《WeNet语音识别实战》课程交流

【语音之家】AI产业沙龙—京东在AI语音方向的技术探索与实践

【语音之家】AI产业沙龙—如何应用k2开发语音识别系统

【语音之家公开课】表现力语音与歌唱合成

Daniel Povey|Zipformer:一种改进的语音识别编码器

多说话人交互场景中的目标说话人提取

TFCNet：用于语音分离的时频域校正网络

复杂声学场景下基于复数谱的语音增强和去混技术研究

动手体验语音AI开发利器 - NVIDIA NeMo代码实战

【语音之家】AI产业沙龙—智能语音技术在美团的应用实践

交互式AI中语音技术实践与探索-万玉龙

基于序列胶囊网络的语音情感识别

开源语音识别利器——NVIDIA NEMO

【语音之家】AI产业沙龙——腾讯会议背后的语音技术

【语音之家】AI产业沙龙—视频译制场景中的语音翻译、语音合成和唇形生成技术

【语音之家】AI产业沙龙 —解读火山语音团队在国际顶会ACL2023的创新突破

2022年声纹识别研究与应用学术研讨会

西工大-大象声科个性化语音增强系统

Kaldi中的神经网络

实时多人会话的语音识别-微软首席应用科学家-陈卓

2021 SpeechHome 语音技术研讨会

基于自然语言描述的跨说话人语音风格转换

圆桌：语音开源技术张仕良张彬彬康魏

用于实时多通道语音增强的因果U-Net神经波束形成网络

利用语音和双语文本联合预训练的语音到语音翻译模型

面向复杂场景的说话人日志

【语音之家】AI产业沙龙—智能语音技术在智能客服的落地实践

声纹识别与语音防伪技术前沿及工作进展

【语音之家】AI产业沙龙 —— 三星语言智能团队ICASSP2023论文分享会

2021年声纹识别研究与应用学术研讨会

VISinger：高保真端到端歌声合成模型

Kaldi之父 Daniel-Povey亲述：K2的最新进展和即将展开的工作

适应多语言ASR模型，以处理多个说话人

用于多通道语音分离的声源二维位置感知全神经波束模型

说话人识别模型的可解释性-王东