V
主页
京东 11.11 红包
Panel :语音技术新时代
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
Sherpa:新一代 Kaldi 部署框架
【Wenet语音识别】功能架构和模型结构
【语音之家】AI产业沙龙—语音技术在贝壳的应用
【语音之家】 AI技术沙龙- -语音合成
ModelScope语音开源现状和语音语义多模态大模型研究进展 张仕良
语音之家公开课 —《WeNet语音识别实战》课程交流
【语音之家】AI产业沙龙—京东在AI语音方向的技术探索与实践
【语音之家】AI产业沙龙—如何应用k2开发语音识别系统
【语音之家公开课】表现力语音与歌唱合成
Daniel Povey|Zipformer:一种改进的语音识别编码器
多说话人交互场景中的目标说话人提取
TFCNet:用于语音分离的时频域校正网络
复杂声学场景下基于复数谱的语音增强和去混技术研究
动手体验语音AI开发利器 - NVIDIA NeMo代码实战
【语音之家】AI产业沙龙—智能语音技术在美团的应用实践
交互式AI中语音技术实践与探索-万玉龙
基于序列胶囊网络的语音情感识别
开源语音识别利器——NVIDIA NEMO
【语音之家】AI产业沙龙——腾讯会议背后的语音技术
【语音之家】AI产业沙龙—视频译制场景中的语音翻译、语音合成和唇形生成技术
【语音之家】AI产业沙龙 —解读火山语音团队在国际顶会ACL2023的创新突破
2022年声纹识别研究与应用学术研讨会
西工大-大象声科个性化语音增强系统
Kaldi中的神经网络
实时多人会话的语音识别-微软首席应用科学家-陈卓
2021 SpeechHome 语音技术研讨会
基于自然语言描述的跨说话人语音风格转换
圆桌:语音开源技术 张仕良 张彬彬 康魏
用于实时多通道语音增强的因果U-Net神经波束形成网络
利用语音和双语文本联合预训练的语音到语音翻译模型
面向复杂场景的说话人日志
【语音之家】AI产业沙龙—智能语音技术在智能客服的落地实践
声纹识别与语音防伪技术前沿及工作进展
【语音之家】AI产业沙龙 —— 三星语言智能团队ICASSP2023论文分享会
2021年声纹识别研究与应用学术研讨会
VISinger:高保真端到端歌声合成模型
Kaldi之父 Daniel-Povey亲述:K2的最新进展和即将展开的工作
适应多语言ASR模型,以处理多个说话人
用于多通道语音分离的声源二维位置感知全神经波束模型
说话人识别模型的可解释性-王东