V
主页
【语音识别】语音文件分析
发布人
厦门大学副教授洪青阳老师,详细讲解了语音文件分析! 关注微信公众号:【语音之家工匠学堂】,获取更多AI语音相关课程! https://www.bilibili.com/video/BV1Ma411Q7pn?spm_id_from=333.999.0.0&vd_source=ff4169c1b7796694fe777a06eb6084ab https://www.bilibili.com/video/BV1ZN4y1K7uK?spm_id_from=333.999.0.0&vd_source=ff4169c1b7796694fe777a06eb6084ab
打开封面
下载高清视频
观看高清视频
视频下载器
【语音识别】语音的采样与量化
【语音识别】声学特征提取
ModelScope语音开源现状和语音语义多模态大模型研究进展 张仕良
Daniel Povey|Zipformer:一种改进的语音识别编码器
Whisper终结者:Reverb ASR 语音识别和说话人分离方面新标杆 在前所未有的20万小时人工转录数据上进行训练 支持可定制的逐字转录
多通道、多人及非基于声纹编码向量的特定人语音抽取-李明
【语音识别入门】语音识别问题
【语音识别】GigaSpeech 数据集 简介 陈果果
基于序列胶囊网络的语音情感识别
语音之家公开课 —《语音识别服务实战》交流
圆桌:音频与大模型(欧智坚 何磊 钱彦旻 易江燕 栾剑 张超)
基于多目标渐进聚类的半监督说话人识别域自适应
【大模型】认知导向的视听觉大语言模型
【语音之家】AI产业沙龙—语音技术在国音智能的应用
多说话人交互场景中的目标说话人提取
基于跨模态对齐的从语音到歌声转换-李瑞琪 火山语音
基于音频辨别的对比学习在连续语音中的可定制关键词检测
【语音之家】AI产业沙龙—如何应用k2开发语音识别系统
【声纹识别入门】声纹识别系统的评价指标-基于语音对的实现方法
音乐和音频数据的学习方法-Emmanouil-BENETOS
利用文本-语音对比学习提出针对语音合成的韵律文本表征-叶振辉(火山语音)
以目标语音识别为例,弱监督语音预训练
【声纹识别】什么是声纹识别?声纹识别发展历程怎样?
【闲话AI】语音识别的发展 陈果果
入门语音合成,听这个课真的可以哦
【闲话AI】语音识别发展史
语音之家公开课 — 语音分离的神经网络方法 Speech Separation with Neural Network(邹月娴)
多语言和代码转换语音识别的语言路由专家混合
利用基于帧级跨模态注意力的音视频Confomer的鲁棒音视频唤醒词识别
AlSHELL-Turbo:多模态AI模型数据集
【0基础】语音的感知与产生
【课程推荐】kaldi语音识别实战 | 0基础适用
【实操】通过NVIDIA NEMO 训练语音AI模型(上)
将子词发音与唇形联合嵌入感知视听语音增强
什么是语音增强?语音识别?语音合成?智能语音技术的前沿与发展(2/6)
结合视觉信息的端到端语音翻译-任意 火山语音
面向所有语音任务的通用语音模型-李宏毅(Hung-yi-LEE)
【语音之家】AI产业沙龙—智能语音技术在智能客服的落地实践
基于自然语言描述的跨说话人语音风格转换
基于特征选择和文本嵌入的自发性粤语痴呆检测