【语音识别】语音文件分析 - 视频下载 Video Downloader

【语音识别】语音文件分析

发布人

厦门大学副教授洪青阳老师，详细讲解了语音文件分析！
关注微信公众号：【语音之家工匠学堂】，获取更多AI语音相关课程！
https://www.bilibili.com/video/BV1Ma411Q7pn?spm_id_from=333.999.0.0&amp;vd_source=ff4169c1b7796694fe777a06eb6084ab
https://www.bilibili.com/video/BV1ZN4y1K7uK?spm_id_from=333.999.0.0&amp;vd_source=ff4169c1b7796694fe777a06eb6084ab

打开封面下载高清视频观看高清视频视频下载器

【语音识别】语音的采样与量化

【语音识别】声学特征提取

ModelScope语音开源现状和语音语义多模态大模型研究进展张仕良

Daniel Povey|Zipformer:一种改进的语音识别编码器

Whisper终结者：Reverb ASR 语音识别和说话人分离方面新标杆在前所未有的20万小时人工转录数据上进行训练支持可定制的逐字转录

多通道、多人及非基于声纹编码向量的特定人语音抽取-李明

【语音识别入门】语音识别问题

【语音识别】GigaSpeech 数据集简介陈果果

基于序列胶囊网络的语音情感识别

语音之家公开课 —《语音识别服务实战》交流

圆桌：音频与大模型（欧智坚何磊钱彦旻易江燕栾剑张超）

基于多目标渐进聚类的半监督说话人识别域自适应

【大模型】认知导向的视听觉大语言模型

【语音之家】AI产业沙龙—语音技术在国音智能的应用

多说话人交互场景中的目标说话人提取

基于跨模态对齐的从语音到歌声转换-李瑞琪火山语音

基于音频辨别的对比学习在连续语音中的可定制关键词检测

【语音之家】AI产业沙龙—如何应用k2开发语音识别系统

【声纹识别入门】声纹识别系统的评价指标-基于语音对的实现方法

音乐和音频数据的学习方法-Emmanouil-BENETOS

利用文本-语音对比学习提出针对语音合成的韵律文本表征-叶振辉（火山语音）

以目标语音识别为例，弱监督语音预训练

【声纹识别】什么是声纹识别？声纹识别发展历程怎样？

【闲话AI】语音识别的发展陈果果

入门语音合成，听这个课真的可以哦

【闲话AI】语音识别发展史

语音之家公开课 — 语音分离的神经网络方法 Speech Separation with Neural Network（邹月娴）

多语言和代码转换语音识别的语言路由专家混合

利用基于帧级跨模态注意力的音视频Confomer的鲁棒音视频唤醒词识别

AlSHELL-Turbo：多模态AI模型数据集

【0基础】语音的感知与产生

【课程推荐】kaldi语音识别实战 | 0基础适用

【实操】通过NVIDIA NEMO 训练语音AI模型（上）

将子词发音与唇形联合嵌入感知视听语音增强

什么是语音增强？语音识别？语音合成？智能语音技术的前沿与发展（2/6）

结合视觉信息的端到端语音翻译-任意火山语音

面向所有语音任务的通用语音模型-李宏毅(Hung-yi-LEE)

【语音之家】AI产业沙龙—智能语音技术在智能客服的落地实践

基于自然语言描述的跨说话人语音风格转换

基于特征选择和文本嵌入的自发性粤语痴呆检测