【闲话AI】什么是自动语音识别？ - 视频下载 Video Downloader

【闲话AI】什么是自动语音识别？

发布人

打开封面下载高清视频观看高清视频视频下载器

开源语音识别工具wenet 简介张彬彬

【秒懂】智能语音技术范畴

【清华】从0开始学Kaldi，丝滑入门语音识别，语音识别原来如此简单

【Wenet语音识别】功能架构和模型结构

基于新一代kaldi项目的语音识别应用实例-郭理勇小米

【语音识别】GigaSpeech 数据集简介陈果果

【闲话AI】语音识别发展史

【揭秘】人工智能变人工智障？准确的语音识别为何这么难？

基于语音识别预训练的说话人识别方法

【语音之家】AI产业沙龙——智能对话平台

跨语言语音识别中基于联合语音表征学习的音素到词转码器

什么是语音信号？

【Wenet语音识别】环境配置

【语音识别】GMM-HMM训练和解码

【干货】语音识别入门有哪些值得推荐的书籍论文及开源库

【语音之家】AI产业沙龙—语音技术在贝壳的应用

【实操】使用wenet搭建云端语音识别系统

【语音之家】 AI技术沙龙- -语音合成

ICASSP 2023 论文预讲会第八期西北工业大学音频语音与语言处理研究组（NPU-ASLP）专场（下）

【语音之家】AI产业沙龙—AI语音赋能产业数字化新场景

Sherpa:新一代 Kaldi 部署框架

喜马拉雅语音识别技术和应用介绍

用于语音情感识别的多尺度时空Transformer模型

【入门语音识别】WFST理论

开源语音和 wenet-e2e 社区

都开第三期了！广受好评的端到端语音识别实战课

MLCA-AVSR：基于多层交叉注意力融合的视听语音识别

ModelScope魔搭社区及其开源的语音AI模型

基于特征选择和文本嵌入的自发性粤语痴呆检测

多说话人语音识别中可感知边界的序列化输出训练

Trimtail：语音识别延迟优化中的暴利美学

面向会议的对话语音识别

【语音之家】AI产业沙龙——腾讯会议背后的语音技术

kaldi语音识别：GMM训练

【Wenet语音识别】实时长语音听写

ModelScope语音开源现状和语音语义多模态大模型研究进展张仕良

音频生成-王文武

Panel ：语音技术新时代

跨语种的语音转换-武执正

开源语音识别工具WeNet，从入门到精通