V
主页
【闲话AI】什么是自动语音识别?
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
开源语音识别工具wenet 简介 张彬彬
【秒懂】智能语音技术范畴
【清华】从0开始学Kaldi,丝滑入门语音识别,语音识别原来如此简单
【Wenet语音识别】功能架构和模型结构
基于新一代kaldi项目的语音识别应用实例-郭理勇 小米
【语音识别】GigaSpeech 数据集 简介 陈果果
【闲话AI】语音识别发展史
【揭秘】人工智能变人工智障?准确的语音识别为何这么难?
基于语音识别预训练的说话人识别方法
【语音之家】AI产业沙龙——智能对话平台
跨语言语音识别中基于联合语音表征学习的音素到词转码器
什么是语音信号?
【Wenet语音识别】环境配置
【语音识别】GMM-HMM训练和解码
【干货】语音识别入门有哪些值得推荐的书籍论文及开源库
【语音之家】AI产业沙龙—语音技术在贝壳的应用
【实操】使用wenet搭建云端语音识别系统
【语音之家】 AI技术沙龙- -语音合成
ICASSP 2023 论文预讲会 第八期 西北工业大学音频语音与语言处理研究组(NPU-ASLP)专场(下)
【语音之家】AI产业沙龙—AI语音赋能产业数字化新场景
Sherpa:新一代 Kaldi 部署框架
喜马拉雅语音识别技术和应用介绍
用于语音情感识别的多尺度时空Transformer模型
【入门语音识别】WFST理论
开源语音和 wenet-e2e 社区
都开第三期了!广受好评的端到端语音识别实战课
MLCA-AVSR:基于多层交叉注意力融合的视听语音识别
ModelScope魔搭社区及其开源的语音AI模型
基于特征选择和文本嵌入的自发性粤语痴呆检测
多说话人语音识别中可感知边界的序列化输出训练
Trimtail:语音识别延迟优化中的暴利美学
面向会议的对话语音识别
【语音之家】AI产业沙龙——腾讯会议背后的语音技术
kaldi语音识别:GMM训练
【Wenet语音识别】实时长语音听写
ModelScope语音开源现状和语音语义多模态大模型研究进展 张仕良
音频生成-王文武
Panel :语音技术新时代
跨语种的语音转换-武执正
开源语音识别工具WeNet,从入门到精通