V
主页
SH-SSS丨CUSIDE:分块、模拟未来、解码的流式语音识别新框架 — 安柯宇
发布人
SH Symposium Series on Speech (SH SSS 2022) 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台。 来自AI语音技术领域的优秀论文作者、专家学者,用最精炼的表达来解读最新的高质量论文。
打开封面
下载高清视频
观看高清视频
视频下载器
【Wenet语音识别】预训练模型-流式和非流式模型
【秒懂】语音识别是什么
Sherpa:新一代 Kaldi 部署框架
【Wenet语音识别】功能架构和模型结构
【语音识别】声学特征提取
SH-SSS丨端到端音视频说话人日志网络 — 何茂奎
SH-SSS丨跨年龄声纹识别:学习年龄不变的说话人特征 — 覃晓逸
【Wenet语音识别】环境配置
SH-SSS丨从人设到音色——基于说话人属性特征的语音合成 — 杨智涵
【秒懂】智能语音技术范畴
语音之家公开课 —《AISHELL-1 语音识别实战》课程交流
论文解读丨CUSIDE:分块、模拟未来、解码的流式语音识别新框架 -结论
SH-SSS丨面向有声读物的跨说话人语音风格迁移 — 李翔
论文解读丨CUSIDE:分块、模拟未来、解码的流式语音识别新框架 -实验设置
开源语音识别工具wenet 简介 张彬彬
【语音之家】AI产业沙龙—语音技术在国音智能的应用
论文解读丨CUSIDE:分块、模拟未来、解码的流式语音识别新框架 -方法介绍
SH-SSS丨ISSD: 基于迭代式语音分离的说话人日志系统 — 牛树同
语音之家公开课 —《语音识别服务实战》交流
【语音之家】AI产业沙龙——语音&音乐技术在字节跳动平台的应用
【语音之家】AI产业沙龙——站在未来思考下一代人工智能基础框架
SH-SSS丨JSA-TOD:一种新型半监督对话系统,20%标注即接近全监督效果 — 蔡予诚
【实操】使用wenet搭建云端语音识别系统
论文解读丨CUSIDE:分块、模拟未来、解码的流式语音识别新框架 -简介
【清华】从0开始学Kaldi,丝滑入门语音识别,语音识别原来如此简单
圆桌:语音开源技术 张仕良 张彬彬 康魏
【语音】现代语音识别框架|公式出没,非战斗人员迅速撤离!
【科普】语音识别分类大科普!你真的知道所有语音识别分类吗?
Daniel Povey|Zipformer:一种改进的语音识别编码器
【语音之家】AI产业沙龙—AI语音赋能产业数字化新场景
语音之家公开课 —《WeNet语音识别实战》课程交流
【入门语音识别】WFST理论
语音之家公开课 — 音频模式识别(秦勇教授)
【Wenet语音识别】Transformer和Conformer
基于Transducer的流式自适应热词语音识别
【语音之家】AI技术沙龙—语音增强
开源语音识别工具WeNet,从入门到精通
【语音之家】AI产业沙龙—腾讯AI Lab语音技术进展分享报告
论文解读丨CUSIDE:分块、模拟未来、解码的流式语音识别新框架 -相关工作
Panel :语音技术新时代