基于序列到序列预测的特定人语音活动检测 - 视频下载 Video Downloader

基于序列到序列预测的特定人语音活动检测

发布人

打开封面下载高清视频观看高清视频视频下载器

Sherpa:新一代 Kaldi 部署框架

基于热词短语预测网络的热词语音识别

基于混合预测编码与知识蒸馏的双模语音转换模型

通过声音事件检测增强音频描述中的时间关系

WeNet开源社区最新进展

多通道、多人及非基于声纹编码向量的特定人语音抽取-李明

ModelScope魔搭社区及其开源的语音AI模型

少走99%的弯路！0基础快速入门语音识别

用于实时多通道语音增强的因果U-Net神经波束形成网络

利用位置相关的局部-全局依赖进行合成语音检测

什么是语音信号？

基于多任务学习的异常感知的内群点建模及多尺度的异常值打分

【清华】从0开始学Kaldi，丝滑入门语音识别，语音识别原来如此简单

声纹识别与语音防伪技术前沿及工作进展

【音乐与音频处理】在学术计算规模上再现大型预训练语音模型-Shinji-WATANABE

音频生成-王文武

圆桌：音频与大模型（欧智坚何磊钱彦旻易江燕栾剑张超）

【语音之家】AI产业沙龙—智能语音技术在美团的应用实践

MARBLE:通用评价的音乐音频表现基准-马英浩(Yinghao-MA)

深度生成固定滤波器的有源噪声控制

基于GAN的无监督机器音频异常检测与定位

【闲话AI】语音识别的发展陈果果

基于预训练的伪造语音检测研究进展-张鹏远

自定义语音唤醒中的关键词自适应声学模型剪枝

基于自然语言描述的跨说话人语音风格转换

针对部分篡改音频的波形边界检测系统

说话人识别中的Hard Trials初步探索

【科普】语音识别评估方法

结合视觉信息的端到端语音翻译-任意火山语音

感知难度的说话人识别数据增强

西工大-大象声科个性化语音增强系统

Trimtail：语音识别延迟优化中的暴利美学

多说话人语音识别中可感知边界的序列化输出训练

CMNet：探索声学回声消除中目标正面和目标负面负面的相关性

【声纹识别】什么是声纹识别？声纹识别发展历程怎样？

基于跨模态对齐的从语音到歌声转换-李瑞琪火山语音

Daniel Povey|Zipformer:一种改进的语音识别编码器

【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍

面向有声读物合成的上下文感知连贯性说话风格预测方法

京东智能语音交互技术进展及应用