V
主页
基于序列到序列预测的特定人语音活动检测
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
Sherpa:新一代 Kaldi 部署框架
基于热词短语预测网络的热词语音识别
基于混合预测编码与知识蒸馏的双模语音转换模型
通过声音事件检测增强音频描述中的时间关系
WeNet开源社区最新进展
多通道、多人及非基于声纹编码向量的特定人语音抽取-李明
ModelScope魔搭社区及其开源的语音AI模型
少走99%的弯路!0基础快速入门语音识别
用于实时多通道语音增强的因果U-Net神经波束形成网络
利用位置相关的局部-全局依赖进行合成语音检测
什么是语音信号?
基于多任务学习的异常感知的内群点建模及多尺度的异常值打分
【清华】从0开始学Kaldi,丝滑入门语音识别,语音识别原来如此简单
声纹识别与语音防伪技术前沿及工作进展
【音乐与音频处理】在学术计算规模上再现大型预训练语音模型-Shinji-WATANABE
音频生成-王文武
圆桌:音频与大模型(欧智坚 何磊 钱彦旻 易江燕 栾剑 张超)
【语音之家】AI产业沙龙—智能语音技术在美团的应用实践
MARBLE:通用评价的音乐音频表现基准-马英浩(Yinghao-MA)
深度生成固定滤波器的有源噪声控制
基于GAN的无监督机器音频异常检测与定位
【闲话AI】语音识别的发展 陈果果
基于预训练的伪造语音检测研究进展-张鹏远
自定义语音唤醒中的关键词自适应声学模型剪枝
基于自然语言描述的跨说话人语音风格转换
针对部分篡改音频的波形边界检测系统
说话人识别中的Hard Trials初步探索
【科普】语音识别评估方法
结合视觉信息的端到端语音翻译-任意 火山语音
感知难度的说话人识别数据增强
西工大-大象声科个性化语音增强系统
Trimtail:语音识别延迟优化中的暴利美学
多说话人语音识别中可感知边界的序列化输出训练
CMNet:探索声学回声消除中目标正面和目标负面负面的相关性
【声纹识别】什么是声纹识别?声纹识别发展历程怎样?
基于跨模态对齐的从语音到歌声转换-李瑞琪 火山语音
Daniel Povey|Zipformer:一种改进的语音识别编码器
【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍
面向有声读物合成的上下文感知连贯性说话风格预测方法
京东智能语音交互技术进展及应用