V
主页
京东 11.11 红包
多通道声源定位
发布人
多通道声源定位by Yanjie Fu TDOA estimation using DNN The cone of silence:speech separation by Localization
打开封面
下载高清视频
观看高清视频
视频下载器
声源定位
单通道声源定位
麦克风阵列语音增强
LiJian-kaldi搭建在线语音识别系统
【赞】2021.3.14 鸡尾酒会问题及解决方案思考-by Ge Meng
2020.08.09 基于麦克风阵列的语音增强方法研究-by Guanjun Li
多通道语音增强
强烈推荐!语音识别全套教程!恨不得马上就学会的语音识别技术!谷歌“万能”语音识别大模型USM、OpenAI、语音分离、语音合成、变声器
2020.9.6 基于滤波器组(多子带)的语音信号处理 -by Li Nan
多通道语音增强
2022.2.24 回声消除(AEC)论文分享
2020.11.22 关于语音信号处理论文分享 - by Li Nan
Whisper终结者:Reverb ASR 语音识别和说话人分离方面新标杆 在前所未有的20万小时人工转录数据上进行训练 支持可定制的逐字转录
基于faster_whisper的实时语音识别 | 可对接大模型的实时语音识别 | 实时语音识别 | 一句话识别
[精品] 如何读好研究生?shared by 河北工业大学杨亮老师
声源定位by caorui
faster_whisper对接大模型进行语音对话 | 人机对话 | 语音识别 | 大模型 | faster whisper实时语音识别 | 实时语音识别
语音识别转文字软件faster-whisper整合包下载,免费语音转文字工具
2020.07.01 Yi Luo-端到端声源分离研究进展
2020.6.21 在噪声环境下语音分离论文分享-by Luya
多通道语分离/增强文章分享会 --努尔艾力·阿力甫
自动化转写 | 自动化语音识别 | 对直播录屏自动化生成字幕 | 大模型总结视频内容
我实现了语音流式转录翻译!(win11实时字幕+Luna Translator hook)
2020.7.5 ASR论文分享-by XiaoJie
Neural Spatial Filter - Yanjie Fu
Consistency Constraints & Distortion Controlling for Separation - Yanjie Fu
2020.6.28 多通道论文分享-by JiangYu
On the Compensation Between Magnitude and Phase in Speech Separation - Rui Cao
论文分享(DNN for Multiple Speaker Detection and Localization)
基于faster_whisper的实时语音识别改进版 | whisper中出现繁体中文的解决方法 | 语音识别中繁体转简体 | OpenCC
2021.1.31 code-switching ASR -by tongtong
【SenseVoice】一键包 阿里开源语音识别 高精度、多语言、情感辨识和音频事件检测
DNS challenge 论文分享 - Junjie Li
2020.9.6 AVDataset(LRS2 & AVSpeech)介绍-by Junjie
Improve Online Speech Separation System - zhongjian Cui
降低方差的语音分离
EEG using VAE - Yunye Feng
多通道语音增强
Analyzing the impact of speech enhancement errors on ASR - Rui Cao
Audio-visual separation By JunjieLi