多通道声源定位

发布人

多通道声源定位by Yanjie Fu
TDOA estimation using DNN
The cone of silence:speech separation by Localization

打开封面下载高清视频观看高清视频视频下载器

声源定位

单通道声源定位

麦克风阵列语音增强

LiJian-kaldi搭建在线语音识别系统

【赞】2021.3.14 鸡尾酒会问题及解决方案思考-by Ge Meng

2020.08.09 基于麦克风阵列的语音增强方法研究-by Guanjun Li

多通道语音增强

强烈推荐！语音识别全套教程！恨不得马上就学会的语音识别技术！谷歌“万能”语音识别大模型USM、OpenAI、语音分离、语音合成、变声器

2020.9.6 基于滤波器组（多子带）的语音信号处理 -by Li Nan

多通道语音增强

2022.2.24 回声消除（AEC）论文分享

2020.11.22 关于语音信号处理论文分享 - by Li Nan

Whisper终结者：Reverb ASR 语音识别和说话人分离方面新标杆在前所未有的20万小时人工转录数据上进行训练支持可定制的逐字转录

基于faster_whisper的实时语音识别 | 可对接大模型的实时语音识别 | 实时语音识别 | 一句话识别

[精品] 如何读好研究生？shared by 河北工业大学杨亮老师

声源定位by caorui

faster_whisper对接大模型进行语音对话 | 人机对话 | 语音识别 | 大模型 | faster whisper实时语音识别 | 实时语音识别

语音识别转文字软件faster-whisper整合包下载，免费语音转文字工具

2020.07.01 Yi Luo-端到端声源分离研究进展

2020.6.21 在噪声环境下语音分离论文分享-by Luya

多通道语分离/增强文章分享会 --努尔艾力·阿力甫

自动化转写 | 自动化语音识别 | 对直播录屏自动化生成字幕 | 大模型总结视频内容

我实现了语音流式转录翻译!（win11实时字幕+Luna Translator hook）

2020.7.5 ASR论文分享-by XiaoJie

Neural Spatial Filter - Yanjie Fu

Consistency Constraints & Distortion Controlling for Separation - Yanjie Fu

2020.6.28 多通道论文分享-by JiangYu

On the Compensation Between Magnitude and Phase in Speech Separation - Rui Cao

论文分享（DNN for Multiple Speaker Detection and Localization）

基于faster_whisper的实时语音识别改进版 | whisper中出现繁体中文的解决方法 | 语音识别中繁体转简体 | OpenCC

2021.1.31 code-switching ASR -by tongtong

【SenseVoice】一键包阿里开源语音识别高精度、多语言、情感辨识和音频事件检测

DNS challenge 论文分享 - Junjie Li

2020.9.6 AVDataset(LRS2 & AVSpeech)介绍-by Junjie

Improve Online Speech Separation System - zhongjian Cui

降低方差的语音分离

EEG using VAE - Yunye Feng

多通道语音增强

Analyzing the impact of speech enhancement errors on ASR - Rui Cao

Audio-visual separation By JunjieLi

多通道声源定位

声源定位

单通道声源定位

麦克风阵列语音增强

LiJian-kaldi搭建在线语音识别系统

【赞】2021.3.14 鸡尾酒会问题及解决方案思考-by Ge Meng

2020.08.09 基于麦克风阵列的语音增强方法研究-by Guanjun Li

多通道语音增强

强烈推荐！语音识别全套教程！恨不得马上就学会的语音识别技术！谷歌“万能”语音识别大模型USM、OpenAI、语音分离、语音合成、变声器

2020.9.6 基于滤波器组（多子带）的语音信号处理 -by Li Nan

多通道语音增强

2022.2.24 回声消除（AEC）论文分享

2020.11.22 关于语音信号处理论文分享 - by Li Nan

Whisper终结者：Reverb ASR 语音识别和说话人分离方面新标杆 在前所未有的20万小时人工转录数据上进行训练 支持可定制的逐字转录

基于faster_whisper的实时语音识别 | 可对接大模型的实时语音识别 | 实时语音识别 | 一句话识别

[精品] 如何读好研究生？shared by 河北工业大学杨亮老师

声源定位by caorui

faster_whisper对接大模型进行语音对话 | 人机对话 | 语音识别 | 大模型 | faster whisper实时语音识别 | 实时语音识别

语音识别转文字软件faster-whisper整合包下载，免费语音转文字工具

2020.07.01 Yi Luo-端到端声源分离研究进展

2020.6.21 在噪声环境下语音分离论文分享-by Luya

多通道语分离/增强文章分享会 --努尔艾力·阿力甫

自动化转写 | 自动化语音识别 | 对直播录屏自动化生成字幕 | 大模型总结视频内容

我实现了语音流式转录翻译!（win11实时字幕+Luna Translator hook）

2020.7.5 ASR论文分享-by XiaoJie

Neural Spatial Filter - Yanjie Fu

Consistency Constraints & Distortion Controlling for Separation - Yanjie Fu

2020.6.28 多通道论文分享-by JiangYu

On the Compensation Between Magnitude and Phase in Speech Separation - Rui Cao

论文分享（DNN for Multiple Speaker Detection and Localization）

基于faster_whisper的实时语音识别改进版 | whisper中出现繁体中文的解决方法 | 语音识别中繁体转简体 | OpenCC

2021.1.31 code-switching ASR -by tongtong

【SenseVoice】一键包 阿里开源语音识别 高精度、多语言、情感辨识和音频事件检测

DNS challenge 论文分享 - Junjie Li

2020.9.6 AVDataset(LRS2 & AVSpeech)介绍-by Junjie

Improve Online Speech Separation System - zhongjian Cui

降低方差的语音分离

EEG using VAE - Yunye Feng

多通道语音增强

Analyzing the impact of speech enhancement errors on ASR - Rui Cao

Audio-visual separation By JunjieLi

Whisper终结者：Reverb ASR 语音识别和说话人分离方面新标杆在前所未有的20万小时人工转录数据上进行训练支持可定制的逐字转录

【SenseVoice】一键包阿里开源语音识别高精度、多语言、情感辨识和音频事件检测