V
主页
基于鼾声的睡眠体位识别(数据集)
发布人
阻塞性睡眠呼吸暂停低通气综合征 (Obstructive Sleep Apnea-Hypopnea Syndrome,OSAHS) 是一种由上呼吸道阻塞引起的慢性呼吸障碍。 打鼾是OSAHS的一个突出症状,以前的研究试图通过鼾声来定位上呼吸道的阻塞部位。 尽管取得了一些进展,但由于睡眠体位对上呼吸道结构的影响,阻塞部位的识别在临床环境中仍然具有挑战性。 为了应对这一挑战,本文提出了一个基于鼾声的睡眠体位识别数据集(SSBPR),该数据集由 7570 个鼾声片段组成,其中包含六个不同的睡眠体位标签:仰卧、仰卧但头偏左、仰卧但头偏右、左侧卧、右侧卧和俯卧。 实验结果表明,鼾声表现出某些声学特征,使其能够有效地用来识别现实场景中睡姿。
打开封面
下载高清视频
观看高清视频
视频下载器
多说话人交互场景中的目标说话人提取
Sherpa:新一代 Kaldi 部署框架
感知难度的说话人识别数据增强
基于序列胶囊网络的语音情感识别
用于语音情感识别的多尺度时空Transformer模型
基于数据增强的语音编辑改进ASR中的代码转换和命名实体识别
ModelScope语音开源现状和语音语义多模态大模型研究进展 张仕良
【音乐与音频处理】什么是音乐理解?卡耐基梅隆大学 罗杰·B·丹嫩贝格(Roger-B.DANNENBERG)
域移下异常声音检测的分层元数据信息约束自监督学习
交互式AI中语音技术实践与探索-万玉龙
VoxBlink:短视频上的大规模说话人验证数据集
AI算法赋能海天瑞声高质量数据生产-邵志明
【音乐与音频处理】在学术计算规模上再现大型预训练语音模型-Shinji-WATANABE
圆桌:音频与大模型(欧智坚 何磊 钱彦旻 易江燕 栾剑 张超)
RaD-Net:一种用于语音信号改善的修复与降噪网络
声纹识别工具ASV-Subtools-江涛
kaldi语音识别:数据准备与特征提取
MISP 2021挑战赛后的DKU音视频唤醒词识别系统:深度分析
声纹识别可视化研究分析
圆桌:语音开源技术 张仕良 张彬彬 康魏
Whisper终结者:Reverb ASR 语音识别和说话人分离方面新标杆 在前所未有的20万小时人工转录数据上进行训练 支持可定制的逐字转录
中文连续视觉语音识别挑战赛
AlSHELL-Turbo:多模态AI模型数据集
ModelScope魔搭社区及其开源的语音AI模型
基于多通道训练和交叉信息融合的低资源端到端口音识别
Kaldi安装与样例流程介绍
入门语音合成,听这个课真的可以哦
基于跨模态对齐的从语音到歌声转换-李瑞琪 火山语音
基于热词短语预测网络的热词语音识别
MARBLE:通用评价的音乐音频表现基准-马英浩(Yinghao-MA)
Discussion:生成音频AI和研究社区、艺术产业 、公众.mp4
【大模型】认知导向的视听觉大语言模型
在说话人验证中识别基于语音转换欺诈攻击的源说话人
标签噪声干扰下的说话人识别关键技术研究
跨语种的语音转换-武执正
高速高质量零资源歌声合成-雪巍
基于多目标渐进聚类的半监督说话人识别域自适应
基于多频带时频注意力的复调音乐旋律提取
通过NVIDIA NEMO 训练语音AI模型(下)
低资源小语种自动语音识别:清华THUEE队伍在OpenASR20的系统描述