基于鼾声的睡眠体位识别（数据集） - 视频下载 Video Downloader

基于鼾声的睡眠体位识别（数据集）

发布人

阻塞性睡眠呼吸暂停低通气综合征 (Obstructive Sleep Apnea-Hypopnea Syndrome，OSAHS) 是一种由上呼吸道阻塞引起的慢性呼吸障碍。 打鼾是OSAHS的一个突出症状，以前的研究试图通过鼾声来定位上呼吸道的阻塞部位。 尽管取得了一些进展，但由于睡眠体位对上呼吸道结构的影响，阻塞部位的识别在临床环境中仍然具有挑战性。 为了应对这一挑战，本文提出了一个基于鼾声的睡眠体位识别数据集（SSBPR），该数据集由 7570 个鼾声片段组成，其中包含六个不同的睡眠体位标签：仰卧、仰卧但头偏左、仰卧但头偏右、左侧卧、右侧卧和俯卧。 实验结果表明，鼾声表现出某些声学特征，使其能够有效地用来识别现实场景中睡姿。

打开封面下载高清视频观看高清视频视频下载器

多说话人交互场景中的目标说话人提取

Sherpa:新一代 Kaldi 部署框架

感知难度的说话人识别数据增强

基于序列胶囊网络的语音情感识别

用于语音情感识别的多尺度时空Transformer模型

基于数据增强的语音编辑改进ASR中的代码转换和命名实体识别

ModelScope语音开源现状和语音语义多模态大模型研究进展张仕良

【音乐与音频处理】什么是音乐理解？卡耐基梅隆大学罗杰·B·丹嫩贝格（Roger-B.DANNENBERG）

域移下异常声音检测的分层元数据信息约束自监督学习

交互式AI中语音技术实践与探索-万玉龙

VoxBlink:短视频上的大规模说话人验证数据集

AI算法赋能海天瑞声高质量数据生产-邵志明

【音乐与音频处理】在学术计算规模上再现大型预训练语音模型-Shinji-WATANABE

圆桌：音频与大模型（欧智坚何磊钱彦旻易江燕栾剑张超）

RaD-Net：一种用于语音信号改善的修复与降噪网络

声纹识别工具ASV-Subtools-江涛

kaldi语音识别：数据准备与特征提取

MISP 2021挑战赛后的DKU音视频唤醒词识别系统：深度分析

声纹识别可视化研究分析

圆桌：语音开源技术张仕良张彬彬康魏

Whisper终结者：Reverb ASR 语音识别和说话人分离方面新标杆在前所未有的20万小时人工转录数据上进行训练支持可定制的逐字转录

中文连续视觉语音识别挑战赛

AlSHELL-Turbo：多模态AI模型数据集

ModelScope魔搭社区及其开源的语音AI模型

基于多通道训练和交叉信息融合的低资源端到端口音识别

Kaldi安装与样例流程介绍

入门语音合成，听这个课真的可以哦

基于跨模态对齐的从语音到歌声转换-李瑞琪火山语音

基于热词短语预测网络的热词语音识别

MARBLE:通用评价的音乐音频表现基准-马英浩(Yinghao-MA)

Discussion：生成音频AI和研究社区、艺术产业、公众.mp4

【大模型】认知导向的视听觉大语言模型

在说话人验证中识别基于语音转换欺诈攻击的源说话人

标签噪声干扰下的说话人识别关键技术研究

跨语种的语音转换-武执正

高速高质量零资源歌声合成-雪巍

基于多目标渐进聚类的半监督说话人识别域自适应

基于多频带时频注意力的复调音乐旋律提取

通过NVIDIA NEMO 训练语音AI模型（下）

低资源小语种自动语音识别：清华THUEE队伍在OpenASR20的系统描述