V
主页
【聘】语音识别算法工程师
发布人
关注【vjoinu】公众号,AI语音招聘信息,每日更新。 简历投递 邮箱主题:应聘岗位 + 姓名 + 语音之家推荐 邮箱:hr@chipintelli.com 地址:成都
打开封面
下载高清视频
观看高清视频
视频下载器
Whisper终结者:Reverb ASR 语音识别和说话人分离方面新标杆 在前所未有的20万小时人工转录数据上进行训练 支持可定制的逐字转录
对标OpenAI高级语音【Her】 开源实时多模态AI聊天机器人Moshi,语音对话延迟低至200毫秒!67页技术报告全公开 AI大神Karpathy盛赞
跨多种阵列拓扑结构的多通道语音识别自动通道选择与空间特征集成
【秒懂】语音识别是什么
唤醒你的贾维斯,该从哪里开始学? 5分钟让你了解语音识别技术
语音识别基础:从声音到语音
【聘】语音识别算法实习生 北京 智能车载语音方向
自适应过滤器的元学习初始化背后是什么?-是一种加速自适应多通道主动噪声控制收敛的简单方法
ModelScope语音开源现状和语音语义多模态大模型研究进展 张仕良
基于距离的权重转移,用于从近场到远场的说话人验证模型的微调
利用唤醒词参考语音的高效个人语音活动检测
VoiceFlow:高效的文本到语音的纠正流量匹配
【免费赠书】新书速递《语音识别:原理与应用》(第2版)
都开第三期了!广受好评的端到端语音识别实战课
利用元数据辅助音频生成估计未知异常的无监督异常声音检测
开源语音和 wenet-e2e 社区
面向会议的对话语音识别
基于热词短语预测网络的热词语音识别
面向通用语音离散标记:ASR和TTS的一个案例研究
什么是语音信号?
基于数据增强的语音编辑改进ASR中的代码转换和命名实体识别
音频生成-王文武
通过特征解纠缠技术进行跨城市和设备的声学场景分类
【荐】已经开到第四期了,端到端语音识别好课,新增语音大模型内容
基于角空间中类感知注意机制对比学习的区分性说话人表征
超划算的语音课程,确定不来了解下?
【台大李宏毅】公开课 迈向语音版ChatGPT
基于自监督学习表示的具有持久性口音记忆的口音识别
NotebookLM 自动生成播客 用听的方式学习
2021年声纹识别研究与应用学术研讨会
【闲话AI】语音识别的发展 陈果果
【ICASSP】加入预训练模型的半监督声音事件检测
基于多通道训练和交叉信息融合的低资源端到端口音识别
MLCA-AVSR:基于多层交叉注意力融合的视听语音识别
如何用开源工具实现一个完整的语音识别系统?
非对称干净片段引导的自监督学习用于声纹识别
白玉兰开源:面向人工智能应用的开放数据集构建及许可协议-金耀辉 上海交通大学
基于鼾声的睡眠体位识别(数据集)
利用文本-语音对比学习提出针对语音合成的韵律文本表征-叶振辉(火山语音)
适应多语言ASR模型,以处理多个说话人