V
主页
【聘】语音算法工程师 云译科技 深圳 本科以上
发布人
关注【VjoinU】每日发布AI语音岗位招聘信息(HR可投递招聘需求) 简历投递 邮箱主题:应聘岗位 + 姓名 + 语音之家推荐 邮箱:hr@unisound.com 地址:深圳-南山区
打开封面
下载高清视频
观看高清视频
视频下载器
Whisper终结者:Reverb ASR 语音识别和说话人分离方面新标杆 在前所未有的20万小时人工转录数据上进行训练 支持可定制的逐字转录
浙大清华发布语音伪造检测框架SafeEar,内容隐私保护,语音造假无处遁形
“你好,我是贾维斯,永远待命,sir”一个Python打造的跨平台智能语音助手,可实现打开应用程序、搜索信息、播放音乐、截图等
PromptVC:基于自然语言提示的潜在空间灵活风格语音转换
域移下异常声音检测的分层元数据信息约束自监督学习
跨多种阵列拓扑结构的多通道语音识别自动通道选择与空间特征集成
【荐】已经开到第四期了,端到端语音识别好课,新增语音大模型内容
Xmart青年论坛 语音大模型的后训练对齐
【秒懂】语音识别是什么
【聘】语音识别算法实习生 北京 智能车载语音方向
一种端到端脑电图通道选择的脑辅助语音增强方法
【清华】从0开始学Kaldi,丝滑入门语音识别,语音识别原来如此简单
基于新一代kaldi项目的语音识别应用实例-郭理勇 小米
【实操】通过NVIDIA NEMO 训练语音AI模型(上)
ModelScope语音开源现状和语音语义多模态大模型研究进展 张仕良
交互式AI中语音技术实践与探索-万玉龙
少走99%的弯路!0基础快速入门语音识别
4块GPU、不到3天训练出「开源版GPT-4o」 基于LLaMA-3.1-8B,羊驼家族再添大将,实现低延迟/高质量的语音互动
中科大&科大讯飞开源免费的AI音乐神器:OpenMusic,可平替Suno音乐模型!
Sherpa:新一代 Kaldi 部署框架
超划算的语音课程,确定不来了解下?
基于多目标渐进聚类的半监督说话人识别域自适应
语音之家公开课 —《WeNet语音识别实战》课程交流
Kaldi安装与样例流程介绍
ModelScope魔搭社区及其开源的语音AI模型
关于AI语音圈的顶会的INTERSPEECH,你需要知道……
【聘】医疗级听力技术研发公司,招聘AI语音实习生
在家做AI后,昨天922,一台电脑,操作简单,分享我的AI实战操作,接单平台和资源分享,悄悄努力,惊艳所有人!!
MARBLE:通用评价的音乐音频表现基准-马英浩(Yinghao-MA)
都开第三期了!广受好评的端到端语音识别实战课
MISP 2023挑战中视听目标扬声器提取的XMUSPEECH系统
2022年声纹识别研究与应用学术研讨会
基于跨模态对齐的从语音到歌声转换-李瑞琪 火山语音
【聘】阿里巴巴集团旗下子公司斑马智行招语音识别算法专家,与阿里巴巴达摩院自然交互(NUI)领域技术研究团队合作
SponTTS:自发风格建模与迁移的文本到语音合成
【语音识别】声学特征提取
一次性敏感度感知混合稀疏性剪枝技术在大规模语言模型中的应用
关于AI语音圈的顶会的ICASSP,你需要知道……
【语音之家】AI产业沙龙—腾讯AI Lab语音技术进展分享报告
中国语音产业联盟系列沙龙——语音唤醒专题