语音识别技术研究进展和应用落地分享 - 视频下载 Video Downloader

语音识别技术研究进展和应用落地分享

发布人

讲师简介：

马志强，寰语科技语音识别研究主管，主要负责语音识别核心技术研究和相关产品落地工作。具备语音识别、语音转写及语音翻译技术研发经验，熟练掌握 ASR 技术、NMT 技术、深度学习技术等，在多语种、低资源、端到端语音识别方向有着丰富的实践经验，对 AI 语音识别技术的产业应用有着深入的理解，负责并推动了 ASR 技术在语音助手、语音交互、AI 字幕等场景上线应用。

内容简介：

1、AI 语音识别技术的发展态势和技术研究现状以及面临的挑战问题
2、语音识别技术的发展历程及其技术原理
3、ASR 技术的应用落地情况，以及 AI 语音在各个领域场景所取得的应用成果

打开封面下载高清视频观看高清视频视频下载器

Rust实时音视频技术实践与分享

FastCorrect：语音识别快速纠错模型

声⽹⾳频算法专家吴渤：声网凤鸣AI引擎：AI音频降噪、AI回声消除和3D空间音频算法的实现与应用【RTE 2023】

音频技术专场

Rokid AR软件研发负责人杨剑：Rokid AR空间计算平台的关键技术以及应用落地【RTE 2023】

喜马拉雅首席科学家卢恒：语音AIGC技术进展音频技术在喜马拉雅的研发和落地应用【RTE 2023】

【Stable Diffusion】5款极品涩涩大模型推荐，绝对好用！绅士都在用的SD大模型新手小白必备福利大放送！（附资料）

基于感知技术及 AI 引擎的高清视频互动体验优化

基于STM32设计的盲人智能饮水机(221)

大饼AI创始人凌天格：从信号处理的声音变调到神经网络学习的AI变声【RTE 2023】

Python实时音视频技术实践与分享

上海大学教育部新型显示技术与应用集成重点实验室副主任沈礼权:新一代 8K/4K 视频压缩编码标准（VVC）与高效算法

AI 技术应用专场

快速实现语音识别元素效果 · Figma · Vector to 3D插件教程

Flutter B端落地和高可用——票务APP应用实践

华为云媒体网络服务架构师丁凯：华为云应用传送网络ADN技术架构探索【RTE 2023】

视频技术专场

分布式高可用框架在云录制中的应用

音视频字幕AI生成器Whisper ，语音识别，支持多国语言在线翻译！

思必驰周强：AI 和传统信号技术在实时音频通话中的应用【RTE2022】

西北工业大学谢磊：基于深度学习的语音增强技术新进展【RTE2022】

互联网 3 分钟简史

【干货分享】跨专业学科如何快速入门人工智能？最细致学习路线来了，别再走冤枉路了！

常见信息安全风险及应对方案

宁波蛙声科技有限公司⾳频算法⼯程师袁鋆：声反馈系统技术实践【RTE 2023】

实测 OpenAI 高级语音功能 & 常见问题解答

科大讯飞AI工程院副院长刘坤：星火认知大模型技术解析与应用案例【RTE 2023】

互动白板的使用场景和技术基础

冒死上传！价值499美刀的Comfyui换脸工作流！超自然AI换脸教程（工作流），妈生感还原度超高，轻松安装，永久使用！comfyui教程、AI绘画教程

AI头条搬砖玩法，小白一周1000+，各种名场面不断，保姆级干货教程耐心观看!!

去哪儿网企业应用低代码化实践与落地——RTC Dev Meetup

实时语音质量监控系统的过去、现在和未来

RTE2020 圆桌 Panel：5G+AI+RTE如何激发IOT技术创新潜力

Hulu 首席研究主管谢晓辉：浅谈视频推荐系统面临的一些技术挑战

创业团队如何落地敏捷测试，提升质量效能

天准科技范林林：天准低延时平行驾驶系统的落地应用【RTE2022】

Unity 数字人技术 - 开启元宇宙之旅

爱奇艺 AI 产品负责人康执玺：爱奇艺 AI 在内容制作领域的实践

声网分布式存储架构师刘畅：实时应用场景中声网RTM的架构演进及最佳实践【RTE 2023】

🧩 x whisper (1): 快速安装并使用 whisper.cpp 来进行语音识别，生成字幕