V
主页
语音识别技术研究进展和应用落地分享
发布人
讲师简介: 马志强,寰语科技语音识别研究主管,主要负责语音识别核心技术研究和相关产品落地工作。具备语音识别、语音转写及语音翻译技术研发经验,熟练掌握 ASR 技术、NMT 技术、深度学习技术等,在多语种、低资源、端到端语音识别方向有着丰富的实践经验,对 AI 语音识别技术的产业应用有着深入的理解,负责并推动了 ASR 技术在语音助手、语音交互、AI 字幕等场景上线应用。 内容简介: 1、AI 语音识别技术的发展态势和技术研究现状以及面临的挑战问题 2、语音识别技术的发展历程及其技术原理 3、ASR 技术的应用落地情况,以及 AI 语音在各个领域场景所取得的应用成果
打开封面
下载高清视频
观看高清视频
视频下载器
Rust实时音视频技术实践与分享
FastCorrect:语音识别快速纠错模型
声⽹⾳频算法专家 吴渤:声网凤鸣AI引擎:AI音频降噪、AI回声消除和3D空间音频算法的实现与应用【RTE 2023】
音频技术专场
Rokid AR软件研发负责人 杨剑:Rokid AR空间计算平台的关键技术以及应用落地【RTE 2023】
喜马拉雅首席科学家 卢恒:语音AIGC技术进展音频技术在喜马拉雅的研发和落地应用【RTE 2023】
【Stable Diffusion】5款极品涩涩大模型推荐 ,绝对好用!绅士都在用的SD大模型 新手小白必备 福利大放送!(附资料)
基于感知技术及 AI 引擎的高清视频互动体验优化
基于STM32设计的盲人智能饮水机(221)
大饼AI创始人 凌天格:从信号处理的声音变调到神经网络学习的AI变声【RTE 2023】
Python实时音视频技术实践与分享
上海大学教育部新型显示技术与应用集成重点实验室 副主任 沈礼权:新一代 8K/4K 视频压缩编码标准(VVC)与高效算法
AI 技术应用专场
快速实现语音识别元素效果 · Figma · Vector to 3D插件教程
Flutter B端落地和高可用——票务APP应用实践
华为云媒体网络服务架构师 丁凯:华为云应用传送网络ADN技术架构探索【RTE 2023】
视频技术专场
分布式高可用框架在云录制中的应用
音视频字幕AI生成器Whisper ,语音识别,支持多国语言在线翻译!
思必驰周强:AI 和传统信号技术在实时音频通话中的应用【RTE2022】
西北工业大学谢磊:基于深度学习的语音增强技术新进展【RTE2022】
互联网 3 分钟简史
【干货分享】跨专业学科如何快速入门人工智能?最细致学习路线来了,别再走冤枉路了!
常见信息安全风险及应对方案
宁波蛙声科技有限公司⾳频算法⼯程师 袁鋆:声反馈系统技术实践【RTE 2023】
实测 OpenAI 高级语音功能 & 常见问题解答
科大讯飞AI工程院副院长 刘坤:星火认知大模型技术解析与应用案例【RTE 2023】
互动白板的使用场景和技术基础
冒死上传!价值499美刀的Comfyui换脸工作流!超自然AI换脸教程(工作流),妈生感还原度超高,轻松安装,永久使用!comfyui教程、AI绘画教程
AI头条搬砖玩法,小白一周1000+,各种名场面不断,保姆级干货教程耐心观看!!
去哪儿网企业应用低代码化实践与落地——RTC Dev Meetup
实时语音质量监控系统的过去、现在和未来
RTE2020 圆桌 Panel:5G+AI+RTE如何激发IOT技术创新潜力
Hulu 首席研究主管 谢晓辉:浅谈视频推荐系统面临的一些技术挑战
创业团队如何落地敏捷测试,提升质量效能
天准科技范林林:天准低延时平行驾驶系统的落地应用【RTE2022】
Unity 数字人技术 - 开启元宇宙之旅
爱奇艺 AI 产品负责人 康执玺:爱奇艺 AI 在内容制作领域的实践
声网分布式存储架构师 刘畅:实时应用场景中声网RTM的架构演进及最佳实践【RTE 2023】
🧩 x whisper (1): 快速安装并使用 whisper.cpp 来进行语音识别,生成字幕