V
主页
【语音之家】AI产业沙龙—视频译制场景中的语音翻译、语音合成和唇形生成技术
发布人
视频译制是将视频中的讲话内容翻译到目标语言的文字和声音,需要考虑以下几个要求:1)翻译得到的目标语音时长需要匹配对应视频的长度;2)目标语音的音色和韵律需要尽可能的和原语音一致;3)翻译得到的说话人唇形尽可能和目标语言一致。本次报告将简要介绍语音翻译、语音合成、唇形生成技术,然后探讨在视频译制场景中,如何构建机器翻译、语音合成和唇形生成系统,以满足上述要求。最后,浅谈以语音为基础的多模态生成技术面临的挑战和机遇。
打开封面
下载高清视频
观看高清视频
视频下载器
【语音之家】AI产业沙龙—火山语音在AI视频译制方向的技术探索与实践
【语音之家】 AI技术沙龙- -语音合成
【语音之家】AI产业沙龙——语音&音乐技术在字节跳动平台的应用
【语音之家】AI产业沙龙—AI语音赋能产业数字化新场景
【语音之家】AI产业沙龙—智能语音技术在美团的应用实践
【语音之家】AI产业沙龙——智能对话平台
【语音之家】AI产业沙龙—语音技术在贝壳的应用
【语音之家】AI产业沙龙— 网易语音AI技术:从内容安全到内容品质
【语音之家】AI产业沙龙—语音技术在国音智能的应用
【语音之家】AI产业沙龙—作业帮语音技术实践
【语音之家】AI产业沙龙——站在未来思考下一代人工智能基础框架
【语音之家】AI产业沙龙—小米的语音研究与应用
【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍
【语音之家】AI产业沙龙——腾讯会议背后的语音技术
【秒懂】语音识别是什么
【语音之家】AI产业沙龙—如何应用k2开发语音识别系统
【语音之家】AI产业沙龙—智能语音技术在智能客服的落地实践
【语音之家】AI技术沙龙—语音增强
【语音之家】AI技术沙龙-声纹识别
语音之家公开课 —《AISHELL-1 语音识别实战》课程交流
语音之家公开课 — 音频模式识别(秦勇教授)
【语音之家】AI产业沙龙—音乐技术在字节跳动平台的应用
【语音之家】AI产业沙龙—京东在AI语音方向的技术探索与实践
【语音之家】走进企业系列沙龙-语音技术在58同城的应用
语音之家公开课 — 语音分离的神经网络方法 Speech Separation with Neural Network(邹月娴)
【语音之家公开课】表现力语音与歌唱合成
Amphion-开源的音频 、音乐和语音生成工具包-武执政
端到端语音到语音翻译中的零样本风格迁移
【语音之家】AI产业沙龙—自动语音识别利器 - NVIDIA NeMo
【语音识别】声学特征提取
语音之家公开课 — 交流语音合成中的情感强度建模研究(刘瑞)
SH-SSS丨面向有声读物的跨说话人语音风格迁移 — 李翔
SH-SSS丨端到端音视频说话人日志网络 — 何茂奎
语音之家公开课 —《ASV-Subtools 声纹识别实战》课程交流
语音之家公开课 —《WeNet语音识别实战》课程交流
【语音之家】AI产业沙龙 —解读火山语音团队在国际顶会ACL2023的创新突破
交互式AI中语音技术实践与探索-万玉龙
Sherpa:新一代 Kaldi 部署框架
AI 视频生成 PixVerse V2.5
中国语音产业联盟系列沙龙——语音唤醒专题