语音与音频生成 Amphion揭秘霉霉如何演唱《稻香》

发布人

【分享人】

武执政博士，现任香港中文大学（深圳）副教授。入选国家级青年人才，连续多次入选斯坦福大学“全球前 2 ％顶尖科学家”、爱思唯尔“中国高被引学者”榜单。他于 2015 年获得南洋理工大学博士学位，并在 Meta（原 Facebook）、京东、苹果、爱丁堡大学、微软亚洲研究院等机构从事学术研究和技术领导工作。武博士带领开发了语音合成开源系统 Merlin，发起并组织了第一届声纹识别欺骗检测国际评测、第一届语音转换国际评测，组织了 2019 年语音合成国际评测（Blizzard Challenge 2019）。曾获得 INTERSPEECH 2016 最佳学生论文奖、2012 年亚太信号与信息处理协会年度峰会最佳论文奖。武博士现为 IEEE 语音与语言处理技术委员会委员，语音领域权威期刊 IEEE/ACM Transactions on Audio, Speech and Language Processing 的Associate Editor, IEEE Spoken Language Technology Workshop 2024 的大会主席。他曾受邀在 ICASSP、IJCAI 2023 DADA Workshop 等权威学术会议做特邀报告。

【分享内容】

- 语音与音频生成的常见任务与方法
- 语音与音频生成最新研究趋势
- Amphion：一个语音、音频与音乐生成开源系统

 
【相关工作】

Amphion: https://github.com/open-mmlab/Amphion

Amphion: An Open-Source Audio, Music and Speech Generation Toolkit 
https://arxiv.org/abs/2312.09911

Leveraging Content-based Features from Multiple Acoustic Models for Singing Voice Conversion https://arxiv.org/abs/2310.11160

AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models
https://arxiv.org/abs/2304.00830
 
【OpenMMLab】公众号回复‘社区开放麦’即可获取视频课件，微信添加小助手 InternLM 进入导师群沟通

打开封面下载高清视频观看高清视频视频下载器

语音与音频生成 Amphion揭秘霉霉如何演唱《稻香》

SD-Eval新基准，让语音交互大模型情智兼备

PK 周杰伦，全能音乐创作大模型 SongComposer 作词作曲令人惊叹

霉霉演唱《稻香》，港中大（深圳）联袂OpenMMLab剑指音频生成！

AI实战营第二期 开营仪式

基于 SiliconCloud 平台使用 MindSearch

超大规模视觉通用感知模型-代季峰教授 | AI奇妙夜#6

多模态大模型的技术实践与思考

AI 奇妙夜#2 | 子豪兄分享人工智能学习心法

零样本语音生成大模型与Amphion实践

社区开放麦#11 | BEV感知：下一代自动驾驶感知算法新范式

当大模型遇上心理咨询：基于心理咨询报告的对话重构和评测框架CPsyCoun

LawBench：多层能力体系全面评估

【AI 孙燕姿】《珊瑚海》『海鸟跟鱼相爱，只是一场意外』 cover 周杰伦 /Lara梁心颐（只替换女声）

cursor帮你写代码

AI奇妙夜：缓解多模态大模型中使用裁剪策略增大分辨率的“后遗症”

社区开放麦#15| 突破纯视觉 3D 检测深度估计瓶颈

多模态任务终结者：Meta-Transformer

AI 2.0：突破性技术推动智能制造的应用创新

国产开源、免费的 AI 图像与视频创作平台MagicMaker，新手教程来啦！

社区开放麦#20 | 简单有效的目标跟踪方案

目标检测

社区开放麦#21 | 当钩子编程遇到深度学习：Runner & Hook

图像与视频生成、编辑和增强工具 MMagic | CVPR 2023 （全英分享）

Runway GEN:48 ai视频生成大赛作品：《最后的希望》

【AI 孙燕姿】《寓言》『我才发现梦想与现实间的差别』 cover 张韶涵

MM 小海象带你玩有趣的AI应用1：MagicMaker：轻触分割、生成创意，用 AI 的魔力改造你的图片

社区开放麦#18 | 半监督学习在 3D 目标检测的最新进展

社区开放麦#13 | 手势识别算法综述与正确打开方式

AI奇妙夜#5 | “视觉与语言”跨模态智能及应用

多模态简述

医学大模型研发与应用的最新进展

OpenDataLab —— 一个面向人工智能的开放数据平台

女朋友花重金看演唱会，我Emo了？看看 AI 心理大模型怎么来安慰我－基于InternLM 的 MindChat 在线体验

AnimateDiff | 用AI生成的动画给陈奕迅的《红玫瑰》剪一段MV

星语天文大模型，科普与科学领域的多模态、智能体探索

社区开放麦#10 | MMDeploy ncnn 部署实战

Ruohui Wang | Basic usage and overall architecture of OpenMMLab

MMDetection代码课

【4K官方修复丨成名曲】孙燕姿 - 天黑黑 MV [Hires无损音质] 爷青回！

Runway Gen:48视频生成大赛作品：一部画风很特别的AI动画短片：茶汤（Tea Soup）

AI实战营第二期开营仪式