V
主页
语音与音频生成 Amphion揭秘霉霉如何演唱《稻香》
发布人
【分享人】 武执政博士,现任香港中文大学(深圳)副教授。入选国家级青年人才,连续多次入选斯坦福大学“全球前 2 %顶尖科学家”、爱思唯尔“中国高被引学者”榜单。他于 2015 年获得南洋理工大学博士学位,并在 Meta(原 Facebook)、京东、苹果、爱丁堡大学、微软亚洲研究院等机构从事学术研究和技术领导工作。武博士带领开发了语音合成开源系统 Merlin,发起并组织了第一届声纹识别欺骗检测国际评测、第一届语音转换国际评测,组织了 2019 年语音合成国际评测(Blizzard Challenge 2019)。曾获得 INTERSPEECH 2016 最佳学生论文奖、2012 年亚太信号与信息处理协会年度峰会最佳论文奖。武博士现为 IEEE 语音与语言处理技术委员会委员,语音领域权威期刊 IEEE/ACM Transactions on Audio, Speech and Language Processing 的Associate Editor, IEEE Spoken Language Technology Workshop 2024 的大会主席。他曾受邀在 ICASSP、IJCAI 2023 DADA Workshop 等权威学术会议做特邀报告。 【分享内容】 - 语音与音频生成的常见任务与方法 - 语音与音频生成最新研究趋势 - Amphion:一个语音、音频与音乐生成开源系统 【相关工作】 Amphion: https://github.com/open-mmlab/Amphion Amphion: An Open-Source Audio, Music and Speech Generation Toolkit https://arxiv.org/abs/2312.09911 Leveraging Content-based Features from Multiple Acoustic Models for Singing Voice Conversion https://arxiv.org/abs/2310.11160 AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models https://arxiv.org/abs/2304.00830 【OpenMMLab】公众号回复‘社区开放麦’即可获取视频课件,微信添加小助手 InternLM 进入导师群沟通
打开封面
下载高清视频
观看高清视频
视频下载器
SD-Eval新基准,让语音交互大模型情智兼备
PK 周杰伦,全能音乐创作大模型 SongComposer 作词作曲令人惊叹
霉霉演唱《稻香》,港中大(深圳)联袂OpenMMLab剑指音频生成!
AI实战营第二期 开营仪式
基于 SiliconCloud 平台使用 MindSearch
超大规模视觉通用感知模型-代季峰教授 | AI奇妙夜#6
多模态大模型的技术实践与思考
AI 奇妙夜#2 | 子豪兄分享人工智能学习心法
零样本语音生成大模型与Amphion实践
社区开放麦#11 | BEV感知:下一代自动驾驶感知算法新范式
当大模型遇上心理咨询:基于心理咨询报告的对话重构和评测框架CPsyCoun
LawBench:多层能力体系全面评估
【AI 孙燕姿】《珊瑚海》『海鸟跟鱼相爱,只是一场意外』 cover 周杰伦 /Lara梁心颐(只替换女声)
cursor帮你写代码
AI奇妙夜:缓解多模态大模型中使用裁剪策略增大分辨率的“后遗症”
社区开放麦#15| 突破纯视觉 3D 检测深度估计瓶颈
多模态任务终结者:Meta-Transformer
AI 2.0:突破性技术推动智能制造的应用创新
国产开源、免费的 AI 图像与视频创作平台MagicMaker,新手教程来啦!
社区开放麦#20 | 简单有效的目标跟踪方案
目标检测
社区开放麦#21 | 当钩子编程遇到深度学习:Runner & Hook
图像与视频生成、编辑和增强工具 MMagic | CVPR 2023 (全英分享)
Runway GEN:48 ai视频生成大赛作品:《最后的希望》
【AI 孙燕姿】《寓言》『我才发现梦想与现实间的差别』 cover 张韶涵
MM 小海象带你玩有趣的AI应用1:MagicMaker:轻触分割、生成创意,用 AI 的魔力改造你的图片
社区开放麦#18 | 半监督学习在 3D 目标检测的最新进展
社区开放麦#13 | 手势识别算法综述与正确打开方式
AI奇妙夜#5 | “视觉与语言”跨模态智能及应用
多模态简述
医学大模型研发与应用的最新进展
OpenDataLab —— 一个面向人工智能的开放数据平台
女朋友花重金看演唱会,我Emo了?看看 AI 心理大模型怎么来安慰我-基于InternLM 的 MindChat 在线体验
AnimateDiff | 用AI生成的动画给陈奕迅的《红玫瑰》剪一段MV
星语天文大模型,科普与科学领域的多模态、智能体探索
社区开放麦#10 | MMDeploy ncnn 部署实战
Ruohui Wang | Basic usage and overall architecture of OpenMMLab
MMDetection代码课
【4K官方修复丨成名曲】孙燕姿 - 天黑黑 MV [Hires无损音质] 爷青回!
Runway Gen:48视频生成大赛作品:一部画风很特别的AI动画短片:茶汤(Tea Soup)