V
主页
基于大规模多模态扩散模型的文本到视频生成
发布人
【分享人】杨欢。微软亚洲研究院多模态计算组高级研究员。研究方向包括多模态内容创作,图像视频增强等。 【分享内容】1生成模型的发展2基础视频生成模型(MM-Diffusion:联合音视频生成模型、VideoFactory:高画质视频生成)3视频生成应用(MovieFactory:影视级生成、MobileVidFactory:短视频生成)4机会与挑战 Paper: MM-Diffusion https://arxiv.org/abs/2212.09478 VideoFactory https://arxiv.org/abs/2305.10874 MovieFactory https://arxiv.org/abs/2306.07257 MobileVidFactory https://arxiv.org/abs/2307.16371 Code: MM-Diffusion https://github.com/researchmm/MM-Diffusion Dataset: HD-VG-130M https://github.com/daooshee/HD-VG-130M 【OpenMMLab】公众号回复‘社区开放麦’即可获取视频课件。
打开封面
下载高清视频
观看高清视频
视频下载器
多模态扩散模型的革新应用 | 热门研究云际会#4
KREA.AI视频生成功能正式上线 添加图片关键帧即可完成变换视频 完全免费效果流畅 KREA多图生视频使用教程
2024最好出论文的两个研究方向:Diffusion扩散模型+对比学习,源码复现+模型精讲+论文解读,迪哥带你轻松搞定论文创新点!(研一研二必看)
多模态 Agents:用大模型语言模型串联多模态专家
[2024北京智源大会]大模型产业技术
1. PyTorch 模型部署基础知识
Luma AI新增关键帧生成视频功能免费开放使用
MMDetection:从通用目标检测迈向多模态智能体
Stable diffusion生成大模型——隐扩散模型原理解析
生成模型 GAN 与 MMGeneration 实践
一个视频看懂如何从SDE视角看生成模型
星语天文大模型,科普与科学领域的多模态、智能体探索
Luma Dream Machine 官方推荐的演示
1小时学完【Diffusion扩散模型】!这绝对是2024年最通俗易懂的扩散模型教程了吧!1小时入门到精通!建议收藏!(人工智能、深度学习、机器学习算法、AI)
多模态任务终结者:Meta-Transformer
24年图像生成创新潜力股:图像神经场结合扩散模型,任意分辨率就能渲染图像!
MMagic —— 图像与视频生成、编辑及增强工具库
新一代换脸神器 InstantID:高保真人像秒级生成
5 MMDetection 代码教学
4小时入门深度学习+实操MMDetection 第一课
玩转 MMYOLO 之工具篇(一):特征图可视化
Python气象自动绘图函数设计思想与使用方法(自动绘图函数-光流法时间插帧&CDF匹配&深度学习时空降尺度模型)
模型部署与 MMDeploy 实践
B站强推!2024公认最通俗易懂的【AI大模型】教程,24集付费课程(附资料)LLM大模型_RAG_大模型微调_多模态
超大规模视觉通用感知模型-代季峰教授 | AI奇妙夜#6
一张图即可创建3d肖像!速度甚至比sota高12倍,全新的高分辨率跨域扩散模型Era3D来了!人工智能/深度学习/机器学习
弱监督有向目标检测 | 杨学
多模态大模型的前奏:迈向真实世界的通用感知 | 热门研究云际会#2
多模态大模型的技术实践与思考
【OpenMMLab 公开课】语义分割与 MMSegmentation
【AI知识分享】扩散模型Flow Matching基本原理深度解析
无需训练的 Stable Diffusion 视频编辑方法
国产开源、免费的 AI 图像与视频创作平台MagicMaker,新手教程来啦!
AI奇妙夜#5 | “视觉与语言”跨模态智能及应用
4. 部署 MMDetection 目标检测模型
Latte 专场: 深度解读视频生成与训练技术
【公式证明】扩散模型中的reverse-time SDE是怎么推导得到的呢?
(超爽中英!) 2024吴恩达最好的【LangChain大模型应用开发】教程!附课件代码 DeepLearning.AI
社区开放麦#38 目标检测新范式!DETR 系列算法解读
3. 部署 MMClassification 图像分类模型