基于大规模多模态扩散模型的文本到视频生成 - 视频下载 Video Downloader

基于大规模多模态扩散模型的文本到视频生成

发布人

【分享人】杨欢。微软亚洲研究院多模态计算组高级研究员。研究方向包括多模态内容创作，图像视频增强等。
【分享内容】1生成模型的发展2基础视频生成模型（MM-Diffusion：联合音视频生成模型、VideoFactory：高画质视频生成）3视频生成应用（MovieFactory：影视级生成、MobileVidFactory：短视频生成）4机会与挑战
Paper:
MM-Diffusion
https://arxiv.org/abs/2212.09478
VideoFactory
https://arxiv.org/abs/2305.10874
MovieFactory
https://arxiv.org/abs/2306.07257
MobileVidFactory 
https://arxiv.org/abs/2307.16371
Code:
MM-Diffusion 
https://github.com/researchmm/MM-Diffusion
Dataset:
HD-VG-130M 
https://github.com/daooshee/HD-VG-130M
【OpenMMLab】公众号回复‘社区开放麦’即可获取视频课件。

打开封面下载高清视频观看高清视频视频下载器

多模态扩散模型的革新应用 | 热门研究云际会#4

KREA.AI视频生成功能正式上线添加图片关键帧即可完成变换视频完全免费效果流畅 KREA多图生视频使用教程

2024最好出论文的两个研究方向：Diffusion扩散模型+对比学习，源码复现+模型精讲+论文解读，迪哥带你轻松搞定论文创新点！（研一研二必看）

多模态 Agents：用大模型语言模型串联多模态专家

[2024北京智源大会]大模型产业技术

1. PyTorch 模型部署基础知识

Luma AI新增关键帧生成视频功能免费开放使用

MMDetection：从通用目标检测迈向多模态智能体

Stable diffusion生成大模型——隐扩散模型原理解析

生成模型 GAN 与 MMGeneration 实践

一个视频看懂如何从SDE视角看生成模型

星语天文大模型，科普与科学领域的多模态、智能体探索

Luma Dream Machine 官方推荐的演示

1小时学完【Diffusion扩散模型】！这绝对是2024年最通俗易懂的扩散模型教程了吧！1小时入门到精通！建议收藏！（人工智能、深度学习、机器学习算法、AI）

多模态任务终结者：Meta-Transformer

24年图像生成创新潜力股：图像神经场结合扩散模型，任意分辨率就能渲染图像！

MMagic —— 图像与视频生成、编辑及增强工具库

新一代换脸神器 InstantID：高保真人像秒级生成

5 MMDetection 代码教学

4小时入门深度学习+实操MMDetection 第一课

玩转 MMYOLO 之工具篇（一）：特征图可视化

Python气象自动绘图函数设计思想与使用方法(自动绘图函数-光流法时间插帧＆CDF匹配＆深度学习时空降尺度模型)

模型部署与 MMDeploy 实践

B站强推！2024公认最通俗易懂的【AI大模型】教程，24集付费课程（附资料）LLM大模型_RAG_大模型微调_多模态

超大规模视觉通用感知模型-代季峰教授 | AI奇妙夜#6

一张图即可创建3d肖像！速度甚至比sota高12倍，全新的高分辨率跨域扩散模型Era3D来了！人工智能/深度学习/机器学习

弱监督有向目标检测 | 杨学

多模态大模型的前奏：迈向真实世界的通用感知 | 热门研究云际会#2

多模态大模型的技术实践与思考

【OpenMMLab 公开课】语义分割与 MMSegmentation

【AI知识分享】扩散模型Flow Matching基本原理深度解析

无需训练的 Stable Diffusion 视频编辑方法

国产开源、免费的 AI 图像与视频创作平台MagicMaker，新手教程来啦！

AI奇妙夜#5 | “视觉与语言”跨模态智能及应用

4. 部署 MMDetection 目标检测模型

Latte 专场: 深度解读视频生成与训练技术

【公式证明】扩散模型中的reverse-time SDE是怎么推导得到的呢？

(超爽中英!) 2024吴恩达最好的【LangChain大模型应用开发】教程！附课件代码 DeepLearning.AI

社区开放麦#38 目标检测新范式！DETR 系列算法解读

3. 部署 MMClassification 图像分类模型