Meta 发布 Movie Gen：最先进的媒体生成模型

发布人

官网：https://ai.meta.com/research/movie-gen/
[官网](https://ai.meta.com/research/movie-gen/ &quot;Movie Gen 官网&quot;)是由 Meta 发布的系列模型，官方宣称这是迄今为止最先进的媒体基础模型。该系列包括两个主要模型：

1. Movie Gen Video：这是一个拥有 30B 参数的 transformer 模型，支持文本生成图像和视频。
2. Movie Gen Audio：这是一个拥有 13B 参数的 transformer 模型，支持视频配音（文本引导），能够生成环境音、背景音乐和拟音。

尽管目前仅发布了[官网](https://ai.meta.com/research/movie-gen/ &quot;Movie Gen 官网&quot;)和 92 页的[论文](https://ai.meta.com/static-resource/movie-gen-research-paper &quot;Movie Gen 研究论文&quot;)，Meta 尚未表态是否会开源，但从官网的演示来看，Movie Gen 支持多模态输入，自带角色一致性，还能通过提示词精准编辑视频，功能非常强大，值得期待。

打开封面下载高清视频观看高清视频视频下载器

Meta 发布 Movie Gen：最先进的媒体生成模型

Runway 发布 Gen-3 Alpha Turbo 更新：支持竖屏视频生成

智谱清影 CogVideoX-5B: 开源视频生成模型

ElevenLabs 发布新的 Turbo 2.5 模型

Meta 3D Gen：文生 3D 模型

Meta 推出 Spirit LM：首个自由混合文本和语音的多模态模型

清华发布 DanceFusion：AI 音乐编舞新突破

腾讯 MimicMotion: 现在可以使用了！

武汉大学与字节跳动联合推出 MikuDance：二次元角色动画生成技术

PIKA AI 发布 4 种全新视频特效

阿里ACE：全能图片编辑模型即将开源

Hallo2：开源数字人头视频生成

Unique3D：图生 3D 模型

开源 MIDI 音乐生成模型：AI 编曲新体验

AI 艺术家用工具生成真人版《幽灵公主》

阿里 MIMO：AI 视频人物替换与动画生成

Haiper v1.5：新版视频模型更新

清华 MotionCLR：AI 动作编辑模型

Topo4D: 华为 4D 头部捕捉

OpenAI 更新 ChatGPT Mac 客户端，支持连接开发工具

面壁 MiniCPM-V 2.6：最强开源端侧多模态 LLM

CharacterGen：又一个单图生 3D 模型

你敢坐哪个地铁🚇回家？#有ai就有无限可能 #万万没想到 #视觉冲击 #脑洞大开 #内容过于真实

Cinemo: 开源图片生视频

Runway 推出 Gen-3 Alpha Turbo 高级运镜功能

EmoLLM 2.0：心理健康辅导大模型

人工智能将在未来十年，以十种可怕的方式，改变你的生活！

Playground V3：图形设计模型的文字处理新标杆

免费！无门槛！Luma AI 发布下一代视频模型 Dream Machine，大家可以尝试一下

上海 AI Lab InternVideo2：多模态视频理解模型

Suno V4: 用任何声音制作歌曲

Ideogram 2.0 现已免费推出

ComfyUI V1 本地客户端即将发布，支持 Win、Mac 和 Linux

Suno AI: Covers 翻唱任何声音

Runway Gen-3 Alpha: 视频生成新模型

微软 Designer：终于面向所有人开放

LumaAI Dream Machine 现已推出 API

快手 LivePortrait数字人头技术，生成速度 12.8 毫秒

Shakker 推出 FLUX.1 的 IP-Adapter：创新与开源的结合

Text-to-CAD：文生 CAD 模型

Suno 安卓客户端开放预注册