V
主页
Meta 发布 Movie Gen:最先进的媒体生成模型
发布人
官网:https://ai.meta.com/research/movie-gen/ [官网](https://ai.meta.com/research/movie-gen/ "Movie Gen 官网")是由 Meta 发布的系列模型,官方宣称这是迄今为止最先进的媒体基础模型。该系列包括两个主要模型: 1. Movie Gen Video:这是一个拥有 30B 参数的 transformer 模型,支持文本生成图像和视频。 2. Movie Gen Audio:这是一个拥有 13B 参数的 transformer 模型,支持视频配音(文本引导),能够生成环境音、背景音乐和拟音。 尽管目前仅发布了[官网](https://ai.meta.com/research/movie-gen/ "Movie Gen 官网")和 92 页的[论文](https://ai.meta.com/static-resource/movie-gen-research-paper "Movie Gen 研究论文"),Meta 尚未表态是否会开源,但从官网的演示来看,Movie Gen 支持多模态输入,自带角色一致性,还能通过提示词精准编辑视频,功能非常强大,值得期待。
打开封面
下载高清视频
观看高清视频
视频下载器
Runway 发布 Gen-3 Alpha Turbo 更新:支持竖屏视频生成
智谱清影 CogVideoX-5B: 开源视频生成模型
ElevenLabs 发布新的 Turbo 2.5 模型
Meta 3D Gen:文生 3D 模型
Meta 推出 Spirit LM:首个自由混合文本和语音的多模态模型
清华发布 DanceFusion:AI 音乐编舞新突破
腾讯 MimicMotion: 现在可以使用了!
武汉大学与字节跳动联合推出 MikuDance:二次元角色动画生成技术
PIKA AI 发布 4 种全新视频特效
阿里ACE:全能图片编辑模型即将开源
Hallo2:开源数字人头视频生成
Unique3D:图生 3D 模型
开源 MIDI 音乐生成模型:AI 编曲新体验
AI 艺术家用工具生成真人版《幽灵公主》
阿里 MIMO:AI 视频人物替换与动画生成
Haiper v1.5:新版视频模型更新
清华 MotionCLR:AI 动作编辑模型
Topo4D: 华为 4D 头部捕捉
OpenAI 更新 ChatGPT Mac 客户端,支持连接开发工具
面壁 MiniCPM-V 2.6:最强开源端侧多模态 LLM
CharacterGen:又一个单图生 3D 模型
你敢坐哪个地铁🚇回家?#有ai就有无限可能 #万万没想到 #视觉冲击 #脑洞大开 #内容过于真实
Cinemo: 开源图片生视频
Runway 推出 Gen-3 Alpha Turbo 高级运镜功能
EmoLLM 2.0:心理健康辅导大模型
人工智能将在未来十年,以十种可怕的方式,改变你的生活!
Playground V3:图形设计模型的文字处理新标杆
免费!无门槛!Luma AI 发布下一代视频模型 Dream Machine,大家可以尝试一下
上海 AI Lab InternVideo2:多模态视频理解模型
Suno V4: 用任何声音制作歌曲
Ideogram 2.0 现已免费推出
ComfyUI V1 本地客户端即将发布,支持 Win、Mac 和 Linux
Suno AI: Covers 翻唱任何声音
Runway Gen-3 Alpha: 视频生成新模型
微软 Designer:终于面向所有人开放
LumaAI Dream Machine 现已推出 API
快手 LivePortrait数字人头技术,生成速度 12.8 毫秒
Shakker 推出 FLUX.1 的 IP-Adapter:创新与开源的结合
Text-to-CAD:文生 CAD 模型
Suno 安卓客户端开放预注册