V
主页
创新轨迹可控视频生成技术,阿里推出Tora:画一笔运动自动跟随,遵循物理规律
发布人
阿里研究者开发了一种名为Tora的新型视频生成模型,基于Diffusion Transformer(DiT)架构,旨在生成高质量且符合物理规律的视频。 主页:https://ali-videoai.github.io/tora_video/ Tora能够根据用户指定的轨迹生成相应轨迹的视频,突破了传统视频扩散模型在时长、分辨率和纵横比方面的限制。 该模型结合了文本、视觉和轨迹条件,通过轨迹提取器(TE)、时空DiT(ST-DiT)和运动引导融合器(MGF)协同工作,生成高保真度的视频内容。实验结果表明,Tora在运动保真度、遵循轨迹和模拟物理世界运动方面表现优异,特别是在处理较长视频和复杂场景时,展现出了卓越的运动控制能力和高稳健性。
打开封面
下载高清视频
观看高清视频
视频下载器
AI视频生成工具Sora加入Adobe视频编辑软件! 最新版PR开启AI剪辑时代
3D数字人生成技术革新:高质量可控组合式生成,这项工作已被ECCV2024收录
下一代AutoGPT开源:项目作者演示搭建,GPT-4驱动,自主实现用户设定目标
StreamingT2V 最长2分钟视频生成,开源了!
3D版Sora!最快5s,Direct3D一键生成高质量3D模型,支持绑骨,3D打印成功率90%
模仿任意表情,一键生成逼真动态肖像视频,旷视开源AI人像视频生成框架MegActor
【AI短片基础5】视频生成:Runway、即梦、可灵 | 文生、图生、视频生视频技巧
盘点一周AI大事(9月8日)|GPT5订阅价格离大谱!
用Luma Dream Machine生成赛博朋克ai视频
一个用Runway Gen-3做的赛博朋克风格MV
海螺AI视频的好处是生成速度快 免费不限量
Open-Sora全面开源!附开源地址,模型生成效果展示demo细节来了
AIGC最值得普通人关注的方向,李飞飞团队《2024年人工智能指数报告》重点解读
国外AI七大国产平替,无需充钱直接用!
30秒生成高质量Mesh,精细度最高可达1600面,AI 3D建模开源项目V2版本发布,
突破性3D动作生成框架,动作精细到手腕:这项研究数据集配套100个室内场景,已被CVPR2024收录
Gen-3 Alpha Turbo 图像转视频可以使用啦,生成速度提高了 7 倍!
超越全球首个AI程序员,Genie AI编程助手84秒实现代码自动化,项目作者亲自介绍
24小时star破千的开源版AI程序员:GPT-4加持,能力比肩「首位 AI 程序员」Devin
Cursor 真的太牛逼了啊!今天连着做了两个 macOS 原生应用:视频画面文本搜索
超2.9 万Star,全球首位AI软件工程师OpenDevin团队技术报告来了
媲美GPT-4o的多模态视觉大模型开源,阿里开源Qwen2-VL系列模型,可以分析20分钟以上视频文件,包括2B、7B和72B参数三个版本,
MotionClone: AI视频动作克隆框架并可使用文本提示生成新动作
SD原班人马,推出超越Midjourney的绘画模型?!
OpenAI反作弊工具曝光,99.9%超高准确率!
如何用Runway,给你的视频,做出酷炫的特效
Meta开源SAM2模型:一键跟踪运动物体,速度比初代快8.4倍,解决过度分割、超越SOTA
Runway 突然删库!网友:变Run Away了
deepfake深度伪造技术有多可怕?
AI马斯克超真实况直播:在线互动捏脸,数万人观看
2024 年 RBR50 机器人创新奖出炉:类人机器人元年,Digit 荣获年度机器人奖,电子羊被评为年度最佳初创公司
OpenAI整新活儿,发布自我监督与错误纠正新模型,GPT-4自我监督提升输出质量
AI又进化?能实时捕捉表情换脸了?!!
炸裂!Stability AI 偷偷发布黑科技,Sora、可灵视频配音神器来了!
几乎支持目前所有主流框架的自动“炼丹炉”!可以说至目前最好的自动调参工具!
上班摸鱼你还敢吗?马斯克都惊叹的ai监控!人工智能技术
知网,再见!中科院推出8000万免费数据库,可检索1.7亿资源,测试非常流畅好用!刚测试了下,非常流畅好用!强烈建议所有本硕博学生找AI方向的论文用起来!
零成本升级成AI电脑,这些活AI帮你干了。
一句话生成3D数字人骨骼动作,这项CVPR2024收录的新作效果惊艳,项目已经开源
在保持人物一致的前提下,生成连续漫画和视频,StoryDiffusion——Lecun都夸的字节AI生成视频新方法