ControlVAE: 使用基于模型强化学习的物理角色动作生成

发布人

ControlVAE: 使用基于模型强化学习的物理角色动作生成

作者： Heyuan Yao, Zhenhua Song, Baoquan Chen, Libin Liu
论文： ControlVAE: Model-Based Learning of Generative Controllers for
Physics-Based Characters, ACM Transactions on Graphics (SIGGRAPH Asia 2022)
单位： 北京大学

项目主页： https://heyuanyao-pku.github.io/Control-VAE/

摘要 (Abstract): 
In this paper, we introduce ControlVAE, a novel model-based framework for learning generative motion control policies based on variational autoencoders (VAE). Our framework can learn a rich and flexible latent representation of skills and a skill-conditioned generative control policy from a diverse set of unorganized motion sequences, which enables the generation of realistic human behaviors by sampling in the latent space and allows high-level control policies to reuse the learned skills to accomplish a variety of downstream tasks. In the training of ControlVAE, we employ a learnable world model to realize direct supervision of the latent space and the control policy. This world model effectively captures the unknown dynamics of the simulation system, enabling efficient model-based learning of high-level downstream tasks. We also learn a state-conditional prior distribution in the VAE-based generative control policy, which generates a skill embedding that outperforms the non-conditional priors in downstream tasks. We demonstrate the effectiveness of ControlVAE using a diverse set of tasks, which allows realistic and interactive control of the simulated characters.

打开封面下载高清视频观看高清视频视频下载器

ControlVAE: 使用基于模型强化学习的物理角色动作生成

强推！北京大学王树森半天就教会了我深度强化学习，原理详解+项目实战，学不会来打我！

【基于深度强化学习的冠军级别无人机竞速】强化学习和模型预测控制MPC中英字幕18讲！

【中英字幕】强化学习和模型预测控制18讲！四大名校教授精讲模型预测控制、最优控制、强化学习入门

【大模型+强化学习】怎么理解大模型训练中的RLHF（人类反馈强化学习）？ChatGPT背后的数学原理

我愿称李宏毅强化学习为天花板课程！简单易懂！清晰明了的 PPO算法强化学习入门教程！深度强化学习、人工智能、神经网络

大模型如何增强强化学习？简单粗暴理解大模型训练中的人类反馈强化学习RLHF！PPO算法、ChatGPT背后的数学原理

【MPC+强化学习】四大名校教授精讲强化学习和模型预测控制18讲！Actor Critic模型预测控制、策略梯度方法

这可能是我见过强化学习和模型预测控制最好的教程！四大名校教授精讲动态系统和仿真、最优控制、策略梯度方法、MPC

[SIGGRAPH 2024] A Vortex Particle-on-Mesh Method for Soap Film Simulation

ACM SIGGRAPH Asia 2024 | RobotMDM：机器人运动扩散模型：机器人角色的运动生成

【论文代码复现122】基于强化学习的路径规划问题||强化学习和群智能优化算法有什么区别

【李宏毅】强化学习课程完整版千万不要错过！简单明了的PPO算法讲解！深度强化学习、人工智能、机器学习、大模型

具身智能新思路———Diffusion Policy 结合 PPO 模仿+强化 （上）

【即插即用】Pybullet端强化学习算法训练机械臂

太完整了！我居然3天时间就掌握了【机器学习+深度学习+强化学习+PyTorch】理论到实战，多亏了这个课程，绝对通俗易懂纯干货分享！

我愿称之为强化学习天花板课程！台大李宏毅教授亲授强化学习教程，究极通俗易懂！建议收藏！

从模型预测控制到强化学习12：DDPG做动态控制-研究生入学培训答疑

[SIGGRAPH Asia 2022] Position-Based Surface Tension Flow

元强化学习控制车辆模型 自动化驾驶模型

强化学习四足机器人二

从模型预测控制到强化学习-11：确定性策略梯度DPG与随机策略梯度SPG，从控制的角度理解(D)DPG, A2C, QAC, REINFORCE

使用运动约束强化学习的四足机器人

这绝对是B站目前讲的最好的最完整【强化学习实战】教程！带你从零详解PPO算法/DQN算法/A3C算法教程！

GPT4O1是强化学习和大模型的一次成功融合

Transformer+强化学习成为双热点强强联合的发文方向

会飞的自行车！自行车强化学习跳跃

[SIGGRAPH 2023] GestureDiffuCLIP: Gesture Diffusion Model with CLIP Latents

SOTA ! 浙大最新成果！四足强化学习走梅花桩!

Introduction to Real-Time Ray Tracing

不愧是李宏毅老师讲的【强化学习】简直太详细了！！小白也能信手拈来，建议收藏！（人工智能|机器学习|深度学习|强化学习）

入门到成神！三小时可快速上手的【深度强化学习】，不愧是北大王树森博士，讲的是真的通俗易懂！

不愧是李宏毅老师讲的【强化学习】简直太详细了！！小白也能信手拈来，学完可就业！-附资料（人工智能|机器学习|深度学习|强化学习）

如何直观理解PPO算法?博士详解近端策略优化算法原理+公式推导+训练实例！强化学习、深度强化学习、李宏毅

强化学习框架-Legged Gym 训练代码详解

[旋转 跳跃 后空翻] 四足/人形机器人的分阶段奖励塑造：一种受约束的多目标 RL 方法 | 开源代码在简介

rl_sar现已支持go2，欢迎试用

【长讲座】为何基于学习的控制有难有易？

从模型预测控制到强化学习12：DDPG做动态控制-研究生入学培训答疑

双热点强强联合的发文方向：Transformer+强化学习！

强化学习给视觉里程计自适应调参

具身智能新思路———Diffusion Policy 结合 PPO 模仿+强化（上）

元强化学习控制车辆模型自动化驾驶模型

[旋转跳跃后空翻] 四足/人形机器人的分阶段奖励塑造：一种受约束的多目标 RL 方法 | 开源代码在简介