V
主页
京东 11.11 红包
ControlVAE: 使用基于模型强化学习的物理角色动作生成
发布人
ControlVAE: 使用基于模型强化学习的物理角色动作生成 作者: Heyuan Yao, Zhenhua Song, Baoquan Chen, Libin Liu 论文: ControlVAE: Model-Based Learning of Generative Controllers for Physics-Based Characters, ACM Transactions on Graphics (SIGGRAPH Asia 2022) 单位: 北京大学 项目主页: https://heyuanyao-pku.github.io/Control-VAE/ 摘要 (Abstract): In this paper, we introduce ControlVAE, a novel model-based framework for learning generative motion control policies based on variational autoencoders (VAE). Our framework can learn a rich and flexible latent representation of skills and a skill-conditioned generative control policy from a diverse set of unorganized motion sequences, which enables the generation of realistic human behaviors by sampling in the latent space and allows high-level control policies to reuse the learned skills to accomplish a variety of downstream tasks. In the training of ControlVAE, we employ a learnable world model to realize direct supervision of the latent space and the control policy. This world model effectively captures the unknown dynamics of the simulation system, enabling efficient model-based learning of high-level downstream tasks. We also learn a state-conditional prior distribution in the VAE-based generative control policy, which generates a skill embedding that outperforms the non-conditional priors in downstream tasks. We demonstrate the effectiveness of ControlVAE using a diverse set of tasks, which allows realistic and interactive control of the simulated characters.
打开封面
下载高清视频
观看高清视频
视频下载器
强推!北京大学王树森半天就教会了我深度强化学习,原理详解+项目实战,学不会来打我!
【基于深度强化学习的冠军级别无人机竞速】强化学习和模型预测控制MPC中英字幕18讲!
【中英字幕】强化学习和模型预测控制18讲!四大名校教授精讲模型预测控制、最优控制、强化学习入门
【大模型+强化学习】怎么理解大模型训练中的RLHF(人类反馈强化学习)?ChatGPT背后的数学原理
我愿称李宏毅强化学习为天花板课程!简单易懂!清晰明了的 PPO算法强化学习入门教程!深度强化学习、人工智能、神经网络
大模型如何增强强化学习?简单粗暴理解大模型训练中的人类反馈强化学习RLHF!PPO算法、ChatGPT背后的数学原理
【MPC+强化学习】四大名校教授精讲强化学习和模型预测控制18讲!Actor Critic模型预测控制、策略梯度方法
这可能是我见过强化学习和模型预测控制最好的教程!四大名校教授精讲动态系统和仿真、最优控制、策略梯度方法、MPC
[SIGGRAPH 2024] A Vortex Particle-on-Mesh Method for Soap Film Simulation
ACM SIGGRAPH Asia 2024 | RobotMDM:机器人运动扩散模型:机器人角色的运动生成
【论文代码复现122】基于强化学习的路径规划问题||强化学习和群智能优化算法有什么区别
【李宏毅】强化学习课程完整版千万不要错过!简单明了的PPO算法讲解!深度强化学习、人工智能、机器学习、大模型
具身智能新思路———Diffusion Policy 结合 PPO 模仿+强化 (上)
【即插即用】Pybullet端强化学习算法训练机械臂
太完整了!我居然3天时间就掌握了【机器学习+深度学习+强化学习+PyTorch】理论到实战,多亏了这个课程,绝对通俗易懂纯干货分享!
我愿称之为强化学习天花板课程!台大李宏毅教授亲授强化学习教程,究极通俗易懂!建议收藏!
从模型预测控制到强化学习12:DDPG做动态控制-研究生入学培训答疑
[SIGGRAPH Asia 2022] Position-Based Surface Tension Flow
元强化学习控制车辆模型 自动化驾驶模型
强化学习四足机器人二
从模型预测控制到强化学习-11:确定性策略梯度DPG与随机策略梯度SPG,从控制的角度理解(D)DPG, A2C, QAC, REINFORCE
使用运动约束强化学习的四足机器人
这绝对是B站目前讲的最好的最完整【强化学习实战】教程!带你从零详解PPO算法/DQN算法/A3C算法教程!
GPT4O1是强化学习和大模型的一次成功融合
Transformer+强化学习成为双热点强强联合的发文方向
会飞的自行车!自行车强化学习跳跃
[SIGGRAPH 2023] GestureDiffuCLIP: Gesture Diffusion Model with CLIP Latents
SOTA ! 浙大最新成果!四足强化学习走梅花桩!
Introduction to Real-Time Ray Tracing
不愧是李宏毅老师讲的【强化学习】简直太详细了!!小白也能信手拈来,建议收藏!(人工智能|机器学习|深度学习|强化学习)
入门到成神!三小时可快速上手的【深度强化学习】,不愧是北大王树森博士,讲的是真的通俗易懂!
不愧是李宏毅老师讲的【强化学习】简直太详细了!!小白也能信手拈来,学完可就业!-附资料(人工智能|机器学习|深度学习|强化学习)
如何直观理解PPO算法?博士详解近端策略优化算法原理+公式推导+训练实例!强化学习、深度强化学习、李宏毅
强化学习框架-Legged Gym 训练代码详解
[旋转 跳跃 后空翻] 四足/人形机器人的分阶段奖励塑造:一种受约束的多目标 RL 方法 | 开源代码在简介
rl_sar现已支持go2,欢迎试用
【长讲座】为何基于学习的控制有难有易?
从模型预测控制到强化学习12:DDPG做动态控制-研究生入学培训答疑
双热点强强联合的发文方向:Transformer+强化学习!
强化学习给视觉里程计自适应调参