试验失败系列1号作品：基于transformer的rl policy（希望下次能好点吧…哭泣）

发布人

基于transformer的policy，感觉效果贼差，不过狗子电量很低了，也不知道是否有关系

打开封面下载高清视频观看高清视频视频下载器

代码库更新系列一：大家快来康康！github ：LocomotionWithNP3O

试验失败系列2:基于MANN的policy，其实走的还成，就是上楼梯太暴力了，得再改改…

基于强化学习的go2 sim2real部署展示（业余爱好大佬勿喷）

成功小实验系列1:修改了下reward然后kp30 kd0.75训练以及部署，貌似姿态还改善了呢

试验成功系列2:基于MANN的policy，改了些东西之后稳定多了(动作还是很丑呢）

步态好些了，但是感觉爬楼还是一般，扎心了

试验不咋成功又不咋失败系列1:继续是MANN的policy，但是，调完之后步态还是不咋好看，流泪了

【通用】人形机器人RL策略Gazebo二次仿真框架

ETH 最新RL成果，已开源！SMUG 规划器：适用于具有挑战性环境下的移动机器人的安全多目标规划器

4K光追的强化学习——IsaacSimLab(Orbit)测试

基于强化学习的机器人轴孔装配仿真

写了一个人形机器人仿真，适用5或者6自由度的腿形

[强化学习]为什么我做的实验结果和论文里的结果不一样

发论文idea来了，强化学习+Transformer 29个创新点汇总！再也不用担心发论文了

请问强化学习的损失是上升的怎么回事

"赛博吗喽"？机器狗变成猴了！

双足机器人的深度强化学习- MATLAB and Simulink

ORCA SIM 仿真平台再升级，支持mujoco物理引擎，openai gym 强化学习训练框架😎

深度强化学习算法carla平台实战-PPO算法

12大模型全栈-强化学习05-RLHF实战-端到端全流程解决方案-轩辕大模型强化学习完整流程介绍（数据+奖励模型+强化学习调参经验）

基于分层优化的四足机器人全身运动控制搬运重物

08大模型全栈-强化学习01-RLHF前言传统强化学习

机器智能硕士【几何深度学习】课程！将几何先验知识融入深度学习模型！物理、强化学习、transformer、图神经网络、数学

(IROS 2023) 浮动基座机器人本体感受外部力矩学习及其在类人运动中的应用

基于QT的可视化路由训练平台+DQN强化学习（七剑学院QT项目，开发中）

太全了！2024李宏毅AI人工智能教程合集！一口气带你刷完机器学习、深度学习、强化学习、神经网络和自然语言处理！真的比盲目自学好多了！

太牛了！颠覆传统【深度强化学习】，被应用于多个经典强化学习算法中的异步强化学习方法究竟有何跨时代意义？一篇论文解析告诉你！！！

强烈推荐！一套课程解决人工智能入门三步走：机器学习、深度学习、强化学习，真正适合小白自学的神级教程！

博士论文答辩 - Alexander Schperberg - 统一基于模型的优化和机器学习

零基础学习强化学习算法：ppo

双足机器人步态生成 MATLAB and Simulink

B站首推！不愧是李宏毅老师讲的【强化学习】简直太详细！！！2024公认最通俗易懂的【强化学习教程】小白也能信手拈来（人工智能|机器学习|深度学习|强化学习）

双足机器人的建模与仿真 MATLAB and Simulink

人形机器人盲上16cm楼梯仿真

我们的人形机器人不愿意使用大模型去思考。但是它很爱玩耍。[humanoid parkour learning]

为什么说强化学习在近年不会被广泛应用？

[RSS 24] Rethinking Robustness Assessment 重新思考鲁棒性评估

【强化学习入门】9.3 Policy Gradient 算法概述+实验设计

[RLHF] 从 PPO rlhf 到 DPO，公式推导与原理分析

B站强推！一口气学完人工智能入门到精通：机器学习+深度学习+强化学习，课程涵盖所有基础知识及项目实战，主打一个通俗易懂！

试验失败系列1号作品：基于transformer的rl policy（希望下次能好点吧…哭泣）

代码库更新系列一：大家快来康康！github ：LocomotionWithNP3O

试验失败系列2:基于MANN的policy，其实走的还成，就是上楼梯太暴力了，得再改改…

基于强化学习的go2 sim2real部署展示（业余爱好大佬勿喷）

成功小实验系列1:修改了下reward然后kp30 kd0.75训练以及部署，貌似姿态还改善了呢

试验成功系列2:基于MANN的policy，改了些东西之后稳定多了(动作还是很丑呢）

步态好些了，但是感觉爬楼还是一般，扎心了

试验不咋成功又不咋失败系列1:继续是MANN的policy，但是，调完之后步态还是不咋好看，流泪了

【通用】人形机器人RL策略Gazebo二次仿真框架

ETH 最新RL成果，已开源！SMUG 规划器：适用于具有挑战性环境下的移动机器人的安全多目标规划器

4K光追的强化学习——IsaacSimLab(Orbit)测试

基于强化学习的机器人轴孔装配仿真

写了一个人形机器人仿真，适用5或者6自由度的腿形

[强化学习]为什么我做的实验结果和论文里的结果不一样

发论文idea来了，强化学习+Transformer 29个创新点汇总！ 再也不用担心发论文了

请问强化学习的损失是上升的怎么回事

"赛博吗喽"？ 机器狗变成猴了！

双足机器人的深度强化学习- MATLAB and Simulink

ORCA SIM 仿真平台再升级，支持mujoco物理引擎，openai gym 强化学习训练框架😎

深度强化学习算法carla平台实战-PPO算法

12大模型全栈-强化学习05-RLHF实战-端到端全流程解决方案-轩辕大模型强化学习完整流程介绍（数据+奖励模型+强化学习调参经验）

基于分层优化的四足机器人全身运动控制搬运重物

08大模型全栈-强化学习01-RLHF前言传统强化学习

机器智能硕士【几何深度学习】课程！将几何先验知识融入深度学习模型！物理、强化学习、transformer、图神经网络、数学

(IROS 2023) 浮动基座机器人本体感受外部力矩学习及其在类人运动中的应用

基于QT的可视化路由训练平台+DQN强化学习（七剑学院QT项目，开发中）

太全了！2024李宏毅AI人工智能教程合集！一口气带你刷完机器学习、深度学习、强化学习、神经网络和自然语言处理！真的比盲目自学好多了！

太牛了！颠覆传统【深度强化学习】，被应用于多个经典强化学习算法中的异步强化学习方法究竟有何跨时代意义？一篇论文解析告诉你！！！

强烈推荐！一套课程解决人工智能入门三步走：机器学习、深度学习、强化学习，真正适合小白自学的神级教程！

博士论文答辩 - Alexander Schperberg - 统一基于模型的优化和机器学习

零基础学习强化学习算法：ppo

双足机器人步态生成 MATLAB and Simulink

B站首推！不愧是李宏毅老师讲的【强化学习】简直太详细！！！2024公认最通俗易懂的【强化学习教程】小白也能信手拈来（人工智能|机器学习|深度学习|强化学习）

双足机器人的建模与仿真 MATLAB and Simulink

人形机器人盲上16cm楼梯仿真

我们的人形机器人不愿意使用大模型去思考。但是它很爱玩耍。[humanoid parkour learning]

为什么说强化学习在近年不会被广泛应用？

[RSS 24] Rethinking Robustness Assessment 重新思考鲁棒性评估

【强化学习入门】9.3 Policy Gradient 算法概述+实验设计

[RLHF] 从 PPO rlhf 到 DPO，公式推导与原理分析

B站强推！一口气学完人工智能入门到精通：机器学习+深度学习+强化学习，课程涵盖所有基础知识及项目实战，主打一个通俗易懂！

发论文idea来了，强化学习+Transformer 29个创新点汇总！再也不用担心发论文了

"赛博吗喽"？机器狗变成猴了！