V
主页
强化学习(PPO)训练小车到达目标
发布人
强化学习(PPO)训练小车到达多个随机目标位置。
打开封面
下载高清视频
观看高清视频
视频下载器
强化学习训练四足机器人前进
强化学习(PPO)训练小车避障到达目标
强化学习,启动!
强化学习魅力时刻
强化学习训练四足-Unity3D
【Python】人形机器人——强化学习
强化小伙终于起立了
机械臂任务空间全动力学控制(鸡头稳定)
Go2翻车视频
四足连续静态行走测试
[搬] 稳健的类人机器人行走-通过强化学习增强基于模型的控制
使用ROS2-Control + RL来控制四足机器人
复现human2humanoid
四足连续静态行走
RLHF训练法从零复现,TRL版本复现,代码实战,大语言模型训练
上机试了下,效果不错的
二足机器人 VTK 显示脚末端力(Based on TCP)
测试行走站立切换和站立抗冲击
二足机器人自适应上下台阶
[CoRL]使用模仿引导强化学习实现基于视觉的敏捷飞行 | 2024 苏黎世大学
终于可以站起来了,就是lstm训练的慢了好多…
右边两足走路也是双足行走
强强联合!GNN+强化学习!刷爆SOTA,霸榜顶会的28个方案
奔跑有点难度,步态很抽象,大佬们有没有什么好建议
210:cyber 无人船优化反步控制 轨迹跟踪 强化学习Actor-critic架构,李雅普诺夫稳定性,优化反布控制,强化学习(RL),水面舰艇
RLHF基于人类反馈的强化学习动画讲解(LLM)
【揭秘】五指灵巧手DexHand021 产线组装的秘密
g1套humanoid_gym
不愧是李宏毅老师讲的【强化学习】简直太详细了!全程干货,通俗易懂,看完就跑通!(人工智能|机器学习|深度学习|强化学习)
TITA强化学习迁移
ChatGPT驱动清洁机器人背后依靠强化学习开源项目
AI芯片由AI设计真形成闭环了强化学习驱动芯片设计
6个智能体的编队导航与避障_补充实验
小车视觉巡线迷宫(webots)
通俗理解大模型从预训练到微调实战!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习
训狗_3
Go2迷彩套装
灵巧手钢琴演奏 RoboPianist
不愧是顶会收割机!迪哥精讲强化学习4大主流算法:PPO、Q-learning、DQN、A3C 50集入门到精通!
动画讲解深度强化学习(RL、Q-网络、策略优化、大模型算法入门教程)