V
主页
强化学习魅力时刻
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
宇树狗儿 新增功能〖跳跃跑〗
【Python】人形机器人——强化学习
强化学习四足机器人三
dreamWaq复现尝试
【开源】宇树Unitree Go2四足机器人/机器狗Isaac Sim/Isaac Lab ROS2仿真平台
使用ROS2-Control + RL来控制四足机器人
斯坦福大学《强化学习|Stanford CS234 Reinforcement Learning 2024》deepseek翻译
[搬] 稳健的类人机器人行走-通过强化学习增强基于模型的控制
如何用rl_sar采集训练执行器网络的数据
RLChina 2024 | 3小时强化学习入门课程-下
【Yao Class Seminar】关于强化学习可解释性的talk
Decaying Action Priors for Accelerated Imitation Learning of Torque-Based Legged
【2024汽车年会】大数据和人工智能:从系统辨识到AI建模 从最优控制到强化学习
210:cyber 无人船优化反步控制 轨迹跟踪 强化学习Actor-critic架构,李雅普诺夫稳定性,优化反布控制,强化学习(RL),水面舰艇
不愧是顶会收割机!迪哥精讲强化学习4大主流算法:PPO、Q-learning、DQN、A3C 50集入门到精通!
用Isaac Lab和OpenUSD加速机器人学习
太完整了!我居然3天时间就掌握了【机器学习+深度学习+强化学习+PyTorch】理论到实战,多亏了这个课程,绝对通俗易懂纯干货分享!
RLHF基于人类反馈的强化学习动画讲解(LLM)
Stanford CS234 2024 Spring | 强化学习 | Reinforcement Learning
强化学习,启动!
g1套humanoid_gym
强化小伙终于起立了
动画讲解深度强化学习(RL、Q-网络、策略优化、大模型算法入门教程)
[CoRL]使用模仿引导强化学习实现基于视觉的敏捷飞行 | 2024 苏黎世大学
RLHF训练法从零复现,TRL版本复现,代码实战,大语言模型训练
四足机器人ROS PID控制原理讲解
这才是小白该学的AI入门教程!上交大教授系统解读【机器学习】+【深度学习】+【强化学习】入门及实战,绝对通俗易懂!
Go2翻车视频
通俗理解大模型从预训练到微调实战!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习
【西湖公开课】西湖博导赵世钰的强化学习免费课程来了
不愧是李宏毅老师讲的【强化学习】简直太详细了!全程干货,通俗易懂,看完就跑通!(人工智能|机器学习|深度学习|强化学习)
简单粗暴!1小时理解大模型预训练和微调!了解四大LLM微调方法,大模型所需NLP基础知识,基于人类反馈的强化学习、P-Tuning微调、Lora-QLora
【共享LLM前沿】直观理解大模型预训练和微调!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习微调,代码讲解
最新 Boston Dynamics Atlas 人形机器人 合集
Figure机器人更新在宝马车间“打工”的状态
【揭秘】五指灵巧手DexHand021 产线组装的秘密
沼泽小狗 机器狗 Ghost V60
Humanoid Self-Collision Avoidance Using Whole-Body Control with CBF
这应该是你能找到的讲解最系统全面的【强化学习】教程!北大出身王树森教授从零到一保姆式教学,小白也能很好懂!
Go2迷彩套装