RLChina 2024 | 3小时强化学习入门课程-下 - 视频下载 Video Downloader

RLChina 2024 | 3小时强化学习入门课程-下

发布人

RLChina 2024的3小时强化学习入门课程（下半场）。该3小时课程已经在RLChina讲授3年。今年现场授课偏基础部分，表格式强化学习内容占据更多时间。
课件下载：https://wnzhang.net/teaching/sjtu-rl-2024/slides/rl-turorial-3h-rlchina2024.pdf

打开封面下载高清视频观看高清视频视频下载器

不愧是顶会收割机！迪哥精讲强化学习4大主流算法：PPO、Q-learning、DQN、A3C 50集入门到精通！

CV强化论文分享20241025-01

RLHF基于人类反馈的强化学习动画讲解（LLM）

CV强化论文分享20241018-2

【2024汽车年会】大数据和人工智能：从系统辨识到AI建模从最优控制到强化学习

Lec8-1: Mujoco Tutorial- 仿真原理，核心模块，与机器人仿真器

CV强化论文分享-20241025-02

不愧是李宏毅老师讲的【强化学习】简直太详细了！全程干货，通俗易懂，看完就跑通！（人工智能|机器学习|深度学习|强化学习）

Diffusion Policy 结合 PPO 模仿+强化（下）

通俗理解大模型从预训练到微调实战！P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习

强化学习魅力时刻

尤瓦尔·赫拉利对谈张静初：AI正在制造慢不下来的人

这应该是你能找到的讲解最系统全面的【强化学习】教程！北大出身王树森教授从零到一保姆式教学，小白也能很好懂！

[CoRL]使用模仿引导强化学习实现基于视觉的敏捷飞行 | 2024 苏黎世大学

强化学习，启动！

太惊人了！AI已经能生成任何视频了😱

强推！这绝对是B站最全的（python＋机器学习＋深度学习）系列教程，草履虫都能学会，学不会你来锤爆我！人工智能/机器学习/深度学习/python/神经网络

Mujoco安装指南

伦敦政治经济学院朱进博士：强化学习的变量选择方法

[搬] 稳健的类人机器人行走-通过强化学习增强基于模型的控制

斯坦福大学《强化学习|Stanford CS234 Reinforcement Learning 2024》deepseek翻译

具身智能机械臂实操入门课程-04（完）：模型推理和抓取效果验证

使用ROS2-Control + RL来控制四足机器人

具身智能机械臂实操入门课程-02：相机选型、接线与代码调试

我居然半天就学会了强化学习！华理计算机博士45集精讲，带你一次吃透PPO、Q-learning、DQN、A3C算法原理与实战

【破解深度学习】1.2 一句话讲清CNN、RNN、Transformer的区别

强化小伙终于起立了

音乐恐怖，吓倒Spot狗狗了波士顿动力万圣节

太完整了！我居然3天时间就掌握了【机器学习+深度学习+强化学习+PyTorch】理论到实战，多亏了这个课程，绝对通俗易懂纯干货分享！

具身智能机械臂实操入门课程-03：机械臂的数据集录制与模型训练

【StableDiffusion】2024最细最保姆SD全套教程！零基础入门到精通，全程干货无废话！逼自己一个周学完，允许白嫖，拿走不谢，AI绘画 AI商业

我在B站上大学!【完整版-麻省理工-微积分重点】全18讲！学数学不看的微积分课程，看完顺滑一整年。_人工智能数学基础/机器学习/微积分/麻省理工/高等数学

dreamWaq复现尝试

波士顿动力 Spot 足臂协同操作

奔跑有点难度，步态很抽象，大佬们有没有什么好建议

用Isaac Lab和OpenUSD加速机器人学习

简单粗暴！1小时理解大模型预训练和微调！了解四大LLM微调方法，大模型所需NLP基础知识，基于人类反馈的强化学习、P-Tuning微调、Lora-QLora

210:cyber 无人船优化反步控制轨迹跟踪强化学习Actor-critic架构，李雅普诺夫稳定性，优化反布控制，强化学习（RL），水面舰艇

真的超容易“搞深度学习神经网络到底怎么改代码的啊？”复旦博士教我用一本书搞定！

[保姆级教程]梯度下降手把手教学、excel搭建神经网络