V
主页
RLChina 2024 | 3小时强化学习入门课程-下
发布人
RLChina 2024的3小时强化学习入门课程(下半场)。该3小时课程已经在RLChina讲授3年。今年现场授课偏基础部分,表格式强化学习内容占据更多时间。 课件下载:https://wnzhang.net/teaching/sjtu-rl-2024/slides/rl-turorial-3h-rlchina2024.pdf
打开封面
下载高清视频
观看高清视频
视频下载器
不愧是顶会收割机!迪哥精讲强化学习4大主流算法:PPO、Q-learning、DQN、A3C 50集入门到精通!
CV强化论文分享20241025-01
RLHF基于人类反馈的强化学习动画讲解(LLM)
CV强化论文分享20241018-2
【2024汽车年会】大数据和人工智能:从系统辨识到AI建模 从最优控制到强化学习
Lec8-1: Mujoco Tutorial- 仿真原理,核心模块,与机器人仿真器
CV强化论文分享-20241025-02
不愧是李宏毅老师讲的【强化学习】简直太详细了!全程干货,通俗易懂,看完就跑通!(人工智能|机器学习|深度学习|强化学习)
Diffusion Policy 结合 PPO 模仿+强化 (下)
通俗理解大模型从预训练到微调实战!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习
强化学习魅力时刻
尤瓦尔·赫拉利对谈张静初:AI正在制造慢不下来的人
这应该是你能找到的讲解最系统全面的【强化学习】教程!北大出身王树森教授从零到一保姆式教学,小白也能很好懂!
[CoRL]使用模仿引导强化学习实现基于视觉的敏捷飞行 | 2024 苏黎世大学
强化学习,启动!
太惊人了!AI已经能生成任何视频了😱
强推!这绝对是B站最全的(python+机器学习+深度学习)系列教程,草履虫都能学会,学不会你来锤爆我!人工智能/机器学习/深度学习/python/神经网络
Mujoco安装指南
伦敦政治经济学院朱进博士:强化学习的变量选择方法
[搬] 稳健的类人机器人行走-通过强化学习增强基于模型的控制
斯坦福大学《强化学习|Stanford CS234 Reinforcement Learning 2024》deepseek翻译
具身智能机械臂实操入门课程-04(完):模型推理和抓取效果验证
使用ROS2-Control + RL来控制四足机器人
具身智能机械臂实操入门课程-02:相机选型、接线与代码调试
我居然半天就学会了强化学习!华理计算机博士45集精讲,带你一次吃透PPO、Q-learning、DQN、A3C算法原理与实战
【破解深度学习】1.2 一句话讲清CNN、RNN、Transformer的区别
强化小伙终于起立了
音乐恐怖,吓倒Spot狗狗了 波士顿动力 万圣节
太完整了!我居然3天时间就掌握了【机器学习+深度学习+强化学习+PyTorch】理论到实战,多亏了这个课程,绝对通俗易懂纯干货分享!
具身智能机械臂实操入门课程-03:机械臂的数据集录制与模型训练
【StableDiffusion】2024最细最保姆SD全套教程!零基础入门到精通,全程干货无废话!逼自己一个周学完,允许白嫖,拿走不谢,AI绘画 AI商业
我在B站上大学!【完整版-麻省理工-微积分重点】全18讲!学数学不看的微积分课程,看完顺滑一整年。_人工智能数学基础/机器学习/微积分/麻省理工/高等数学
dreamWaq复现尝试
波士顿动力 Spot 足臂协同操作
奔跑有点难度,步态很抽象,大佬们有没有什么好建议
用Isaac Lab和OpenUSD加速机器人学习
简单粗暴!1小时理解大模型预训练和微调!了解四大LLM微调方法,大模型所需NLP基础知识,基于人类反馈的强化学习、P-Tuning微调、Lora-QLora
210:cyber 无人船优化反步控制 轨迹跟踪 强化学习Actor-critic架构,李雅普诺夫稳定性,优化反布控制,强化学习(RL),水面舰艇
真的超容易“搞深度学习神经网络到底怎么改代码的啊?”复旦博士教我用一本书搞定!
[保姆级教程]梯度下降手把手教学、excel搭建神经网络