V
主页
强化学习两派经典对比串讲:TD3、PPO,或许他们还可以融合?
发布人
以经典算法TD3、PPO分别为off-policy、on-policy代表,串讲比对了RL两大思路。视频并没有展开TD3、PPO的细节,而是跳出来从抽象物理含义上对比2类方法思路,最后针对TD3方法局限于确定性问题,结合on-policy的思想提出了一种或许可行的改进思路
打开封面
下载高清视频
观看高清视频
视频下载器
这或许是流体力学机器学习最好的视频!机器学习如何在流体力学中应用?Steve Brenton大佬精讲湍流模型,深度强化学习、CFD
深度强化学习 PPO 纯白板逐行代码Python实现
吹爆!这绝对是同济大学最出名的AI Agent系列课程了,零基础阶段必备的前沿AI技术,还不会打造专属大模型智能体来打我!人工智能|机器学习|深度学习|强化学习
【解码端到端】从蔚来算法架构到特斯拉FSD V12技术推演
我愿称李宏毅强化学习为天花板课程!简单易懂!清晰明了的 PPO算法强化学习入门教程!深度强化学习、人工智能、神经网络
代码实现大模型强化学习(PPO),看这个视频就够了。
【解码端到端】waymo规划篇1 learn-based pnc成果串讲
如何直观理解PPO算法?博士详解近端策略优化算法原理+公式推导+训练实例!强化学习、深度强化学习、李宏毅
【深度强化学习】作者华盛顿大学Steve Brunton教授精讲《数据驱动的科学与工程:机器学习、动态系统与控制》流体动力学、SVD、神经网络
上海交大张伟楠强化学习课程第15讲:AI Agent与决策大模型III
自动驾驶决策规划任务开源数据集benchmark nuplan介绍
深度强化学习Carla实战-SAC算法(二)--SAC-Carla训练过程
RL vs MPC,LeCun:MPC,胜!我不看好强化学习
Unity使用自己的强化学习算法(DQN)训练智能体——学习日记
通俗易懂!一口气学完人工智能入门到精通:机器学习+深度学习+强化学习,课程涵盖所有基础知识及项目实战,三位计算机大佬倾囊相授!
【解码端到端】waymo预测篇1 learn-based pnc成果串讲
强推!不愧是李宏毅教授!一口气把机器学习、深度学习、强化学习、神经网络、生成式AI给讲透了!存下吧,真的比啃书好多了!(AI人工智能/ChatGPT)
上海交大张伟楠强化学习课程第12讲:模仿学习II
这才是科研人该学的!一口气学完自动驾驶八大算法-环境感知、目标检测、语义分割、强化学习、决策与控制算法!原理到实战,太通俗易懂了!机器学习|深度学习|计算机视觉
【论文代码复现122】基于强化学习的路径规划问题||强化学习和群智能优化算法有什么区别
强化学习教父Sutton持续反向传播算法登Nature!证明深度学习还不如浅层网络
2_从零开始学习强化学习_MDP基础概念
【深度强化学习 CS285 2023】伯克利—中英字幕
没病走两步?!深度强化学习训练AI走路!
OpenAI o1 核心成员 Hyung Won Chung 分享最新内幕 (1/2)
独家视频解读:【北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式】
浅聊数据驱动在自动驾驶PnC上的几种应用范式
PX4自动代码生成,pixhawk,使用MBD搭建神经网络控制四旋翼,强化学习,神经网络控制,四旋翼姿态控制
强化学习框架-Legged Gym 训练代码详解
上海交大张伟楠强化学习课程第3讲:马尔可夫决策过程II
2024年最适合新手人群的【Python基础+机器学习+深度学习+强化学习】教程,简单易懂,草履虫都能学会!!!(人工智能课程/python机器学习)
【西瓜书全网最详尽讲解】计算机博士花费30个小时白话讲解!保证能学会!! -人工智能/机器学习/深度学习
强化训练Cot成为新的scaling law Cot为什么让大模型变强? 斯坦福论文揭秘
斯坦福大学《强化学习|Stanford CS234 Reinforcement Learning Winter 2019》中英字幕(豆包翻译
秋招入职必刷!三小时快速上手【深度强化学习】,不愧是王树森博士,讲的实在是太通俗易懂了!
发论文idea来了!强化学习融合Transformer,全是创新点!
上海交大张伟楠强化学习课程第15讲:AI Agent与决策大模型II
整整200集,比刷剧还爽!深度学习必看圣经!李沐大神《动手学深度学习》最新版全套视频教程分享(人工智能/深度学习/计算机视觉)
【中文配音】深度学习(3Blue1Brown)
强化学习创新下一站: 贝叶斯自适应马尔可夫决策过程,设计能自我激励、不断学习的Agent!