V
主页
强化学习1基础知识介绍&月球登录器的强化学习模型训练 gym baselines3
发布人
强化学习系列教程1: 基础知识介绍&月球登录器的强化学习模型训练 未来半年本人将担任RWTH WZL学院的科研助理,主要从事强化学习,因此将强化学习的学习心得与代码分享大家,如有疏漏,还望指正 up个人博客: https://bkdzq.github.io 各社交媒体&公众号同名: 中级错题家 代码,环境要求及演示课件:https://szdyzq.lanzoum.com/iVesS1cguwda 参考链接:https://pythonprogramming.net/ || https://huggingface.co/learn/deep-rl-course/
打开封面
下载高清视频
观看高清视频
视频下载器
上海交大张伟楠强化学习课程第16讲:基于扩散模型的强化学习
强化学习教程3: 使用自定义gym环境训练贪吃蛇强化学习模型
强化学习教程2: 月球登录器的强化学习模型 保存 & 加载
[重置版]强化学习教程5:从零开始实现Deep Q Learning 使用pytorch 操纵月球登录器
[重置版]强化学习系列教程8:DDPG 算法 实现单摆的控制 || A2C算法变种
【深度强化学习 CS285 2023】伯克利—中英字幕
[重置版]强化学习教程4:Q-learning 游戏 ice lake python gym
[上]6个人形双足强化学习开源项目,论文讲解,代码速读,FLD,PBRS,footstep,ExBody,humanplus,humanoid-gym
AI训练贪吃蛇 基于强化学习 Deep Q Learning
[下]6个人形双足强化学习开源项目,论文讲解,代码速读,FLD,PBRS,footstep,ExBody,humanplus,humanoid-gym
手把手教你用YOLOv8训练自己的数据集(原理解析+代码实践)
【强化学习玩游戏】简单易懂的PPO算法及公式推导!强化学习轮足机器人控制器、月球登陆器训练+超级马里奥项目实战!
深度强化学习 PPO 纯白板逐行代码Python实现
COMSOL深度神经网络学习-模型预测-代理模型训练
强化学习论文分享20240808
我在B站上大学系列!北大王树森精讲7小时搞懂深度强化学习!建议收藏!
为什么Isaac gym 读取的速度不等于位置的微分呀,用pd算的力矩不就是错的吗
强推!这可能是B站最全的【Python+机器学习+深度学习】系列课程了,从入门到精通,堪称人工智能系列课程的巅峰之作!_AI/人工智能/深度学习/机器学习
【强化学习玩游戏】强化学习轮足机器人控制器,PPO算法原理+公式推导,月球登陆器训练+超级马里奥简单易懂的项目实战!
强化学习第一步---换个模型玩
青龙人形机器人开源强化学习库GymLoong测试
缝合CNN+LSTM+KAN模型,KAN是提升模型性能的重点?一期时间序列预测任务实战告诉你答案! -机器学习/深度学习/Pytorch
FLUX LORA训练丨真有手就行!
【黑神话:悟空】中机器学习算法的奇妙运用,从机器学习到游戏性能优化,一口气学完机器学习经典算法-机器学习/深度学习/强化学习/算法/智能NPC
什么是卷积?强推!这绝对是全网最通俗易懂的【卷积神经网络教程】!草履虫听了都点头!人工智能、深度学习、机器学习
上海交大张伟楠强化学习课程第6讲:无模型控制方法II
【2024最新完整版】不愧是李宏毅教授!一口气学完机器学习、深度学习、强化学习、NLP、生成式AI等课程!一套全解决!
基于灵活调用的深度强化学习——用于嵌入式系统的动态电压频率缩放(宁波诺丁汉大学 嵌入式智能工作组)
强化学习在ROS2中实现巡线小车
强化学习论文分享20240725
从模型预测控制到强化学习10:“直来直往-直接给策略推荐”的确策略梯度(PG)方法REINFORCE-A2C-原理与仿真
RL vs MPC,LeCun:MPC,胜!我不看好强化学习
上海交大张伟楠强化学习课程第3讲:马尔可夫决策过程II
超强动画演示,一步一步深入浅出解释Transformer原理!这可能是我看到过最通俗易懂的Transformer教程了吧!——(人工智能、大模型、深度学习)
导师强烈安利的模型训练可视化工具,不愧是深度学习最强炼丹伴侣!
【深度强化学习】华盛顿大学Steve Brunton教授精讲《数据驱动的科学与工程:机器学习、动态系统与控制》
【浙大知识图谱完整版】不愧是浙大教授!5小时让我搞定了知识图谱!知识图谱/计算机视觉/神经网络
强烈建议深度学习炼丹师们死磕这个炼丹神器,无需代码就能进行训练可视化作业,简直太赞了!
机器学习全流程[合集] 模型训练 评估 Web App Docker部署
上海交大张伟楠强化学习课程第7讲:规划与学习II