V
主页
如何解决强化学习(RL)中有效学习率衰减?归一化&权重投影联合一下呗!
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
仅一个简单机制,防止绝大多数深度学习模型权重过大问题!不得不学的权重剪裁手法 #持续学习 #强化学习 #神经网络
强化学习在ROS2中实现巡线小车
青龙人形机器人开源强化学习库GymLoong测试
深度强化学习Carla实战-SAC算法(一)
强化学习第一步---换个模型玩
使用CARLA-SB3-Training-Environment训练的自动驾驶RL模型效果演示
具身机器人结构化建模新热潮:掩码注意力增强Transformer,通杀MLP和基线T模型!
上海交大张伟楠强化学习课程第1讲:强化学习简介III
尤瓦尔:拥有这两种能力,能更好地适应未来
人生苦短,我用深度强化学习零基础入门视频全套课程,PPO算法/DQN算法/A3C 保姆级教程(学完可就业)
狗王争霸挑战赛,2周快速入门强化学习与locomotion
腿式机器人的多接触惯性估计与定位 [论文在审稿中]
RA-L 24浙大最新成果Parkour with Implicit-Explicit Learning Framework for Legged Robots
Isaaclab强化学习训练人形机器人走路
【一起啃书】全16章机器学习西瓜书速成!算法原理+手推公式,线性回归、强化学习、聚类算法、规则学习、决策树
三指灵巧手,强化学习手内灵巧操作连续成功
好出创新点:小样本学习的10种前沿方法汇总,发论文必看!
2024强推!这可能是B站目前最系统的无人驾驶技术全套教程了,一口气带你学完感知实战、视觉定位、路径规划、预测系统!!(自动驾驶/路径规划/强化学习/人工智能)
综述:自动驾驶的多智能体强化学习,旨在帮助研究人员整合多智能体强化学习技术
我在B站上大学系列!北大王树森精讲7小时搞懂深度强化学习!建议收藏!
上海交大张伟楠强化学习课程第6讲:无模型控制方法II
一次性训了一个带fall recovery 和 velocity tracking的policy,目前步态看着还成
[下]6个人形双足强化学习开源项目,论文讲解,代码速读,FLD,PBRS,footstep,ExBody,humanplus,humanoid-gym
自动设置学习率的方法:D-适应【附原文和代码】
同济 熊溪:基于强化学习与大语言模型的智能网联交通系统决策优化「OR Talk #32」
Transformer与Mamba最强联合体:最新量化技术加持256K上下文,语言模型进化从未停歇
四足运动:用三种不同的方法在崎岖地形上行走
FPS鼻祖DOOM重现江湖!仅凭扩散模型颠覆游戏开发革命,每秒20帧实时模拟画面
斯坦福李飞飞终于把【计算机视觉】给讲明白了!全程16集,学不会我退出IT界!深度学习cs231n公开课【中英字幕】
比啃书爽!周志华机器学习视频全套教程终于找到了!简单易懂!强化学习/神经网络/线性回归/聚类算法/半监督学习
Points2Plans:从点云到具有可组合关系动力学的长期规划
AI超级进化! AI自己写代码设计的智能体, 水平碾压人类?
数学与AI结合的新里程碑:Lean4专用DeepSeek语言模型,全新蒙特卡洛树搜索变体
权重初始化新方法:大模型权重初始化小模型,训练省时又涨点!
通俗易懂!一口气学完人工智能入门到精通:机器学习+深度学习+强化学习,课程涵盖所有基础知识及项目实战,三位计算机大佬倾囊相授!
【强化学习玩游戏】简单易懂的PPO算法及公式推导!强化学习轮足机器人控制器、月球登陆器训练+超级马里奥项目实战!
【小样本合集】小样本学习必读的15篇顶会论文
最好的结合创新:小波变换+注意力机制,实现100%分类准确率!11种创新手法
感觉比之前好多了呢(rl运控实验成功系列)欢迎大家给我的repo加star~