V
主页
蘑菇书作者手把手带你实现强化学习算法
发布人
强化学习实战教程:Qlearning、Sarsa、DQN 关注公众号【Datawhale】,回复“蘑菇书”,加入蘑菇书读者交流群,我们将在群里同步最新代码,并进行答疑、勘误、最新活动通知。 开源项目地址:https://github.com/datawhalechina/easy-rl 在线阅读地址:https://datawhalechina.github.io/easy-rl/
打开封面
下载高清视频
观看高清视频
视频下载器
我愿称之为强化学习天花板课程!台大李宏毅教授亲授强化学习教程,究极通俗易懂!建议收藏!
我愿称李宏毅强化学习为天花板课程!简单易懂!清晰明了的 PPO算法强化学习入门教程!深度强化学习、人工智能、神经网络
代码实现大模型强化学习(PPO),看这个视频就够了。
2_从零开始学习强化学习_MDP基础概念
上海交大张伟楠强化学习课程第15讲:AI Agent与决策大模型III
字节跳动花72小时讲完的抖音运营全套教程,手把手带你玩转自媒体,运营、剪辑、创业全搞定!
强化学习教父Sutton持续反向传播算法登Nature!证明深度学习还不如浅层网络
如何直观理解PPO算法?博士详解近端策略优化算法原理+公式推导+训练实例!强化学习、深度强化学习、李宏毅
什么叫鞭辟近里?三小时即可快速上手的【强化学习】系统教程,从零到一系统掌握基础原理及代码实战!
【论文代码复现122】基于强化学习的路径规划问题||强化学习和群智能优化算法有什么区别
【深度强化学习 CS285 2023】伯克利—中英字幕
上海交大张伟楠强化学习课程第7讲:规划与学习II
从模型预测控制到强化学习-11:确定性策略梯度DPG与随机策略梯度SPG,从控制的角度理解(D)DPG, A2C, QAC, REINFORCE
B站最新 顶级费曼学习法,学习一小时抵过十小时!目前B站最完整的高效学习方法教程!自律+方法+努力+坚持+时间,敢不敢花30天蜕变干掉平庸的自己!狠不下心不要进
秋招入职必刷!三小时快速上手【深度强化学习】,不愧是王树森博士,讲的实在是太通俗易懂了!
DPO:人类偏好对齐技术——大模型训练的最后一公里
从模型预测控制到强化学习12:DDPG做动态控制-研究生入学培训答疑
【缺陷检测:算法及比赛分析】- 江保祥
上海交大张伟楠强化学习课程第11讲:基于模型的深度强化学习III
大模型学习路线分享:作为开发者,我们如何学习大模型
强化学习在生活中的应用
我在B站上大学!【完整版-麻省理工-计算机图形学】全22讲!一口气吃透目前大热的3A游戏“黑神话悟空”核心技术光线追踪!!!(傅里叶/图像处理/人工智能课程)
如何用ChatGPT辅助科研全流程,提升科研效率,再也不担心发paper了
学术志——第三期AI辅助学术研究与论文写作系列直播课
强化学习创新下一站: 贝叶斯自适应马尔可夫决策过程,设计能自我激励、不断学习的Agent!
深度思考:在AI时代,你会被放大一千倍的能力是什么?
【Whalepaper第94期-强化学习】Mobile ALOHA: 低成本全身遥操作学习双手移动操作
冒死上传(已离职)反复看了20遍的学习方法【越学越爽】那些颠覆你价值观的学习方法!堪比人生外挂!高中生必看!考上清华的学习方法!超长干货!学习比游戏还爽个100
第151讲 跟不上课程进度怎么办
Diffusion模型的原理、使用和应用
第153讲 如何做到有效收藏
李宏毅《机器学习/深度学习》2021课程(国语版本,已授权)
【2024全宇宙最简单AI大模型项目实战-3】LangChain+RAG+LlamaIndex+Agent
跟着大佬25个小时吃透【无人驾驶技术】全套教程,一口气学完感知实战、视觉定位、路径规划、高精地图与车路协同、预测系统,技能点拉满!!!(自动驾驶/人工智能AI)
【聊聊Sora】第一期:Sora硬核技术解读,欢迎来到AI生成的世界!
[上]6个人形双足强化学习开源项目,论文讲解,代码速读,FLD,PBRS,footstep,ExBody,humanplus,humanoid-gym
【公开课】《博弈论》北京大学 精品公开课
【Datawhale】手把手教你打比赛 - 新闻推荐系列来了
强化训练Cot成为新的scaling law Cot为什么让大模型变强? 斯坦福论文揭秘
《药理学》4.5小时速成资源(知识点速记44集)