V
主页
京东 11.11 红包
十分钟强化学习系列第一讲:基本概念
发布人
用代码来理解深度强化学习领域的方方面面。从零开始编写强化学习的环境和算法,让初学者全面理解强化学习的基础知识到前沿算法。本系列讲座估计总长度十期,每期十分钟左右。但是第一期基本概念有点多,超时了。。。
打开封面
下载高清视频
观看高清视频
视频下载器
用7年前的显卡在那跑强化学习 issacgym
这可能是我见过强化学习和模型预测控制最好的教程!四大名校教授精讲动态系统和仿真、最优控制、策略梯度方法、MPC
985华五南京大学毕业裁员后b站教高等数学,用python分析函数的极限,学弟学妹看后让我手把手教ta
编程语言恩情课文《Python爷爷用object打下类型错误》
双热点强强联合的发文方向:Transformer+强化学习!
十分钟强化学习系列第五讲:SARSA和Q-Learning
十分钟强化学习系列第十一讲:DDPG方法(本系列完结,代码上传和推荐书目)
强化学习四足机器人一
十分钟强化学习系列第八讲:Deep Q-Network
十分钟强化学习系列第二讲:策略迭代
十分钟强化学习系列第十讲:策略梯度方法
强推!北京大学王树森半天就教会了我深度强化学习,原理详解+项目实战,学不会来打我!
十分钟强化学习系列第四讲:蒙特卡罗方法
十分钟强化学习系列第六讲:Model-Based方法
十分钟强化学习系列第三讲:探索和利用
十分钟强化学习系列第九讲:DQN的三种改进思路
Python和强化学习玩转贪吃蛇AI (2)
《我的科技在你之上》
玩游戏学Python系列第一讲:Pygame基本概念
Python和强化学习玩转贪吃蛇AI (1)
Python和强化学习玩转贪吃蛇AI (3)
通俗理解大模型从预训练到微调实战!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习
MPC+强化学习!Actor Critic模型预测控制,苏黎世大牛教授人类水平性能的自主视觉无人机演讲
草履虫都能学会!十天学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等十大深度学习神经网络!学不会你来打我!人工智能/pytorch
十分钟编写大模型应用:完结篇(代码地址和学习资源)
十分钟强化学习系列第七讲:从Q表到神经网络
十分钟编写大模型应用7:AI自动分析Excel数据
基于MADDPG的多无人机目标合围
强化学习给视觉里程计自适应调参
陌生!新版Python,快如C++?
【基于深度强化学习的冠军级别无人机竞速】强化学习和模型预测控制MPC中英字幕18讲!
一个很变态......但可以光速学会人工智能基础的神奇方法!B站强推,少走99%的弯路,资深大佬花费256小时整理的2024最全面人工智能教程!
后来上了大学才知道,原来国内大学的计算机教育都已经水成这样了......
【Yao Class Seminar】关于强化学习可解释性的talk
【具身论文阅读】Diffuser: 基于diffusion的强化学习规划器
十分钟编写大模型应用系列2:代码助手
强化学习四足机器人二
十分钟编写大模型应用系列1:复刻聊天机器人
坚持Python接单,昨天580,一台电脑,方法简单,分享我的接单平台、接单技巧以及学习资源!!!
Transformer+强化学习成为双热点强强联合的发文方向