十分钟强化学习系列第一讲：基本概念 - 视频下载 Video Downloader

京东 11.11 红包

十分钟强化学习系列第一讲：基本概念

发布人

用代码来理解深度强化学习领域的方方面面。从零开始编写强化学习的环境和算法，让初学者全面理解强化学习的基础知识到前沿算法。本系列讲座估计总长度十期，每期十分钟左右。但是第一期基本概念有点多，超时了。。。

打开封面下载高清视频观看高清视频视频下载器

用7年前的显卡在那跑强化学习 issacgym

这可能是我见过强化学习和模型预测控制最好的教程！四大名校教授精讲动态系统和仿真、最优控制、策略梯度方法、MPC

985华五南京大学毕业裁员后b站教高等数学，用python分析函数的极限，学弟学妹看后让我手把手教ta

编程语言恩情课文《Python爷爷用object打下类型错误》

双热点强强联合的发文方向：Transformer+强化学习！

十分钟强化学习系列第五讲：SARSA和Q-Learning

十分钟强化学习系列第十一讲：DDPG方法（本系列完结，代码上传和推荐书目）

强化学习四足机器人一

十分钟强化学习系列第八讲：Deep Q-Network

十分钟强化学习系列第二讲：策略迭代

十分钟强化学习系列第十讲：策略梯度方法

强推！北京大学王树森半天就教会了我深度强化学习，原理详解+项目实战，学不会来打我！

十分钟强化学习系列第四讲：蒙特卡罗方法

十分钟强化学习系列第六讲：Model-Based方法

十分钟强化学习系列第三讲：探索和利用

十分钟强化学习系列第九讲：DQN的三种改进思路

Python和强化学习玩转贪吃蛇AI (2)

《我的科技在你之上》

玩游戏学Python系列第一讲：Pygame基本概念

Python和强化学习玩转贪吃蛇AI (1)

Python和强化学习玩转贪吃蛇AI (3)

通俗理解大模型从预训练到微调实战！P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习

MPC+强化学习！Actor Critic模型预测控制，苏黎世大牛教授人类水平性能的自主视觉无人机演讲

草履虫都能学会！十天学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等十大深度学习神经网络！学不会你来打我！人工智能/pytorch

十分钟编写大模型应用：完结篇（代码地址和学习资源）

十分钟强化学习系列第七讲：从Q表到神经网络

十分钟编写大模型应用7：AI自动分析Excel数据

基于MADDPG的多无人机目标合围

强化学习给视觉里程计自适应调参

陌生！新版Python，快如C++？

【基于深度强化学习的冠军级别无人机竞速】强化学习和模型预测控制MPC中英字幕18讲！

一个很变态......但可以光速学会人工智能基础的神奇方法！B站强推，少走99%的弯路，资深大佬花费256小时整理的2024最全面人工智能教程！

后来上了大学才知道，原来国内大学的计算机教育都已经水成这样了......

【Yao Class Seminar】关于强化学习可解释性的talk

【具身论文阅读】Diffuser: 基于diffusion的强化学习规划器

十分钟编写大模型应用系列2：代码助手

强化学习四足机器人二

十分钟编写大模型应用系列1：复刻聊天机器人

坚持Python接单，昨天580，一台电脑，方法简单，分享我的接单平台、接单技巧以及学习资源！！！

Transformer+强化学习成为双热点强强联合的发文方向