V
主页
【让AI学会自己玩游戏】3小时居然就学会了强化学习DQN算法实战(人工智能/计算机视觉/TensorFlow/无监督学习/深度强化学习/DQN)
发布人
配套资料+2022年保姆级入门到实战人工智能资料包免费获取 加威:gupao110 还有CV+NLP+pytorch+深度学习资料+论文/学习/就业指导+竞赛
打开封面
下载高清视频
观看高清视频
视频下载器
这是B站目前讲的最好的【强化学习实战】教程!带你从零详解PPO算法/DQN算法/A3C算法教程!
【强化学习玩游戏】简单易懂的PPO算法及公式推导!强化学习轮足机器人控制器、月球登陆器训练+超级马里奥项目实战!
122集付费!CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络一口气全部学完!
独家视频解读:【北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式】
我愿称李宏毅强化学习为天花板课程!简单易懂!清晰明了的 PPO算法强化学习入门教程!深度强化学习、人工智能、神经网络
如何直观理解PPO算法?博士详解近端策略优化算法原理+公式推导+训练实例!强化学习、深度强化学习、李宏毅
通俗易懂!一口气学完人工智能入门到精通:机器学习+深度学习+强化学习,课程涵盖所有基础知识及项目实战,三位计算机大佬倾囊相授!
error0: 从零开始的五虎棋AI开发
【2021全新】b站最新Tensorflow2.0的实战教程,-人工智能-基础到实战演练完整版-深度学习
Unity使用自己的强化学习算法(DQN)训练智能体——学习日记
豆瓣评分9.9!吹爆这位大神将机器学习实战讲的如此透彻!技能树直接点亮(MNIST手写字体识别/人工智能/tensorflow/NLP/深度学习/)
强推!不愧是李宏毅教授!一口气把机器学习、深度学习、强化学习、神经网络、生成式AI给讲透了!存下吧,真的比啃书好多了!(AI人工智能/ChatGPT)
RL vs MPC,LeCun:MPC,胜!我不看好强化学习
上海交大张伟楠强化学习课程第10讲:深度强化学习策略方法I
秋招入职必刷!三小时快速上手【深度强化学习】,不愧是王树森博士,讲的实在是太通俗易懂了!
强烈推荐!这可能是B站最全的【Python+机器学习+深度学习】全套教程!超爽机器学习入门到精通!数学、图像识别、神经网络、强化学习、机器翻译
吹爆!这绝对是B站最系统(没有之一)的人工智能教程,Python基础、机器学习、深度学习、强化学习、计算机视觉全详解,还学不会你来打我!
【B站最全TensorFlow2.0】好家伙!新加坡国立大学研究员带我快速搞定了深度学习与TensorFlow2入门实战-人工智能/CNN/RNN/GAN
2_从零开始学习强化学习_MDP基础概念
2022最新人体姿态识别教程,手把手教会学渣(高级计算机视觉及Python课程)
【深度强化学习】作者华盛顿大学Steve Brunton教授精讲《数据驱动的科学与工程:机器学习、动态系统与控制》流体动力学、SVD、神经网络
【深度强化学习 CS285 2023】伯克利—中英字幕
上海交大张伟楠强化学习课程第16讲:基于扩散模型的强化学习
深度强化学习Carla实战-SAC算法(二)--SAC-Carla训练过程
【无人驾驶技术】博士2小时手把后手教你搞定基于深度学习的车道线检测算法论文解读+源码复现!人工智能AI/自动驾驶
【不愧是顶尖大佬,技能直接拉满】带你逐字阅读AI经典论文|100篇最重要的人工智能论文-图像分类/监督学习/强化学习/迁移学习
1_从零开始学习强化学习_强化学习介绍
深度强化学习 PPO 纯白板逐行代码Python实现
计算机博士用八小时教会我【深度学习经典算法解析】神经网络-CNN/RNN/LSTM从入门到实战(深度学习入门/深度学习实战)
上海交大张伟楠强化学习课程第9讲:深度强化学习价值方法II
(精品课推荐!)唐宇迪解说NLP自然语言处理通用框架BERT项目实战!必备基础知识之word2ve、TensorFlow、RNN网络框架、医学糖尿病数据识别
深度学习和机器视觉基础教程-适合零基础入手
我竟然10小时就学会了大学四年没学会的【深度学习神经网络算法】全套教程已更完!多亏了这个教程,卷死同学(人工智能/深度学习入门/CNN/GAN)
ENVI遥感图像处理实战:基于LeNet-5、AlexNet、VGGNet、GoogLeNet、ResNet实现遥感图像分类实战!深度学习/激光雷达/几何校正
【从入门到精通】Pandas数据分析从入门到实战-Python数据科学必备工具包实战-大数据处理技巧
从入门到精通!B站讲的最好最全的OpenCV图像处理全套课程分享(深度学习、计算机视觉、神经网络、图像平滑。梯度运算、课程全套资料
从模型预测控制到强化学习-11:确定性策略梯度DPG与随机策略梯度SPG,从控制的角度理解(D)DPG, A2C, QAC, REINFORCE
上海交大张伟楠强化学习课程第12讲:模仿学习I
访谈《人类简史》尤瓦尔·赫拉利:阔别六年重磅力作《智人之上:AI简史》,帮你从大历史视角看待AI对我们的巨大影响
大语言模型中的token是什么?