用游戏揭秘人工智能原理（6）— Q-Learning - 视频下载 Video Downloader

用游戏揭秘人工智能原理（6）— Q-Learning

发布人

打开封面下载高清视频观看高清视频视频下载器

用游戏揭秘人工智能原理（1）—马尔科夫链

用游戏揭秘人工智能原理（3）— 蒙特卡罗法

用游戏揭秘人工智能原理（2）— 强化学习中Q和V的概念

用游戏揭秘人工智能原理（7）—策略梯度

用游戏揭秘人工智能原理（9）—DQN

农夫过河人工智能经典问题

用游戏揭秘人工智能原理（4）— 时序差分算法TD

用游戏揭秘人工智能原理（5）— Qlearning(上)，Qlearning的想法

用游戏揭秘人工智能原理（8）—演员评论家算法

用游戏揭秘人工智能原理（12）—DDPG

用游戏揭秘人工智能原理（13）—DDPG 人工智能学走路

用人工智能模拟种群进化

不愧是顶会收割机！迪哥精讲强化学习4大主流算法：PPO、Q-learning、DQN、A3C 50集入门到精通！

AI玩功夫用游戏揭秘人工智能（十一）强化学习案例

如何找出所有点间的最短路径

用遗传算法挑战flappybird的极限操作

如何找出所有点间的最短路径4

L-SYSTEM，算法生成游戏元素

通过观察鸟群觅食行为发展起来的算法，用来找出所有点间的最短路径

Lec8-1: Mujoco Tutorial- 仿真原理，核心模块，与机器人仿真器

如何找出所有点间的最短路径2

AI解锁奥数题

强推！这绝对是B站最全的（python＋机器学习＋深度学习）系列教程，草履虫都能学会，学不会你来锤爆我！人工智能/机器学习/深度学习/python/神经网络

复现human2humanoid

使用ROS2-Control + RL来控制四足机器人

AI玩世界上最难的游戏资源不够，努力来补

AI玩功夫用游戏揭秘人工智能（十）强化学习案例

直观理解大模型预训练和微调！四大LLM微调方法，RLHF基于人类反馈的强化学习微调

我居然半天就学会了强化学习！华理计算机博士45集精讲，带你一次吃透PPO、Q-learning、DQN、A3C算法原理与实战

人工智能学走路

AI合作完成世界上最难的游戏，结果美丽，训练不易，耗时3天，15台次电脑只通关3次

AI玩赛车游戏2 自动驾驶

AI用决策树学习人类经验玩游戏

强推！2024年最适合初学者入门学习的《机器学习+深度学习+强化学习》上海交大和腾讯强强联合打造！太全面了！

具身智能机械臂实操入门课程-04（完）：模型推理和抓取效果验证

【共享LLM前沿】直观理解大模型预训练和微调！P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习微调，代码讲解

6个智能体的编队导航与避障_补充实验

【Actuate 2024】中文字幕｜机器人基础模型 - Robotic Foundation Models｜Sergey Levine

AI玩i wanna2，AI找出游戏漏洞通关

【真机演示】CrossDex：跨具身抓取，用一个策略控制任意的灵巧手