V
主页
用游戏揭秘人工智能原理(6)— Q-Learning
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
用游戏揭秘人工智能原理(1)—马尔科夫链
用游戏揭秘人工智能原理(3)— 蒙特卡罗法
用游戏揭秘人工智能原理(2)— 强化学习中Q和V的概念
用游戏揭秘人工智能原理(7)—策略梯度
用游戏揭秘人工智能原理(9)—DQN
农夫过河 人工智能经典问题
用游戏揭秘人工智能原理(4)— 时序差分算法TD
用游戏揭秘人工智能原理(5)— Qlearning(上),Qlearning的想法
用游戏揭秘人工智能原理(8)—演员评论家算法
用游戏揭秘人工智能原理(12)—DDPG
用游戏揭秘人工智能原理(13)—DDPG 人工智能学走路
用人工智能模拟种群进化
不愧是顶会收割机!迪哥精讲强化学习4大主流算法:PPO、Q-learning、DQN、A3C 50集入门到精通!
AI玩功夫 用游戏揭秘人工智能(十一) 强化学习案例
如何找出所有点间的最短路径
用遗传算法挑战flappybird的极限操作
如何找出所有点间的最短路径4
L-SYSTEM,算法生成游戏元素
通过观察鸟群觅食行为发展起来的算法,用来找出所有点间的最短路径
Lec8-1: Mujoco Tutorial- 仿真原理,核心模块,与机器人仿真器
如何找出所有点间的最短路径2
AI解锁奥数题
强推!这绝对是B站最全的(python+机器学习+深度学习)系列教程,草履虫都能学会,学不会你来锤爆我!人工智能/机器学习/深度学习/python/神经网络
复现human2humanoid
使用ROS2-Control + RL来控制四足机器人
AI玩世界上最难的游戏 资源不够,努力来补
AI玩功夫 用游戏揭秘人工智能(十) 强化学习案例
直观理解大模型预训练和微调!四大LLM微调方法,RLHF基于人类反馈的强化学习微调
我居然半天就学会了强化学习!华理计算机博士45集精讲,带你一次吃透PPO、Q-learning、DQN、A3C算法原理与实战
人工智能学走路
AI合作完成世界上最难的游戏,结果美丽,训练不易,耗时3天,15台次电脑只通关3次
AI玩赛车游戏2 自动驾驶
AI用决策树学习人类经验玩游戏
强推!2024年最适合初学者入门学习的《机器学习+深度学习+强化学习》上海交大和腾讯强强联合打造!太全面了!
具身智能机械臂实操入门课程-04(完):模型推理和抓取效果验证
【共享LLM前沿】直观理解大模型预训练和微调!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习微调,代码讲解
6个智能体的编队导航与避障_补充实验
【Actuate 2024】中文字幕|机器人基础模型 - Robotic Foundation Models|Sergey Levine
AI玩i wanna2,AI找出游戏漏洞通关
【真机演示】CrossDex:跨具身抓取,用一个策略控制任意的灵巧手