V
主页
20只狗狗教你什么是机器学习中的强化学习(reinforcement learning)概念
发布人
20只狗狗教你什么是机器学习中的强化学习(reinforcement learning)概念:给予正确的路径以奖励(食物),给予错误的路径以惩罚(饿肚子/摔跤),这与人类社会中的经济行为类似——正确时给予经济/社会名誉/地位等奖励作为正反馈,错误的行为被法律/社会道德所谴责作为负反馈,社会中此具体的奖励函数的与社会文化/道德体系/文化系统/法律制度设计相关。
打开封面
下载高清视频
观看高清视频
视频下载器
强化学习轴孔装配
吹爆!这绝对是同济大学最出名的AI Agent系列课程了,零基础阶段必备的前沿AI技术,还不会打造专属大模型智能体来打我!人工智能|机器学习|深度学习|强化学习
强推!这可能是B站最全的【Python+机器学习+深度学习】系列课程了,从入门到精通,堪称人工智能系列课程的巅峰之作!_AI/人工智能/深度学习/机器学习
吹爆!这绝对是B站最系统(没有之一)的人工智能教程,Python基础、机器学习、深度学习、强化学习、计算机视觉全详解,还学不会你来打我!
【整整200集】不愧是李飞飞,一口把深度学习、计算机视觉、神经网络、图像处理、图像分割、目标检测、物体识别给讲透了,新手小白秒上手!-人工智能/计算机视觉
人生苦短,我用知识图谱!国内一流学府浙大强推的【知识图谱】教程分享!博导半天就教会了我人工智能必备知识图谱课程(附资料)! -人工智能/机器学习/深度学习
太...太强了!上海交大和腾讯强强联合打造的机器学习+深度学习+强化学习 课程分享!(人工智能/AI)
【浙大知识图谱完整版】不愧是浙大教授!5小时让我搞定了知识图谱!知识图谱/计算机视觉/神经网络
【强化学习玩游戏】简单易懂的PPO算法及公式推导!强化学习轮足机器人控制器、月球登陆器训练+超级马里奥项目实战!
强化学习在ROS2中实现巡线小车
秋招入职必刷!三小时快速上手【深度强化学习】,不愧是王树森博士,讲的实在是太通俗易懂了!
1_从零开始学习强化学习_强化学习介绍
2023一月最新AI视频生成技术范式展望和演示:来自RunwayML's GEN-1 #AI机器人和我 #神经网络 #机器学习
B站强推!Pytorch入门到精通!不愧是2024公认最通俗易懂的【PyTorch】教程(深度学习/PyTorch安装/Pytorch教程/机器学习/神经网络)
草履虫都能学会!这可能是B站最全的(Python+机器学习+深度学习)系列课程了,入门巨简单学不会你打我!机器学习/深度学习/人工智能/python学习
2_从零开始学习强化学习_MDP基础概念
不会还有人没听,这可能是B站最全的(Python+机器学习+深度学习)系列课程了,零基础入门草履虫都能学会!
Unity使用自己的强化学习算法(DQN)训练智能体——学习日记
失业在家不要怕,你就死磕这4个网站!
终于玩上了!在Isaac实现unitree H1的运动仿真
遇见G1未来已来?#人形机器人
(教材+源码)【动手学深度学习v2】看原著大佬李沐如何通俗易懂的讲解深度学习!真的建议收藏!(人工智能、深度学习、机器学习算法、计算机视觉、Pytorch)
不同神经网络本质上有区别吗?迪哥一次性带你吃透CNN、RNN、GAN、GNN、Transformer五大深度学习神经网络!原理解读+项目实战,小白秒上手!
Harsha Suryanarayana!永远滴神!几乎能解决你所有的算法&数据&代码难题!
没病走两步?!深度强化学习训练AI走路!
ALOHA模仿学习ACT真机实践——笨蛋机械臂两天才学会瓶子
反向传播登Nature!深度学习还不如浅层网络?
深度强化学习Carla实战-SAC算法(二)--SAC-Carla训练过程
上海交大张伟楠强化学习课程第3讲:马尔可夫决策过程I
四足机器人跌落姿态调整 基于强化学习的机器人控制
人形双足模仿学习强化学习AMP ASE Exbody求助
MagicAnimate实测:笑拥了/可以/但暂时没有必要/期待开源
2024年最适合新手人群的【Python基础+机器学习+深度学习+强化学习】教程,简单易懂,草履虫都能学会!!!(人工智能课程/python机器学习)
122集付费!CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络一口气全部学完!
上海交大张伟楠强化学习课程第1讲:强化学习简介II
斯坦福李飞飞终于把【计算机视觉】给讲明白了!全程16集,学不会我退出IT界!深度学习cs231n公开课【中英字幕】
AI超级进化! AI自己写代码设计的智能体, 水平碾压人类?
发论文idea来了!强化学习融合Transformer,全是创新点!
【2024高质量网红精品AI课大揭秘】打造大模型全栈技能,技术圈流量担当 LangChain+RAG+LlamaIndex+Agent+LLM