V
主页
强化学习概念引入
发布人
这个视频介绍了强化学习的一些基本问题,包括强化学习的八个基本要素、马尔可夫性质在强化学习中的运用、贝尔曼方程的推导等。本视频主要的参考是刘建平的博客,博客的书写和推导相当详细,对于初学者非常友好,值得一看。
打开封面
下载高清视频
观看高清视频
视频下载器
Deep Q-learning深度强化学习
基于安全区域强化学习的狭窄空间阿克曼机器人自探索
【Python学习】张雪峰:给所有python人一个忠告!其实普通人学python玩的就是信息差!!
强推!这绝对是B站最全的(python+机器学习+深度学习)系列教程,草履虫都能学会,学不会你来锤爆我!人工智能/机器学习/深度学习/python/神经网络
动态规划、蒙特卡洛法求解强化学习问题
issacgym 训练400次的效果 强化学习 人形
梯度下降和反向传播
强推!2024年最适合初学者入门学习的《机器学习+深度学习+强化学习》上海交大和腾讯强强联合打造!太全面了!
AI芯片由AI设计真形成闭环了强化学习驱动芯片设计
不愧是李宏毅老师讲的【强化学习】简直太详细了!全程干货,通俗易懂,看完就跑通!(人工智能|机器学习|深度学习|强化学习)
强化学习,启动!
教了60年python从来没有见过这么奇葩学员。
我妈妈非要我教他python去除安卓垃圾广告。
举个栗子:基于BP网络的时间序列预测
【Python游戏】教你用20行Python代码,制作一个马里奥游戏,好玩到停不下来!!
通俗理解大模型从预训练到微调实战!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习
时序差分法、SARSA法求解强化学习问题
沼泽小狗 机器狗 Ghost V60
斯坦福大学《强化学习|Stanford CS234 Reinforcement Learning 2024》deepseek翻译
Go2翻车视频
动画讲解深度强化学习(RL、Q-网络、策略优化、大模型算法入门教程)
我教你python不是让你刷QQ会员改成2099年到期啊
RLChina 2024 | 3小时强化学习入门课程-上
后来上了大学才知道,原来国内大学的计算机教育都已经水成这样了......
【大麦网抢票】Python自动购票脚本,准点原价购买演唱会门票,拒绝黄牛从我做起!(附源码)
【Yao Class Seminar】关于强化学习可解释性的talk
直观理解大模型预训练和微调!四大LLM微调方法,RLHF基于人类反馈的强化学习微调
Diffusion Policy 结合 PPO 模仿+强化 (下)
学了Python才知道的残忍真相,句句扎心!遗憾的是我知道的太晚了...
(附源码)Python爱心代码,轻松简单易上手,给你的男/女朋友绘制一个吧!这还不把他/她给哭洗!
TITA强化学习迁移
右边两足走路也是双足行走
人工智能需要哪些高级的数学知识?
【2024汽车年会】大数据和人工智能:从系统辨识到AI建模 从最优控制到强化学习
这应该是你能找到的讲解最系统全面的【强化学习】教程!北大出身王树森教授从零到一保姆式教学,小白也能很好懂!
举个栗子:Pytorch实现的DQN,随机环境
微软官宣「GitHub Spark」 编程进入自然语言时代|Copilot继续变强
当你遇到了一个屎山代码后……
加班最严重的5个公务员单位
大龄程序员学习ai开发第9天,每当看到每周读一本的朋友圈,一点不用焦虑,真正的学习确实很慢