V
主页
37.多智能体强化学习
发布人
https://www.boyuai.com/elites/course/xVqhU42F5IDky94x
打开封面
下载高清视频
观看高清视频
视频下载器
零基础学习强化学习算法:ppo
1.强化学习简介
38多智能体强化学习入门
【强化学习入门到实战】这也太全了!Q-learning算法、DQN算法、PPO算法、A3C算法等强化学习核心算法一口气学完!_AI/人工智能/深度学习/强化学习
12大模型全栈-强化学习05-RLHF实战-端到端全流程解决方案-轩辕大模型强化学习完整流程介绍(数据+奖励模型+强化学习调参经验)
强烈推荐!一套课程解决人工智能入门三步走:机器学习、深度学习、强化学习,真正适合小白自学的神级教程!
【科普报告视频分享】西安交通大学兰旭光教授:基于视觉推理与学习的机器人自主作业
机器人强化学习 DDPG-6DOF-Lift
28.最大熵强化学习:soft Q-learning & Soft Actor Critic
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
太全了!2024李宏毅AI人工智能教程合集!一口气带你刷完机器学习、深度学习、强化学习、神经网络和自然语言处理!真的比盲目自学好多了!
11大模型全栈-强化学习04-RLHF实战-deepspeed-chat实战
39.多智能体强化学习进阶
40.离线强化学习
进来看看吧!零基础入门【王树森深度强化学习】完整版教程,含配套项目代码—王树森、深度强化学习、人工智能、深度学习、强化学习
同济大佬倾力打造!三小时带你掌握【强化学习】基础原理及环境配置搭建,小白也能轻松掌握的通俗课程!
基于QT的可视化路由训练平台+DQN强化学习(七剑学院QT项目,开发中)
强推!我居然只花了1小时就学会了【优化算法】遗传算法、蚁群算法、模拟退火算法、粒子群优化算法一次吃透!真的太简单易懂了!(人工智能、神经网络、机器学习)
25.PPO
基于强化学习的机器人轴孔装配仿真
15大模型全栈-强化学习08-DPO变体:IPO、KTO:无需偏好数据实现对齐
10大模型全栈-强化学习03-RLHF原理以及流程介绍
机器智能硕士【几何深度学习】课程!将几何先验知识融入深度学习模型!物理、强化学习、transformer、图神经网络、数学
论文精读:基于可解释强化学习的投资组合策略
10.时序差分学习
发论文idea来了,强化学习+Transformer 29个创新点汇总! 再也不用担心发论文了
最详细KAN环境搭建+代码复现,样例复现、拟合函数,草覆虫也能听懂!全新神经网络架构,真的让人醍醐灌顶!
31.逆强化学习
4.基于动态规划的强化学习
不愧是王树森老师讲的【深度强化学习】,零基础入门到实战完整版教程!—DRL、深度强化学习、强化学习、王树森、计算机技术
动画解析神经网络为什么可以学习?看计算机大佬如何通俗易懂的讲解神经网络底层逻辑原理!带你入门到实战!——(人工智能、深度学习、机器学习、机器学习算法、AI)
36.目标导向的强化学习
全网最通俗易懂,大模型偏好对齐RLHF从PPO推导DPO再推导simPO
21.深度强化学习
12.Q学习算法及其收敛性
太牛了!颠覆传统【深度强化学习】,被应用于多个经典强化学习算法中的异步强化学习方法究竟有何跨时代意义?一篇论文解析告诉你!!!
29.模仿学习
2.探索与利用
2024智源大会 特邀报告 Reinforcement Learning with Large Datasets
为什么说强化学习在近年不会被广泛应用?