V
主页
【Insight Time】强推!悉大博士30分钟带你了解多智能体强化学习算法!
发布人
多智能体强化学习(MARL),作为结合了强化学习和多智能体学习两个领域的重要研究方向,在人工智能行业不断迭代更新的当下,有着广泛的应用。在游戏AI、自动驾驶、港口调度、智能机器人、交通控制、分布式决策、商业管理、软件开发、虚拟现实等领域,多智能体强化学习正在发挥着至关重要的作用。 本期Insight Time 前沿技术分享会,将会为大家介绍一种能够在序列化状态空间扩展的多智能体强化学习方法 ACE,帮助大家更好地探索了解 MARL领域。
打开封面
下载高清视频
观看高清视频
视频下载器
【PPO × Family】第六课:统筹多智能体
进来看看吧!零基础入门【王树森深度强化学习】完整版教程,含配套项目代码—王树森、深度强化学习、人工智能、深度学习、强化学习
【Insight Time】预训练基础模型盛行当下,决策大模型的前沿技术方案剖析——它来了!
【PPO × Family】第二课:解构复杂动作空间
2024论文最佳创新点!Swin-Unet:基于Transformer的医学图像分割实战,论文详解+源码复现,研究生必看!
【Insight Time】清华大学博士超同学带你了解机器人技能模仿学习
【Insight Time】席卷顶会投稿关键词热榜的扩散模型到底是什么来头?
深度强化学习算法carla平台实战-PPO算法
超强对话智能体 chatGPT 中的 PPO 究竟什么来头?4分钟带你快速入门强化学习的万能钥匙
单智能体规则化决策-球球球
【PPO × Family】第五课:探索时序建模
南京大学俞扬:环境模型学习—让强化学习走出游戏
【比刷剧还爽!】太完整了吧!中国科学院大学和上海交大强联合的(PyTorch+深度学习+强化学习+机器学习)课程分享!快速入门极简单——人工智能_AI_神经网络
零基础学习强化学习算法:ppo
【Insight Time】让 AI 走起来!浅谈具身智能中的导航任务
【整整300集】清华大学121个小时讲完的Transformer教程,零基础入门到精通!真的通俗易懂!(人工智能、深度学习、机器学习实战、图像处理、神经网络)
基于引力模型的规则算法-大球球病了二球球瞧
【强化学习入门到实战】这也太全了!Q-learning算法、DQN算法、PPO算法、A3C算法等强化学习核心算法一口气学完!_AI/人工智能/深度学习/强化学习
【PPO × Family】第四课:解密稀疏奖励空间
【Insight Time】ICLR 2023 论文解读之 GoBigger 多智能体强化学习环境指南
【PPO × Family】第七课:挖掘黑科技 —— 探秘调优 PPO 的七重境界
羊群加不进去?那就来加猫群叭!深度强化学习版的羊了个羊来了!
【Insight Time】邵神带来全新自动驾驶框架 ReasonNet 再次拿下第一!已被 CVPR 2023 接收
【比啃书爽!】2024最全线性回归、逻辑回归、KNN、决策树、随机森林、支持向量机、K-近邻算法、强化学习、贝叶斯算法...12大机器学习算法一口气刷完!
【PPO × Family】第三课:表征多模态观察空间
B站强推!2024公认最通俗易懂的【AI大模型】教程,24集付费课程(附资料)LLM大模型_RAG_大模型微调_多模态
比喝水还简单!2024年最详细的【大模型自学路线图】整理出来啦!迪哥手把手教你最高效的大模型学习方法,轻松搞定AIGC大模型!(大模型训练/大模型微调)
(强推)Transformer模型最通俗易懂的讲解,零基础也能听懂!看计算机大佬如何讲解Transformer原理!(人工智能、深度学习、机器学习、图像处理)
基于分层决策的球球大作战智能体实现-重铸429荣光
玩个球的贪婪之道-玩个球
火遍油管!大神把【马尔科夫链】给做成动画了!一步一步动画深入理解原理,从模型理论到核心概念 (附讲解视频+资料)-机器学习算法、马尔科夫链、随机过程
GoBigger-Explore:基于OpenDILab的多智能体决策智能设计方案分享-OpenDILab算法研究员杨振杰
【Insight Time】图神经网络和金融反欺诈的“绝妙碰撞”
比刷剧还爽!一口气学完深度强化学习零基础入门视频教程全套课程!PPO算法/DQN算法/A3C (人工智能、深度学习、机器学习、神经网络、图像处理、AI)
【Insight Time】InterFuser凭什么拿到了世界第一?Shawn带你了解背后的技术思路
2024最新模型Mamba详解,mamba模型及其公式推导及其论文速读,你要的全都有!不愧是火爆的MAMBA,简直太好用了!-北京邮电大学/清华大学
跟着李沐读论文!【多模态论文串讲】这可能是目前为把多模态内容讲的最简单易懂的教程了吧!(Openai CLIP模型、对比学习、对比学习、Diffusion模型)
太全了!【五大深度学习-神经网络】一口气学完:卷积、递归、生成、强化、TransFormer五大深度神经网络!计算机博士一口气带你吃透底层原理!(人工智能)
【比刷剧还爽!】太完整了!中国科学院大学和上海交大强联合的(PyTorch+深度学习+强化学习+机器学习)课程分享!快速入门极简单——人工智能_AI_神经网络
基于深度强化学习的自动驾驶决策仿真(Highway-env)