V
主页
京东 11.11 红包
强化学习论文分享20240718-1
发布人
LLM-based Multi-Agent Reinforcement Learning: Current and Future Directions >内容简介: 近年来,大型语言模型(LLMs)在各类任务中展示了出色的能力,包括问答、算术问题解决和诗歌创作等。尽管关于LLM作为代理的研究表明,LLM可以应用于强化学习(RL)并取得不错的结果,但将基于LLM的RL扩展到多智能体系统(MAS)并非易事,因为许多方面,如智能体之间的协调和通信,在单智能体的RL框架中并未考虑。为了激发更多关于基于LLM的多智能体强化学习(MARL)的研究,在这封信中,我们调查了现有的基于LLM的单智能体和多智能体RL框架,并为未来的研究提供了潜在的研究方向。特别是,我们关注具有共同目标的多智能体的合作任务及其之间的通信。我们还考虑了由框架中的语言组件所支持的“人类在环”或“人类在线”情景。 > 关键词:Multi-Agent Reinforcement Learning, Language Models, Multi-Agent Systems.
打开封面
下载高清视频
观看高清视频
视频下载器
【具身论文阅读】Diffuser: 基于diffusion的强化学习规划器
强化学习论文分享20240509
强化学习论文分享20240314_2
强化学习论文分享20240725
从模型预测控制到强化学习12:DDPG做动态控制-研究生入学培训答疑
CV强化论文分享20240530
CV强化论文分享20240704
CV强化论文分享20240516
强化学习论文分享2022-10-27
强化学习论文分享20240117_1
强化学习论文分享20240131
强化学习论文分享20240808
强化学习论文分享20240719_1
CV强化论文分享-20240829-2
强化学习论文分享2022-11-03
强化学习论文分享20240314_3
CV强化论文分享20240425
CV论文分享20230713(ViLD&CoCoOP)
强化学习论文分享20230410
CV论文分享20240719
CV强化论文分享20240906-1
KAN论文分享
CoPE论文分享20240620
CV论文分享20240711
CV论文分享20240509
CV论文分享20240808
强化学习论文分享20240711
CV强化论文分享-20241012
强化学习论文分享20240801
【MPC+强化学习】四大名校教授精讲强化学习和模型预测控制18讲!Actor Critic模型预测控制、策略梯度方法
CV强化论文分享20240808
强化学习论文分享20240411_1
强化学习论文分享2022-09-29
CV强化论文分享20240711_1
强化学习论文分享20230515
强化学习论文分享20240411_2
很好的强化让我的diablo起飞
动态规划+DDPG
强化学习论文分享20230522
CV强化论文分享20240418