V
主页
强化学习论文分享20230424
发布人
ToM2C:Target-Oriented Multi-Agent Communication and Cooperation with Theory of Mind(ICLR 2022) > 内容简介:能够预测他人的心理状态是有效社交的关键因素。对于分布式多智能体系统来说,这也是至关重要的,因为在分布式系统中,需要代理进行通信和协作。在本文中,我们引入了一种重要的社会认知技能,即心理理论(ToM),以建立能够有效沟通和合作以完成具有挑战性任务的社会智能主体。有了ToM,每个主体都能够根据其(局部)观察推断出他人的心理状态和意图。根据推断出的状态,代理人决定“何时”以及与“谁”分享他们的意图。根据观察、推断和接收到的信息,代理人决定他们的子目标,并在团队中达成共识。最后,低级执行器独立地采取原始动作来完成子目标。我们在两个典型的面向目标的多智能体任务中演示了这一思想:协同导航和多传感器目标覆盖。实验表明,所提出的模型不仅在奖励和通信效率方面优于最先进的方法,而且在不同规模的环境中表现出良好的泛化能力。 > 关键词: ToM Net, Multi-Agent, Cooperation, Communication
打开封面
下载高清视频
观看高清视频
视频下载器
当导师的课你没去上时……
强化学习,启动!
强化学习论文分享20240718-1
强化小伙终于起立了
强化学习论文分享20230522
强化学习魅力时刻
2024最有种的研究生出现了
上机试了下,效果不错的
当我消耗了太多科研经费时
北京的高中生这么强的吗?已经在发论文了
右边两足走路也是双足行走
给硕士师弟改毕业论文,师兄严厉吗
强化学习论文分享20230316
【西湖公开课】西湖博导赵世钰的强化学习免费课程来了
当你的文章被期刊撤稿后……
当师兄被裸聊平台威胁后……
强化学习论文分享2022-10-06
强化学习论文分享20240718-2
强化学习论文分享20230905
强化学习论文分享20230612
强化学习论文分享20230417
强化学习简介+DQN
强化学习论文分享20240314_2
动态规划+DDPG
强化学习论文分享2022-12-01
强化学习论文分享20230814
万圣节保留节目:雷神教授在线查论文“科技与狠活”含量
当我发了《Silence》和《Nothing》,导师的嘴脸!
强化学习论文分享20240411_2
一觉醒来业内顶刊被sci预警了,好在我水平低发不了
强化学习论文分享20240314_1
当师姐去你爸公司实习后……
强化学习论文分享2022-10-20
强化学习论文分享20230828
强化学习论文分享2023-04-03
g1套humanoid_gym
还得是知网,开题报告信手拈来
数学黄金一代刘若川,离院士之路还有多远?
强化学习论文分享20240711
强化学习论文分享20230719