MindAgent: LLM Multi-Agents Collaboration Benchmark

发布人

论文简述：在这篇名为MindAgent: Emergent Gaming Interaction的论文中，作者提出了一种新的基础设施MindAgent，用于评估游戏互动中的计划和协调能力。这个基础设施利用了现有的游戏框架，以实现多智能体系统的理解、与人类玩家协作以及通过少量提示和反馈进行上下文学习。为了测试MindAgent的性能，作者设计了一个名为CUISINEWORLD的新游戏场景和相关基准。在这个游戏中，多个智能体需要协同合作以提高效率并同时玩游戏。作者还引入了一种新的自动衡量协作效率的指标CoS。最后，这个基础设施可以部署到定制版的VR版本的CUISINEWORLD中，并在现有的Minecraft游戏领域中进行适应。这篇论文的主要贡献在于提供了一个通用的计划和协调框架，以帮助理解如何通过大型语言数据集进行学习来获得这些技能。
论文链接：https://arxiv.org/pdf/2309.09971

打开封面下载高清视频观看高清视频视频下载器

MindAgent: LLM Multi-Agents Collaboration Benchmark

【LLM前沿】Agent智能体框架的优缺点是什么？大模型驱动的群体智能，AutoGPT/大模型/计算机视觉/人工智能

【173.005】多智能体系统 (Multi-Agent Systems, MASs) 编队

TEAL: Tokenize and Embed ALL for Multi-modal Large Language Models

如何自己从零搭建一个大语言模型？训练自己的LLM最佳在指南来了！数据来源、并行化处理、评估模型

ICAPS 2020 Zhang Han Multi-Agent Path Finding with Mutex Propagation

FreshLLMs: Refreshing Large Language Models with Search Engine Augmentation

【包教包会】速通AI大模型（LLM)，看这本书就够了！（附PDF）

Ensemble-Instruct: Generating Instruction-Tuning Data with a Heterogeneous Mixtu

An Image is Worth Multiple Words: Learning Object Level Concepts using Multi-Con

Anthropic：人工智能的性格应该是什么样的？

AstroLLaMA: 专业领域的天文学基础模型

【国内白嫖】7月4日最新ChatGPT4.0

SOTOPIA-$π$: Interactive Learning of Socially Intelligent Language Agents

A New Benchmark and Reverse Validation Method for Passage-level Hallucination De

Auto-Instruct: Automatic Instruction Generation and Ranking for Black-Box Langua

语言模型+三维世界:下一代AI助手来了

凯文·凯利最新预测：10年后AI训练数据将不再重要

面向结构化数据的大模型推理框架

全网近百万大学生研究生收藏！逐行解读深度学习代码的网站！

MusicAgent: An AI Agent for Music Understanding and Generation with Large Langua

验证链减少大型语言模型幻觉问题研究

终于找到了这个逐行解读代码的网站！全网近百万大学生研究生收藏！github标星超55.6k！----机器学习/深度学习/CV/NLP

ICCV 2023 通过语言引导实现持续学习

LEGO:Language Enhanced Multi-modal Grounding Model

解释性语言模型特征发现

Memory Augmented Language Models through Mixture of Word Experts

【用YOLOv8进行目标检测和跟踪】不懂代码无脑照搬也能成功，太简单了！

How Do Large Language Models Capture the Ever-changing World Knowledge? A Review

ImageBind-LLM: 多种模态指令调优

Linear Transformers with Learnable Kernel Functions are Better In-Context Models

QACHECK: A Demonstration System for Question-Guided Multi-Hop Fact-Checking

Interactive Task Planning with Language Models

逆天， 现在的AI都到这种程度了吗

大规模语言模型的Transformer架构及其批处理技术

KITAB: Evaluating LLMs on Constraint Satisfaction for Information Retrieval

我居然只花一个小时就学懂了【YOLO-World】，深度解读超级轻量级开放词汇目标检测论文！实时检测一切对象模型！！！（YOLO算法/目标检测/人工智能课程）

Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition

LLM Lies: Hallucinations are not Bugs, but Features as Adversarial Examples

Ranking LLM-Generated Loop Invariants for Program Verification

一万台规模以上的多智能体寻路：完备和最优的LaCAM*算法碾压CBS各个变种

逆天，现在的AI都到这种程度了吗