V
主页
MindAgent: LLM Multi-Agents Collaboration Benchmark
发布人
论文简述:在这篇名为MindAgent: Emergent Gaming Interaction的论文中,作者提出了一种新的基础设施MindAgent,用于评估游戏互动中的计划和协调能力。这个基础设施利用了现有的游戏框架,以实现多智能体系统的理解、与人类玩家协作以及通过少量提示和反馈进行上下文学习。为了测试MindAgent的性能,作者设计了一个名为CUISINEWORLD的新游戏场景和相关基准。在这个游戏中,多个智能体需要协同合作以提高效率并同时玩游戏。作者还引入了一种新的自动衡量协作效率的指标CoS。最后,这个基础设施可以部署到定制版的VR版本的CUISINEWORLD中,并在现有的Minecraft游戏领域中进行适应。这篇论文的主要贡献在于提供了一个通用的计划和协调框架,以帮助理解如何通过大型语言数据集进行学习来获得这些技能。 论文链接:https://arxiv.org/pdf/2309.09971
打开封面
下载高清视频
观看高清视频
视频下载器
【LLM前沿】Agent智能体框架的优缺点是什么?大模型驱动的群体智能,AutoGPT/大模型/计算机视觉/人工智能
【173.005】多智能体系统 (Multi-Agent Systems, MASs) 编队
TEAL: Tokenize and Embed ALL for Multi-modal Large Language Models
如何自己从零搭建一个大语言模型?训练自己的LLM最佳在指南来了!数据来源、并行化处理、评估模型
ICAPS 2020 Zhang Han Multi-Agent Path Finding with Mutex Propagation
FreshLLMs: Refreshing Large Language Models with Search Engine Augmentation
【包教包会】速通AI大模型(LLM),看这本书就够了!(附PDF)
Ensemble-Instruct: Generating Instruction-Tuning Data with a Heterogeneous Mixtu
An Image is Worth Multiple Words: Learning Object Level Concepts using Multi-Con
Anthropic:人工智能的性格应该是什么样的?
AstroLLaMA: 专业领域的天文学基础模型
【国内白嫖】7月4日最新ChatGPT4.0
SOTOPIA-$π$: Interactive Learning of Socially Intelligent Language Agents
A New Benchmark and Reverse Validation Method for Passage-level Hallucination De
Auto-Instruct: Automatic Instruction Generation and Ranking for Black-Box Langua
语言模型+三维世界:下一代AI助手来了
凯文·凯利最新预测:10年后AI训练数据将不再重要
面向结构化数据的大模型推理框架
全网近百万大学生研究生收藏!逐行解读深度学习代码的网站!
MusicAgent: An AI Agent for Music Understanding and Generation with Large Langua
验证链减少大型语言模型幻觉问题研究
终于找到了这个逐行解读代码的网站!全网近百万大学生研究生收藏!github标星超55.6k!----机器学习/深度学习/CV/NLP
ICCV 2023 通过语言引导实现持续学习
LEGO:Language Enhanced Multi-modal Grounding Model
解释性语言模型特征发现
Memory Augmented Language Models through Mixture of Word Experts
【用YOLOv8进行目标检测和跟踪】不懂代码无脑照搬也能成功,太简单了!
How Do Large Language Models Capture the Ever-changing World Knowledge? A Review
ImageBind-LLM: 多种模态指令调优
Linear Transformers with Learnable Kernel Functions are Better In-Context Models
QACHECK: A Demonstration System for Question-Guided Multi-Hop Fact-Checking
Interactive Task Planning with Language Models
逆天, 现在的AI都到这种程度了吗
大规模语言模型的Transformer架构及其批处理技术
KITAB: Evaluating LLMs on Constraint Satisfaction for Information Retrieval
我居然只花一个小时就学懂了【YOLO-World】,深度解读超级轻量级开放词汇目标检测论文!实时检测一切对象模型!!!(YOLO算法/目标检测/人工智能课程)
Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition
LLM Lies: Hallucinations are not Bugs, but Features as Adversarial Examples
Ranking LLM-Generated Loop Invariants for Program Verification
一万台规模以上的多智能体寻路:完备和最优的LaCAM*算法碾压CBS各个变种