欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033
微信:paperwinner
工作时间:9:00-24:00
机械论文
当前位置:首页 > 机械论文
基于LLM的多智能体系统调查工作流程、基础设施和挑战
来源:一起赢论文网     日期:2025-04-13     浏览数:51     【 字体:

 基于LLM的多智能体系统调查工作流程、基础设施和挑战

 
追求更智能、更可信的自主系统,类似于人类社会,一直是人类的一项长期努力。利用大型语言模型 (LLM) 的卓越推理和规划能力,基于 LLM 的代理已经被提出,并在各种任务中取得了显着的成功。值得注意的是,基于 LLM 的多智能体系统 (MAS) 被认为是实现等同于或超过人类水平智能的通用人工智能的有前途的途径。在本文中,我们对这些研究进行了全面调查,对基于 LLM 的 MAS 进行了系统评价。遵循基于 LLM 的多智能体系统的工作流程,我们合成了一个包含五个关键组成部分的一般结构:轮廓、感知、自我行动、相互交互和进化。这个统一的框架封装了该领域之前的大部分工作。此外,我们还阐明了基于 LLM 的 MAS 在两个主要领域的广泛应用:问题解决和世界模拟。最后,我们详细讨论了几个当代挑战,并提供了对该领域潜在未来方向的见解。
 
其他人正在查看类似内容
 
多智能体系统:未来计划
章节 © 2022
 
第 15 届多智能体编程竞赛
章节 © 2021
 
在 Jason 和 CArtAgO 中设计多智能体系统
报道 01 六月 2018
探索相关主题
发现来自相关学科顶级研究人员的最新文章、新闻和故事。
人工智能
1 介绍
长期以来,提高自主智能系统的可靠性和智能性一直被认为是一条非常有前途的研究途径。随着代理概念的出现,代理概念是指能够感知其环境并采取行动的实体,基于代理的智能系统近年来获得了相当大的关注。从历史上看,基于 RL 的智能系统在这一领域占据主导地位,其中代理通常被分配执行简单、定义明确的作或任务,并与环境进行约束交互。然而,这种方法在适应性和复杂性方面存在固有的局限性,促使人们探索更先进和交互式的基于代理的系统。
 
大型语言模型 (LLM) 在推理和规划方面表现出非凡的潜力,与人类对基于 LLM 的代理的期望完全一致,这些代理能够在交互式环境中感知周围环境、做出决策和采取行动。受此激励,基于 LLM 的代理在与复杂环境交互和解决各种应用程序中的复杂任务方面取得了重大进展 [1],类似于人类社会生活。值得注意的是,基于 LLM 的多智能体系统已被提议作为利用集体智能的关键途径,同时保留单个智能体的专业特性,从而向更复杂的自主智能系统发展。具体来说,多个被赋予不同身份的专业代理参与沟通和协作以实现任务目标。这个过程强调了代理间沟通的重要性,利用知识和经验进行推理以产生决策,以及在交互式环境中进化(反思其行动和行为以实现个人成长)。因此,越来越多的研究采用基于LLM的多智能体系统来处理各种复杂的任务,如工业工程[2,3,4]、科学实验[5,6,7]、具身智能体[8,9,10]、游戏[11,12,13]和社会模拟[14,15,16].然而,以前的工作都是独立执行的,缺乏对基于 LLM 的多智能体系统的框架结构的系统和全面的综合。需要明确系统的构建,整理各模块的应用方法,总结多样化的应用场景,并识别该领域存在的挑战和机遇。这构成了我们论文的核心,我们根据基于 LLM 的多智能体系统的工作流程清楚地阐明了我们的工作。
 
在本文中,我们对基于 LLM 的多智能体系统领域进行了全面而系统的调查。具体来说,遵循基于 LLM 的多智能体系统的工作流程,我们围绕三个关键方面组织我们的调查:该领域的构建、应用和讨论。在系统构建方面,我们引入了一个统一的智能体框架,包括五个基本模块:(1) 画像:在 Sect 中如何创建智能体并赋予其个性化特征。3.1;(2) 感知:主体如何感知环境信息以获取 Sect.3.2;(3) 自我行动:代理如何利用记忆机制来存储信息,以及他们如何执行推理和计划以执行 Sect 中的复杂任务。3.3;(4) 相互交互:代理在 Sect.3.4;(5) 进化:代理人如何实现自我反省,以逐步提高他们在 Sect.3.5. 此外,我们系统地概述了基于 LLM 的多智能体系统在两个主要领域的各种应用:问题解决和世界模拟。最后,我们解决了基于 LLM 的多智能体系统面临的几个挑战,并提供了对该领域潜在未来方向的见解。整体框架如图 1 所示。1.
 
图 1
图 1
一般多代理系统概述。通常,在多代理系统中,初始步骤涉及创建配置文件,为每个代理提供个性化特征和子任务分配。智能体根据任务规划,制定具体的计划,从交互环境中感知多模态信息,获取外部知识,并从记忆中检索自己的历史经验和知识。利用 LLM 的深厚能力,代理人能够制定具体的行动计划。同时,代理参与进化,这涉及对他们的决定和行动的持续反思。在整个过程中,任务的执行依赖于代理之间的交互,这些交互共同有助于整个任务的规划和实施
 
全尺寸图像
总之,本文为基于 LLM 的多代理系统这一新兴领域的现有研究建立了一个全面而详细的认知框架。我们的重点集中在基于 LLM 的多智能体系统的工作流程上,包括智能体创建、感知、自我行动、相互交互和进化的顺序步骤。借鉴广泛的先前研究,我们系统地对基于 LLM 的多代理系统面临的各种应用和挑战进行分类。我们预计我们的调查将成为该领域初学者的基础而全面的指南,让读者对基于 LLM 的多代理系统 (LLM-MAS) 有透彻的了解。读者将深入了解建立基于 LLM 的多智能体系统所必需的基本模块,并熟悉这个动态领域的最新研究趋势和应用。我们认识到该领域处于起步阶段,并随着创新方法和应用而迅速发展,我们预计我们的调查将激发该领域的进一步探索和创新,以及跨学科领域的新研究。
 
阿拉伯数字 背景
2.1 单个代理
单代理系统由单个基于 LLM 的智能代理组成,能够独立感知其环境并做出决策。单代理系统的设计旨在执行特定任务,从简单的自动化到复杂的决策。单主体系统的核心在于主体的个体特征、感知能力和自我行动能力[17,18,19,20]。从个体特征的角度来看,单个代理被赋予了一组独特的属性和功能,这些属性和功能定义了它在环境中的行为模式和角色。这些属性可能包括代理的目标、知识、技能以及与其他代理的交互模式。感知方面涉及代理如何通过其感觉系统理解和解释外部世界,这通常包括接收和处理来自传感器或其他数据源的信息,以形成对环境的理解。最后,自我行动是指代理者根据其感知和内部状态做出决策和执行行动的能力,这些行动旨在实现其目标或响应环境变化。这三个方面共同构成了单个代理的基本框架,使其能够在特定任务或环境中独立运行,并与外部世界进行有效交互。
 
单代理系统的一个显着优势在于它们的重点和效率。由于系统资源和计算能力集中在单个代理上,因此这些系统可以快速响应和执行特定任务。这种集中式处理减少了在多个代理之间分配资源的需求,从而提高了整体效率。此外,与多智能体系统相比,单智能体系统的设计和维护更加简单明了。它们不需要复杂的通信和协调机制,从而降低了系统复杂性并简化了故障排除和性能优化过程。
 
2.2 元多代理
尽管单代理系统在特定任务中表现出色,但在处理需要广泛协作和集体智慧的复杂问题时,它们可能会遇到限制。这就是多智能体系统 (MAS) 发挥作用的地方。MAS 是一个由多个交互智能体组成的复杂系统 [21],能够模拟现实世界中的社交互动和团队合作,通过分散的决策过程和信息共享提高整体适应性和效率。
 
MAS 的核心优势在于其分布式决策和解决问题的能力。正如 [22] 所指出的,MAS 提供了一种解决分布式人工智能问题的现代方法。在 MAS 中,每个代理都拥有一定程度的自主性,能够独立感知环境并做出决策。他们还可以通过模拟现实世界的协作模式(如合作、竞争和分层组织)来与其他智能体进行交互[19,23],从而提高整体协作效率。这通常是通过集成控制理论和强化学习方法来实现的。强化学习 (RL) 作为 MAS 的核心技术,允许代理通过与环境的交互来学习最佳行为策略。在此基础上,Marllib [24] 根据四个维度区分 MARL 算法:任务模式、代理类型、学习风格和知识共享。
 
MAS 的结构决定了代理的组织和交互方式。MAS 在 [25] 中分为代理级和系统级特征。同样,在 [26] 中,根据代理异质性和通信水平的维度总结了四种不同的 MAS 原型。对于代理系统,MAS 采用不同的代理架构,包括同构和异构代理的组合;同构代理在系统中执行类似的任务,而异构代理则根据其特定能力和专业知识进行协作。这种结构设计使 MAS 能够灵活地适应不同的任务要求和环境变化,同时也促进了代理之间的互补和协同作用。关于系统架构,通信是最关键的部分。[27] 提出的四维框架强调通信协议的多样性,区分黑板和基于消息的系统,并设置从低级到高级内容的不同梯度。在 [23] 中,这项工作提出通信机制可以分为三个部分:通信范式、通信结构和通信内容。其中,通信范式是指交互方式,而通信结构分为四种类型,包括分散式、集中式、分层式或嵌套式,以适应不同的任务需求和环境条件。
 
近年来,随着 LLM 的快速发展,基于 LLM 的 MAS 开始出现。在此类系统中,代理利用 LLM 的强大功能来理解和生成自然语言,从而实现更复杂、更灵活的交互。LLM-MA 系统通过多样化的代理配置、代理交互和集体决策过程,可以处理更多动态和复杂的任务。在 [19] 中,该工作使用图形 G(V, E) 来表示多个基于 LLM 的代理之间的关系。这里,V 是节点集,\(V_{i}\) 表示基于 LLM 的代理,E 是边缘集,\(E_{ij}\) 表示基于 LLM 的代理 \(V_{i}\) 和 \(V_{j}\) 之间的消息传输和关系。还建议根据两个因素对基于 LLM 的 MAS 进行分类:多角色协调和规划类型。
 
3 基于 LLM 的多智能体工作
基于 LLM 的多智能体系统已被应用于执行各种复杂任务和下游场景。从系统工作流的角度出发,我们细致地探索了智能体的生命周期,包括它们的创建、感知、推理、行动和自我学习过程。在这种探索的推动下,本节为基于 LLM 的多智能体系统构建了一个全面的统一框架,其中包括五个关键功能模块:轮廓、感知、自我行动、相互交互和进化。表 1 从不同角度对当前工作进行了详细分析。
 
表 1 基于 LLM 的多智能体系统的代表性工作综述
全尺寸表格
对于每个子任务执行,Sect.3.1 最初生成基于 LLM 的代理,每个代理都根据任务目标具有特定的特征。The perception module in Sect.3.2 捕获基本信息以了解当前的交互式环境。具体来说,Sect.3.3 整合存储在记忆中的历史知识和经验,辅以外部知识和感知信息,利用推理、规划和泛化能力做出决策并生成计划。The mutual interaction module in Sect.3.4 促进代理之间的沟通和协作协调。The evolution module in Sect.3.5 通过在环境交互过程中的自我反思来增强代理的认知和任务处理能力。对于每个模块,我们从任务执行的工作流角度系统地组织了执行策略。以下部分将详细讨论这五个关键模块。
 
3.1 代理简介
基于 LLM 的多智能体系统通常通过承担各种角色来执行复杂的任务或模拟复杂的场景 [32, 40, 55]。这些角色的定义涉及对代理配置文件的精心制作,确保每个代理都非常适合其指定的功能。Agent 的配置文件旨在实例化具有个性化风格的独立智能实体,类似于一个人,从而使它们能够完成特定的子任务 [30, 56]。例如,在模拟学校运营的上下文中,适当的角色将包括教师、学生和校长。应精心设计相应的代理配置文件,以创建准确表示这些角色的智能代理,这些代理参与模拟的学校环境。
 
[返回]

下一篇:多模态数据的特征提取方法和步骤