tut. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
| Títol variant: |
Generació Autònoma i Dinàmica d'Arquitectures Multiagent Jeràrquiques mitjançant Meta-Orquestració Basada en Context |
| Títol variant: |
Autonomous and Dynamic Generation of Hierarchical Multi-Agent Architectures through Context-Based Meta-Orchestration |
| Data: |
2026 |
| Resum: |
L'avanç dels models de llenguatge extensos (LLMs) ha impulsat un canvi des de sistemes monolítics d'IA cap a arquitectures multiagent on agents especialitzats col·laboren per resoldre tasques complexes. No obstant això, els frameworks actuals com AutoGen, CrewAI o MetaGPT requereixen que els desenvolupadors defineixin manualment els rols, la composició de l'equip i les topologies de comunicació abans de l'execució, cosa que en limita l'adaptabilitat. Aquest projecte presenta AgentCreator, un sistema capaç de generar autònomament arquitectures multiagent jeràrquiques adaptades a la complexitat de les consultes entrants. El sistema implementa una jerarquia de tres nivells - Gateway Agent, Meta-Orchestrator i Agents Especialistes - que analitza cada consulta, determina els dominis d'experiència necessaris, genera dinàmicament els agents requerits i coordina la seva execució. El nucli del sistema és un Template Filling Engine basat en evidència científica que combina un 60% de codi fix en plantilles amb un 40% generat per LLM, assolint una taxa d'èxit del 94% en la generació d'agents (47 de 50 avaluats). La verificació es realitza externament mitjançant compilador Python i anàlisi de l'arbre sintàctic abstracte, evitant l'autocorrecció del LLM. AgentCreator integra tres protocols estàndard de comunicació entre agents: A2A (Google, JSON-RPC 2. 0), MCP (Anthropic, STDIO) i ACP (IBM, REST+SSE), demostrant interoperabilitat en l'ecosistema emergent de protocols de 2025. El sistema inclou un frontend amb React Flow per a la visualització en temps real de les jerarquies d'agents mitjançant 54 tipus d'esdeveniments WebSocket. Els resultats experimentals, obtinguts amb Qwen Max com a model base pel seu baix cost, mostren temps de resposta des de ~5 segons per a consultes simples fins a 5-12 minuts per a orquestracions complexes amb 13 agents. En un benchmark comparatiu contra cinc LLMs de referència (GPT-4o, Claude 3. 5 Sonnet, Gemini 2. 0 Flash, Llama 3. 1 405B, Qwen Max), AgentCreator va obtenir una puntuació de qualitat de 89/100, igualant o superant models individuals de gamma superior. L'arquitectura és agnòstica al model, de manera que la utilització de LLMs més capaços milloraria proporcionalment els resultats. El projecte valida la viabilitat de la generació autònoma d'arquitectures multiagent basada en context com a enfocament pràctic per a la resolució de tasques especialitzades d'IA. |
| Resum: |
The advancement of large language models (LLMs) has driven a shift from monolithic AI systems toward multi-agent architectures where specialized agents collaborate to solve complex tasks. However, current frameworks such as AutoGen, CrewAI, and MetaGPT require developers to manually define agent roles, team compositions, and communication topologies before execution, limiting their adaptability. This project presents AgentCreator, a system capable of autonomously generating hierarchical multi-agent architectures tailored to the complexity of incoming queries. The system implements a three-level hierarchy - Gateway Agent, Meta-Orchestrator, and Specialist Agents - that analyzes each query, determines the required expertise domains, dynamically generates the necessary agents, and coordinates their execution. At the core of the system lies an evidence-based Template Filling Engine that combines 60% fixed template code with 40% LLM-generated code, achieving a 94% success rate in agent generation (47 out of 50 evaluated). Verification is performed externally through Python compilation and abstract syntax tree analysis, avoiding LLM self-correction. AgentCreator integrates three standard inter-agent communication protocols: A2A (Google, JSON-RPC 2. 0), MCP (Anthropic, STDIO), and ACP (IBM, REST+SSE), demonstrating interoperability within the emerging 2025 protocol ecosystem. The system includes a React Flow frontend for real-time visualization of agent hierarchies through 54 WebSocket event types. Experimental results, obtained using Qwen Max as the base model due to its low cost, show response times ranging from ~5 seconds for simple queries to 5-12 minutes for complex orchestrations involving 13 agents. In a comparative benchmark against five reference LLMs (GPT-4o, Claude 3. 5 Sonnet, Gemini 2. 0 Flash, Llama 3. 1 405B, Qwen Max), AgentCreator scored 89/100 in quality, matching or surpassing higher-tier individual models. The architecture is model-agnostic, meaning that using more capable LLMs would proportionally improve results. The project validates the feasibility of context-based autonomous multi-agent architecture generation as a practical approach for solving specialized AI tasks. |
| Resum: |
El avance de los modelos de lenguaje extensos (LLMs) ha impulsado un cambio desde sistemas monolíticos de IA hacia arquitecturas multi-agente donde agentes especializados colaboran para resolver tareas complejas. Sin embargo, los frameworks actuales como AutoGen, CrewAI o MetaGPT requieren que los desarrolladores definan manualmente los roles, la composición del equipo y las topologías de comunicación antes de la ejecución, lo que limita su adaptabilidad. Este proyecto presenta AgentCreator, un sistema capaz de generar autónomamente arquitecturas multi-agente jerárquicas adaptadas a la complejidad de las consultas entrantes. El sistema implementa una jerarquía de tres niveles - Gateway Agent, Meta-Orchestrator y Agentes Especialistas - que analiza cada consulta, determina los dominios de experiencia necesarios, genera dinámicamente los agentes requeridos y coordina su ejecución. El núcleo del sistema es un Template Filling Engine basado en evidencia científica que combina un 60% de código fijo en plantillas con un 40% generado por LLM, alcanzando una tasa de éxito del 94% en la generación de agentes (47 de 50 evaluados). La verificación se realiza externamente mediante compilador Python y análisis del árbol sintáctico abstracto, evitando la auto-corrección del LLM. AgentCreator integra tres protocolos estándar de comunicación entre agentes: A2A (Google, JSON-RPC 2. 0), MCP (Anthropic, STDIO) y ACP (IBM, REST+SSE), demostrando interoperabilidad en el ecosistema emergente de protocolos de 2025. El sistema incluye un frontend con React Flow para la visualización en tiempo real de las jerarquías de agentes mediante 54 tipos de eventos WebSocket. Los resultados experimentales, obtenidos con Qwen Max como modelo base por su bajo coste, demuestran tiempos de respuesta desde ~5 segundos para consultas simples hasta 5-12 minutos para orquestaciones complejas con 13 agentes. En un benchmark comparativo contra cinco LLMs de referencia (GPT-4o, Claude 3. 5 Sonnet, Gemini 2. 0 Flash, Llama 3. 1 405B, Qwen Max), AgentCreator obtuvo una puntuación de calidad de 89/100, igualando o superando a modelos individuales de gama superior. La arquitectura es agnóstica al modelo, por lo que la utilización de LLMs más capaces mejoraría proporcionalmente los resultados. El proyecto valida la viabilidad de la generación autónoma de arquitecturas multi-agente basada en contexto como enfoque práctico para la resolución de tareas especializadas de IA. |
| Drets: |
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.  |
| Llengua: |
Castellà |
| Titulació: |
Enginyeria Informàtica [2502441] |
| Pla d'estudis: |
Enginyeria Informàtica [958] |
| Document: |
Treball final de grau |
| Àrea temàtica: |
Menció Computació |
| Matèria: |
Sistemes multiagent ;
Models de llenguatge extensos ;
Generació autònoma d'arquitectures ;
Meta-orquestració ;
Protocols de comunicació entre agents ;
Template Filling Engine ;
Multi-agent systems ;
Large language models ;
Autonomous architecture generation ;
Meta-orchestration ;
Inter-agent communication protocols ;
Sistemas multi-agente ;
Modelos de lenguaje extensos ;
Generación autónoma de arquitecturas ;
Meta-orquestación ;
Protocolos de comunicación entre agentes |