MARL Aplicado a la Supervivencia en Entornos Dinámicos
Moltrasio García, Naim
Casas Roma, Jordi, tut. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Título variante: MARL aplicat a la supervivència en entorns dinàmics
Título variante: Multi-Agent Reinforcement Learning Applied to Survival in Dynamic Environments
Fecha: 2025
Resumen: Actualment, l'Aprenentatge per Reforç (RL) és un dels camps de la intel·ligència artificial amb més creixement i impacte. Aquest projecte té com a objectiu desenvolupar un entorn en què s'apliqui la seva evolució cap a l'Aprenentatge per Reforç Multiagent (MARL). En aquest entorn, s'avaluaran diferents algoritmes i mètriques per determinar-ne el rendiment i l'eficàcia, a més d'analitzar l'evolució del mateix sistema a mesura que interactuen els agents en un entorn de supervivència.
Resumen: Actualmente, el Aprendizaje por Refuerzo (RL) es uno de los campos de la inteligencia artificial con mayor crecimiento e impacto. Este proyecto tiene como objetivo desarrollar un entorno en el que se aplique su evolución hacia el Aprendizaje por Refuerzo Multiagente (MARL). En este entorno, se evaluarán distintos algoritmos y métricas para determinar su rendimiento y eficacia, además de analizar la evolución del propio sistema a medida que interactúan los agentes en un entorno de supervivencia.
Resumen: Reinforcement Learning (RL) is currently one of the fastest-growing and most impactful fields in artificial intelligence. This project aims to develop an environment that applies its evolution toward Multi-Agent Reinforcement Learning (MARL). In this environment, various algorithms and metrics will be evaluated to assess their performance and effectiveness, as well as to analyze the evolution of the system itself as agents interact in a survival setting.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Lengua: Castellà
Titulación: Enginyeria Informàtica [2502441]
Plan de estudios: Enginyeria Informàtica [958]
Documento: Treball final de grau ; Text
Área temática: Menció Computació
Materia: RL ; MARL ; Simulació ; Avaluació d'Algoritmes ; MDP ; Política ; Recompensa ; Gym ; Markov ; Agent ; Simulación ; Evaluación de Algoritmos ; Agente ; Simulation ; Algorithm Evaluation ; Policy ; Reward



12 p, 2.9 MB

El registro aparece en las colecciones:
Documentos de investigación > Trabajos de Fin de Grado > Escuela de Ingeniería. TFG

 Registro creado el 2025-07-17, última modificación el 2025-07-22



   Favorit i Compartir