MARL Aplicado a la Supervivencia en Entornos Dinámicos
Moltrasio García, Naim
Casas Roma, Jordi, tut. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: MARL aplicat a la supervivència en entorns dinàmics
Additional title: Multi-Agent Reinforcement Learning Applied to Survival in Dynamic Environments
Date: 2025
Abstract: Actualment, l'Aprenentatge per Reforç (RL) és un dels camps de la intel·ligència artificial amb més creixement i impacte. Aquest projecte té com a objectiu desenvolupar un entorn en què s'apliqui la seva evolució cap a l'Aprenentatge per Reforç Multiagent (MARL). En aquest entorn, s'avaluaran diferents algoritmes i mètriques per determinar-ne el rendiment i l'eficàcia, a més d'analitzar l'evolució del mateix sistema a mesura que interactuen els agents en un entorn de supervivència.
Abstract: Actualmente, el Aprendizaje por Refuerzo (RL) es uno de los campos de la inteligencia artificial con mayor crecimiento e impacto. Este proyecto tiene como objetivo desarrollar un entorno en el que se aplique su evolución hacia el Aprendizaje por Refuerzo Multiagente (MARL). En este entorno, se evaluarán distintos algoritmos y métricas para determinar su rendimiento y eficacia, además de analizar la evolución del propio sistema a medida que interactúan los agentes en un entorno de supervivencia.
Abstract: Reinforcement Learning (RL) is currently one of the fastest-growing and most impactful fields in artificial intelligence. This project aims to develop an environment that applies its evolution toward Multi-Agent Reinforcement Learning (MARL). In this environment, various algorithms and metrics will be evaluated to assess their performance and effectiveness, as well as to analyze the evolution of the system itself as agents interact in a survival setting.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Castellà
Studies: Enginyeria Informàtica [2502441]
Study plan: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Subject area: Menció Computació
Subject: RL ; MARL ; Simulació ; Avaluació d'Algoritmes ; MDP ; Política ; Recompensa ; Gym ; Markov ; Agent ; Simulación ; Evaluación de Algoritmos ; Agente ; Simulation ; Algorithm Evaluation ; Policy ; Reward



12 p, 2.9 MB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2025-07-17, last modified 2025-07-22



   Favorit i Compartir