MARL Aplicado a la Supervivencia en Entornos Dinámicos
Moltrasio García, Naim
Casas Roma, Jordi, 
tut. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Universitat Autònoma de Barcelona.
Escola d'Enginyeria
| Títol variant: |
MARL aplicat a la supervivència en entorns dinàmics |
| Títol variant: |
Multi-Agent Reinforcement Learning Applied to Survival in Dynamic Environments |
| Data: |
2025 |
| Resum: |
Actualment, l'Aprenentatge per Reforç (RL) és un dels camps de la intel·ligència artificial amb més creixement i impacte. Aquest projecte té com a objectiu desenvolupar un entorn en què s'apliqui la seva evolució cap a l'Aprenentatge per Reforç Multiagent (MARL). En aquest entorn, s'avaluaran diferents algoritmes i mètriques per determinar-ne el rendiment i l'eficàcia, a més d'analitzar l'evolució del mateix sistema a mesura que interactuen els agents en un entorn de supervivència. |
| Resum: |
Actualmente, el Aprendizaje por Refuerzo (RL) es uno de los campos de la inteligencia artificial con mayor crecimiento e impacto. Este proyecto tiene como objetivo desarrollar un entorno en el que se aplique su evolución hacia el Aprendizaje por Refuerzo Multiagente (MARL). En este entorno, se evaluarán distintos algoritmos y métricas para determinar su rendimiento y eficacia, además de analizar la evolución del propio sistema a medida que interactúan los agentes en un entorno de supervivencia. |
| Resum: |
Reinforcement Learning (RL) is currently one of the fastest-growing and most impactful fields in artificial intelligence. This project aims to develop an environment that applies its evolution toward Multi-Agent Reinforcement Learning (MARL). In this environment, various algorithms and metrics will be evaluated to assess their performance and effectiveness, as well as to analyze the evolution of the system itself as agents interact in a survival setting. |
| Drets: |
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.  |
| Llengua: |
Castellà |
| Titulació: |
Enginyeria Informàtica [2502441] |
| Pla d'estudis: |
Enginyeria Informàtica [958] |
| Document: |
Treball final de grau ; Text |
| Àrea temàtica: |
Menció Computació |
| Matèria: |
RL ;
MARL ;
Simulació ;
Avaluació d'Algoritmes ;
MDP ;
Política ;
Recompensa ;
Gym ;
Markov ;
Agent ;
Simulación ;
Evaluación de Algoritmos ;
Agente ;
Simulation ;
Algorithm Evaluation ;
Policy ;
Reward |
El registre apareix a les col·leccions:
Documents de recerca >
Treballs de Fi de Grau >
Escola d'Enginyeria. TFG
Registre creat el 2025-07-17, darrera modificació el 2025-07-22