MARL Aplicado a la Supervivencia en Entornos Dinámicos

Moltrasio García, Naim

Cita bibliogràfica -- Enllaç permanent: https://ddd.uab.cat/record/317516

MARL Aplicado a la Supervivencia en Entornos Dinámicos
Moltrasio García, Naim
Casas Roma, Jordi,

tut. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant:	MARL aplicat a la supervivència en entorns dinàmics
Títol variant:	Multi-Agent Reinforcement Learning Applied to Survival in Dynamic Environments
Data:	2025
Resum:	Actualment, l'Aprenentatge per Reforç (RL) és un dels camps de la intel·ligència artificial amb més creixement i impacte. Aquest projecte té com a objectiu desenvolupar un entorn en què s'apliqui la seva evolució cap a l'Aprenentatge per Reforç Multiagent (MARL). En aquest entorn, s'avaluaran diferents algoritmes i mètriques per determinar-ne el rendiment i l'eficàcia, a més d'analitzar l'evolució del mateix sistema a mesura que interactuen els agents en un entorn de supervivència.
Resum:	Actualmente, el Aprendizaje por Refuerzo (RL) es uno de los campos de la inteligencia artificial con mayor crecimiento e impacto. Este proyecto tiene como objetivo desarrollar un entorno en el que se aplique su evolución hacia el Aprendizaje por Refuerzo Multiagente (MARL). En este entorno, se evaluarán distintos algoritmos y métricas para determinar su rendimiento y eficacia, además de analizar la evolución del propio sistema a medida que interactúan los agentes en un entorno de supervivencia.
Resum:	Reinforcement Learning (RL) is currently one of the fastest-growing and most impactful fields in artificial intelligence. This project aims to develop an environment that applies its evolution toward Multi-Agent Reinforcement Learning (MARL). In this environment, various algorithms and metrics will be evaluated to assess their performance and effectiveness, as well as to analyze the evolution of the system itself as agents interact in a survival setting.
Drets:	Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.
Llengua:	Castellà
Titulació:	Enginyeria Informàtica [2502441]
Pla d'estudis:	Enginyeria Informàtica [958]
Document:	Treball final de grau ; Text
Àrea temàtica:	Menció Computació
Matèria:	RL ; MARL ; Simulació ; Avaluació d'Algoritmes ; MDP ; Política ; Recompensa ; Gym ; Markov ; Agent ; Simulación ; Evaluación de Algoritmos ; Agente ; Simulation ; Algorithm Evaluation ; Policy ; Reward

12 p, 2.9 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

Registre creat el 2025-07-17, darrera modificació el 2025-07-22

Registres semblants

Afegeix-lo al cistell personal
Anomena i desa Citation, BibTeX, MARC, MARCXML, DC, EDM OpenAire4