Generació procedural de contingut via Reinforcement Learning
Graupera Serra, Oriol
Hernandez-Sabaté, Aura, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: Procedural Content Generation via Reinforcement Learning
Additional title: Generacion procedimental de contenido via Reinforcement Learning
Date: 2022
Abstract: L'objectiu d'aquest projecte és la creació de nivells per al joc de puzles Sokoban mitjançant Reinforcement Learning com a mètode de generació procedural de contingut. Per usar Reinforcement Learning, s'ha representat la generació de nivells com una tasca iterativa on, a cada iteració i mitjançant un sistema de recompenses, es modifica el tauler del joc per obtenir un nivell que tingui una solució. Al llarg del desenvolupament d'aquest treball s'han estudiat diverses estratègies i configuracions en els diferents mòduls del projecte per assolir un sistema capaç de generar nivells de manera estable. Per comprovar la dificultat dels nivells que es creen també s'ha desenvolupat un sistema de validació de la dificultat que relaciona informació extreta del nivell amb un conjunt de nivells etiquetats per dificultat. Els resultats del projecte mostren que el sistema és capaç de generar nivells de manera estable.
Abstract: The aim of this project is to create levels for the puzzle game Sokoban with Reinforcement learning as a Procedural Content Generation method. In order to use Reinforcement Learning, the level generation has been represented as an iterative task where in each step and with a reward system, the Sokoban board is modified to reach a solvable level. During the development of this project, different strategies and configurations have been studied to create Sokoban levels stably. To validate the difficulty of the levels created, a difficulty validation system has been developed, it relates information about the generated levels with a difficulty-labeled dataset of Sokoban levels. The results of the project show that the system is capable of generating solvable levels in a stable way.
Abstract: El objetivo de este proyecto es crear niveles para el juego de puzzles Sokoban mediante Reinforcement Learning como método de generación procedimental de contenido . Para utilizar Reinforcement Learning, la generación de niveles se ha representado como una tarea iterativa donde en cada iteración y con un sistema de recompensas, se modifica el tablero del juego para alcanzar un nivel solucionable. Durante el desarrollo de este proyecto se han estudiado diferentes estrategias y configuraciones en los distintos módulos para conseguir un sistema capaz de producir niveles consistentemente. Para validar la dificultad de los niveles creados, se ha desarrollado un sistema de validación de la dificultad que relaciona información sobre los niveles generados con un conjunto de datos etiquetados con la dificultad. Los resultados del proyecto muestran que el sistema es capaz de generar niveles solucionables de manera estable.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Català
Studies: Grau en Enginyeria Informàtica [2502441]
Study plan: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Subject area: Menció Computació
Subject: Generació Procedural de Contingut (PCG) ; Reinforcement Learning (RL) ; Deep Learning ; Generacion Procedimental de Contenido (PCG) ; Procedural content Generation (PCG)



11 p, 722.1 KB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2022-07-21, last modified 2023-07-22



   Favorit i Compartir